diff --git a/translated_images/br/problems.f7fb539ccd80608e.webp b/translated_images/br/problems.f7fb539ccd80608e.webp deleted file mode 100644 index 1eff14353..000000000 Binary files a/translated_images/br/problems.f7fb539ccd80608e.webp and /dev/null differ diff --git a/translated_images/br/pumpkin-classifier.562771f104ad5436.webp b/translated_images/br/pumpkin-classifier.562771f104ad5436.webp deleted file mode 100644 index 76343b686..000000000 Binary files a/translated_images/br/pumpkin-classifier.562771f104ad5436.webp and /dev/null differ diff --git a/translated_images/br/pumpkins_catplot_1.c55c409b71fea2ec.webp b/translated_images/br/pumpkins_catplot_1.c55c409b71fea2ec.webp deleted file mode 100644 index 96eff6827..000000000 Binary files a/translated_images/br/pumpkins_catplot_1.c55c409b71fea2ec.webp and /dev/null differ diff --git a/translated_images/br/pumpkins_catplot_2.87a354447880b388.webp b/translated_images/br/pumpkins_catplot_2.87a354447880b388.webp deleted file mode 100644 index 57c6aebb0..000000000 Binary files a/translated_images/br/pumpkins_catplot_2.87a354447880b388.webp and /dev/null differ diff --git a/translated_images/br/r_learners_sm.cd14eb3581a9f28d.webp b/translated_images/br/r_learners_sm.cd14eb3581a9f28d.webp deleted file mode 100644 index 0bbf9c459..000000000 Binary files a/translated_images/br/r_learners_sm.cd14eb3581a9f28d.webp and /dev/null differ diff --git a/translated_images/br/r_learners_sm.e25fa9c205b3a3f9.webp b/translated_images/br/r_learners_sm.e25fa9c205b3a3f9.webp deleted file mode 100644 index 74dd06590..000000000 Binary files a/translated_images/br/r_learners_sm.e25fa9c205b3a3f9.webp and /dev/null differ diff --git a/translated_images/br/r_learners_sm.e4a71b113ffbedfe.webp b/translated_images/br/r_learners_sm.e4a71b113ffbedfe.webp deleted file mode 100644 index fc808341e..000000000 Binary files a/translated_images/br/r_learners_sm.e4a71b113ffbedfe.webp and /dev/null differ diff --git a/translated_images/br/r_learners_sm.f9199f76f1e2e493.webp b/translated_images/br/r_learners_sm.f9199f76f1e2e493.webp deleted file mode 100644 index 0bbf9c459..000000000 Binary files a/translated_images/br/r_learners_sm.f9199f76f1e2e493.webp and /dev/null differ diff --git a/translated_images/br/recipes.186acfa8ed2e8f00.webp b/translated_images/br/recipes.186acfa8ed2e8f00.webp deleted file mode 100644 index 1574233d6..000000000 Binary files a/translated_images/br/recipes.186acfa8ed2e8f00.webp and /dev/null differ diff --git a/translated_images/br/recipes.9ad10d8a4056bf89.webp b/translated_images/br/recipes.9ad10d8a4056bf89.webp deleted file mode 100644 index 26a584fc9..000000000 Binary files a/translated_images/br/recipes.9ad10d8a4056bf89.webp and /dev/null differ diff --git a/translated_images/br/scaled.91897dfbaa26ca4a.webp b/translated_images/br/scaled.91897dfbaa26ca4a.webp deleted file mode 100644 index d63f2b0f7..000000000 Binary files a/translated_images/br/scaled.91897dfbaa26ca4a.webp and /dev/null differ diff --git a/translated_images/br/scaled.e35258ca5cd3d43f.webp b/translated_images/br/scaled.e35258ca5cd3d43f.webp deleted file mode 100644 index c5544baba..000000000 Binary files a/translated_images/br/scaled.e35258ca5cd3d43f.webp and /dev/null differ diff --git a/translated_images/br/scatter-dayofyear-color.65790faefbb9d54f.webp b/translated_images/br/scatter-dayofyear-color.65790faefbb9d54f.webp deleted file mode 100644 index decfaf4f2..000000000 Binary files a/translated_images/br/scatter-dayofyear-color.65790faefbb9d54f.webp and /dev/null differ diff --git a/translated_images/br/scatter-dayofyear.bc171c189c9fd553.webp b/translated_images/br/scatter-dayofyear.bc171c189c9fd553.webp deleted file mode 100644 index aec045037..000000000 Binary files a/translated_images/br/scatter-dayofyear.bc171c189c9fd553.webp and /dev/null differ diff --git a/translated_images/br/scatterplot.ad8b356bcbb33be6.webp b/translated_images/br/scatterplot.ad8b356bcbb33be6.webp deleted file mode 100644 index 49fcec47a..000000000 Binary files a/translated_images/br/scatterplot.ad8b356bcbb33be6.webp and /dev/null differ diff --git a/translated_images/br/scatterplot.b6868f44cbd2051c.webp b/translated_images/br/scatterplot.b6868f44cbd2051c.webp deleted file mode 100644 index bf0ce25bc..000000000 Binary files a/translated_images/br/scatterplot.b6868f44cbd2051c.webp and /dev/null differ diff --git a/translated_images/br/shakey.4dc17819c447c05b.webp b/translated_images/br/shakey.4dc17819c447c05b.webp deleted file mode 100644 index b42084ca1..000000000 Binary files a/translated_images/br/shakey.4dc17819c447c05b.webp and /dev/null differ diff --git a/translated_images/br/sigmoid.8b7ba9d095c789cf.webp b/translated_images/br/sigmoid.8b7ba9d095c789cf.webp deleted file mode 100644 index f513a38cc..000000000 Binary files a/translated_images/br/sigmoid.8b7ba9d095c789cf.webp and /dev/null differ diff --git a/translated_images/br/slope.f3c9d5910ddbfcf9.webp b/translated_images/br/slope.f3c9d5910ddbfcf9.webp deleted file mode 100644 index 6399cdd3a..000000000 Binary files a/translated_images/br/slope.f3c9d5910ddbfcf9.webp and /dev/null differ diff --git a/translated_images/br/solvers.5fc648618529e627.webp b/translated_images/br/solvers.5fc648618529e627.webp deleted file mode 100644 index f169cdcb0..000000000 Binary files a/translated_images/br/solvers.5fc648618529e627.webp and /dev/null differ diff --git a/translated_images/br/svm.621ae7b516d678e0.webp b/translated_images/br/svm.621ae7b516d678e0.webp deleted file mode 100644 index 02d774a2a..000000000 Binary files a/translated_images/br/svm.621ae7b516d678e0.webp and /dev/null differ diff --git a/translated_images/br/swarm.56d253ae80a2c0f5.webp b/translated_images/br/swarm.56d253ae80a2c0f5.webp deleted file mode 100644 index 752d00904..000000000 Binary files a/translated_images/br/swarm.56d253ae80a2c0f5.webp and /dev/null differ diff --git a/translated_images/br/swarm_2.efeacfca536c2b57.webp b/translated_images/br/swarm_2.efeacfca536c2b57.webp deleted file mode 100644 index c536e6e73..000000000 Binary files a/translated_images/br/swarm_2.efeacfca536c2b57.webp and /dev/null differ diff --git a/translated_images/br/test-data-predict.8afc47ee7e52874f.webp b/translated_images/br/test-data-predict.8afc47ee7e52874f.webp deleted file mode 100644 index ecdb05405..000000000 Binary files a/translated_images/br/test-data-predict.8afc47ee7e52874f.webp and /dev/null differ diff --git a/translated_images/br/thai-food.c47a7a7f9f05c218.webp b/translated_images/br/thai-food.c47a7a7f9f05c218.webp deleted file mode 100644 index 1eda3cea3..000000000 Binary files a/translated_images/br/thai-food.c47a7a7f9f05c218.webp and /dev/null differ diff --git a/translated_images/br/thai.0269dbab2e78bd38.webp b/translated_images/br/thai.0269dbab2e78bd38.webp deleted file mode 100644 index e9e7d8a79..000000000 Binary files a/translated_images/br/thai.0269dbab2e78bd38.webp and /dev/null differ diff --git a/translated_images/br/tokenization.1641a160c66cd2d9.webp b/translated_images/br/tokenization.1641a160c66cd2d9.webp deleted file mode 100644 index eb74e9e4f..000000000 Binary files a/translated_images/br/tokenization.1641a160c66cd2d9.webp and /dev/null differ diff --git a/translated_images/br/train-data-predict.3c4ef4e78553104f.webp b/translated_images/br/train-data-predict.3c4ef4e78553104f.webp deleted file mode 100644 index 9b3938d97..000000000 Binary files a/translated_images/br/train-data-predict.3c4ef4e78553104f.webp and /dev/null differ diff --git a/translated_images/br/train-test.8928d14e5b91fc94.webp b/translated_images/br/train-test.8928d14e5b91fc94.webp deleted file mode 100644 index 512f4dc5e..000000000 Binary files a/translated_images/br/train-test.8928d14e5b91fc94.webp and /dev/null differ diff --git a/translated_images/br/train-test.ead0cecbfc341921.webp b/translated_images/br/train-test.ead0cecbfc341921.webp deleted file mode 100644 index 512f4dc5e..000000000 Binary files a/translated_images/br/train-test.ead0cecbfc341921.webp and /dev/null differ diff --git a/translated_images/br/train_progress_raw.2adfdf2daea09c59.webp b/translated_images/br/train_progress_raw.2adfdf2daea09c59.webp deleted file mode 100644 index 9cb93e6e5..000000000 Binary files a/translated_images/br/train_progress_raw.2adfdf2daea09c59.webp and /dev/null differ diff --git a/translated_images/br/train_progress_runav.c71694a8fa9ab359.webp b/translated_images/br/train_progress_runav.c71694a8fa9ab359.webp deleted file mode 100644 index 46fb46ea5..000000000 Binary files a/translated_images/br/train_progress_runav.c71694a8fa9ab359.webp and /dev/null differ diff --git a/translated_images/br/turntable.f2b86b13c53302dc.webp b/translated_images/br/turntable.f2b86b13c53302dc.webp deleted file mode 100644 index 27c674f5b..000000000 Binary files a/translated_images/br/turntable.f2b86b13c53302dc.webp and /dev/null differ diff --git a/translated_images/br/ufo.9e787f5161da9d4d.webp b/translated_images/br/ufo.9e787f5161da9d4d.webp deleted file mode 100644 index 44a08cb65..000000000 Binary files a/translated_images/br/ufo.9e787f5161da9d4d.webp and /dev/null differ diff --git a/translated_images/br/unruly_data.0eedc7ced92d2d91.webp b/translated_images/br/unruly_data.0eedc7ced92d2d91.webp deleted file mode 100644 index 4963a5b62..000000000 Binary files a/translated_images/br/unruly_data.0eedc7ced92d2d91.webp and /dev/null differ diff --git a/translated_images/br/violin.ffceb68923177011.webp b/translated_images/br/violin.ffceb68923177011.webp deleted file mode 100644 index 5e5bfc849..000000000 Binary files a/translated_images/br/violin.ffceb68923177011.webp and /dev/null differ diff --git a/translated_images/br/voronoi.1dc1613fb0439b95.webp b/translated_images/br/voronoi.1dc1613fb0439b95.webp deleted file mode 100644 index 4a7d11723..000000000 Binary files a/translated_images/br/voronoi.1dc1613fb0439b95.webp and /dev/null differ diff --git a/translated_images/br/web-app.4c76450cabe20036.webp b/translated_images/br/web-app.4c76450cabe20036.webp deleted file mode 100644 index 6120fe1d7..000000000 Binary files a/translated_images/br/web-app.4c76450cabe20036.webp and /dev/null differ diff --git a/translated_images/br/wolf.a56d3d4070ca0c79.webp b/translated_images/br/wolf.a56d3d4070ca0c79.webp deleted file mode 100644 index a9f12f4bd..000000000 Binary files a/translated_images/br/wolf.a56d3d4070ca0c79.webp and /dev/null differ diff --git a/translated_images/br/.co-op-translator.json b/translated_images/pt-BR/.co-op-translator.json similarity index 88% rename from translated_images/br/.co-op-translator.json rename to translated_images/pt-BR/.co-op-translator.json index 429f17ba8..70d72e5a2 100644 --- a/translated_images/br/.co-op-translator.json +++ b/translated_images/pt-BR/.co-op-translator.json @@ -3,918 +3,918 @@ "original_hash": "2de21431c87bb9ebc9bf4ddcb3ba2bdd", "translation_date": "2026-01-16T11:14:42+00:00", "source_file": "images/3.png", - "language_code": "br" + "language_code": "pt-BR" }, "9-feature-importance.cd3193b4bba3fd4b.webp": { "original_hash": "479e68fc76c6b6fc8cbc2b90eb2981e1", "translation_date": "2026-01-16T11:29:26+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/9-feature-importance.png", - "language_code": "br" + "language_code": "pt-BR" }, "9-features-influence.3ead3d3f68a84029.webp": { "original_hash": "7a522f0212ca4c9d15c9d3d9f01f86f5", "translation_date": "2026-01-16T11:32:09+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/9-features-influence.png", - "language_code": "br" + "language_code": "pt-BR" }, "ROC.167a70519c5bf898.webp": { "original_hash": "63e5567374ae1de1cd1e775dda7c81e9", "translation_date": "2026-01-16T11:22:10+00:00", "source_file": "2-Regression/4-Logistic/images/ROC.png", - "language_code": "br" + "language_code": "pt-BR" }, "ROC_2.777f20cdfc4988ca.webp": { "original_hash": "7e020247ea2b610881d260a38315aeae", "translation_date": "2026-01-16T11:22:52+00:00", "source_file": "2-Regression/4-Logistic/images/ROC_2.png", - "language_code": "br" + "language_code": "pt-BR" }, "accessibility.c1be5ce816eaea65.webp": { "original_hash": "ff169fe805ae6b4b0067443121c4c7ce", "translation_date": "2026-01-16T11:18:05+00:00", "source_file": "1-Introduction/3-fairness/images/accessibility.png", - "language_code": "br" + "language_code": "pt-BR" }, "accountability.41d8c0f4b85b6231.webp": { "original_hash": "65e19795f4a18a0878133c71c8862c42", "translation_date": "2026-01-16T11:17:49+00:00", "source_file": "1-Introduction/3-fairness/images/accountability.png", - "language_code": "br" + "language_code": "pt-BR" }, "accuracy.2c47fe1bf15f44b3.webp": { "original_hash": "f8fcd7ea58a80666ad22914c3c992c55", "translation_date": "2026-01-16T11:37:53+00:00", "source_file": "7-TimeSeries/2-ARIMA/images/accuracy.png", - "language_code": "br" + "language_code": "pt-BR" }, "ai-ml-ds.537ea441b124ebf6.webp": { "original_hash": "22725868b26ca27e64c946ee025d45a3", "translation_date": "2026-01-16T11:17:03+00:00", "source_file": "1-Introduction/1-intro-to-ML/images/ai-ml-ds.png", - "language_code": "br" + "language_code": "pt-BR" }, "all-genres.1d56ef06cefbfcd6.webp": { "original_hash": "b65f4a4412b6559b03529f10eb450c17", "translation_date": "2026-01-16T11:27:18+00:00", "source_file": "5-Clustering/1-Visualize/images/all-genres.png", - "language_code": "br" + "language_code": "pt-BR" }, "apple.c81c8d5965e5e5da.webp": { "original_hash": "ed62bd6204e6efabc031ea19173bafb7", "translation_date": "2026-01-16T11:37:11+00:00", "source_file": "8-Reinforcement/1-QLearning/images/apple.png", - "language_code": "br" + "language_code": "pt-BR" }, "barchart.a833ea9194346d76.webp": { "original_hash": "49c21ba1929ad7ee26b6cd2fcf243929", "translation_date": "2026-01-16T11:21:23+00:00", "source_file": "2-Regression/2-Data/images/barchart.png", - "language_code": "br" + "language_code": "pt-BR" }, "bellman-equation.7c0c4c722e5a6b7c.webp": { "original_hash": "7adc065a5ea494b45531f754c9b76469", "translation_date": "2026-01-16T11:37:07+00:00", "source_file": "8-Reinforcement/1-QLearning/images/bellman-equation.png", - "language_code": "br" + "language_code": "pt-BR" }, "binary-multiclass.b56d0c86c81105a6.webp": { "original_hash": "e1a17ceb5d6b5a8bb91bae9ca474cfb5", "translation_date": "2026-01-16T11:34:10+00:00", "source_file": "4-Classification/1-Introduction/images/binary-multiclass.png", - "language_code": "br" + "language_code": "pt-BR" }, "boxplots.8228c29dabd0f292.webp": { "original_hash": "841ff52a90f91c88278604315d9cd6e5", "translation_date": "2026-01-16T11:25:53+00:00", "source_file": "5-Clustering/2-K-Means/images/boxplots.png", - "language_code": "br" + "language_code": "pt-BR" }, "calculation.a209813050a1ddb1.webp": { "original_hash": "b2131ec1d3e6db2e2abd7bc8c699dbcf", "translation_date": "2026-01-16T11:18:46+00:00", "source_file": "2-Regression/3-Linear/images/calculation.png", - "language_code": "br" + "language_code": "pt-BR" }, "cartpole.b5609cc0494a14f7.webp": { "original_hash": "5399242e127ea1c18aa6ee405daecf51", "translation_date": "2026-01-16T11:36:55+00:00", "source_file": "8-Reinforcement/2-Gym/images/cartpole.png", - "language_code": "br" + "language_code": "pt-BR" }, "centroid.097fde836cf6c918.webp": { "original_hash": "c8f866ed446563d8e59087f1bca1f97d", "translation_date": "2026-01-16T11:27:10+00:00", "source_file": "5-Clustering/1-Visualize/images/centroid.png", - "language_code": "br" + "language_code": "pt-BR" }, "ceos.3de5d092ce8d2753.webp": { "original_hash": "f403a92005c5f0c581fd27587dd69eb8", "translation_date": "2026-01-16T11:29:30+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/ceos.png", - "language_code": "br" + "language_code": "pt-BR" }, "ceos.7a9a67871424a6c0.webp": { "original_hash": "f403a92005c5f0c581fd27587dd69eb8", "translation_date": "2026-01-16T11:17:54+00:00", "source_file": "1-Introduction/3-fairness/images/ceos.png", - "language_code": "br" + "language_code": "pt-BR" }, "cf-what-if-features.5a92a6924da3e9b5.webp": { "original_hash": "0cbbda81885b2341ee63ff33aaa4fff0", "translation_date": "2026-01-16T11:32:48+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/cf-what-if-features.png", - "language_code": "br" + "language_code": "pt-BR" }, "cheatsheet.07a475ea444d2223.webp": { "original_hash": "d4728a3bd3332576e35f206ee6ad3fbb", "translation_date": "2026-01-16T11:36:53+00:00", "source_file": "4-Classification/2-Classifiers-1/images/cheatsheet.png", - "language_code": "br" + "language_code": "pt-BR" }, "chess.e704a268781bdad8.webp": { "original_hash": "5b6c7fdfb0b6262a3938b18cce2f4a2b", "translation_date": "2026-01-16T11:27:28+00:00", "source_file": "9-Real-World/images/chess.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "chinese.e62cafa5309f111a.webp": { "original_hash": "e7afddb049bc5e60e1594d3b0dd7e7c6", "translation_date": "2026-01-16T11:34:13+00:00", "source_file": "4-Classification/1-Introduction/images/chinese.png", - "language_code": "br" + "language_code": "pt-BR" }, "clusters.b635354640d8e4fd.webp": { "original_hash": "1bf916ab2a323ca1ff9524b957d191d9", "translation_date": "2026-01-16T11:24:58+00:00", "source_file": "5-Clustering/2-K-Means/images/clusters.png", - "language_code": "br" + "language_code": "pt-BR" }, "comparison.edfab56193a85e7f.webp": { "original_hash": "7f24bd09d9d7f8a13007c1028041fbf5", "translation_date": "2026-01-16T11:36:42+00:00", "source_file": "4-Classification/2-Classifiers-1/images/comparison.png", - "language_code": "br" + "language_code": "pt-BR" }, "comprehension.619708fc5959b0f6.webp": { "original_hash": "199ba9874415c9ac69ab90ca0c7a5798", "translation_date": "2026-01-16T11:24:30+00:00", "source_file": "6-NLP/1-Introduction-to-NLP/images/comprehension.png", - "language_code": "br" + "language_code": "pt-BR" }, "confusion-matrix.3cc5496a1a37c3e4.webp": { "original_hash": "4150f5e65462636d31a355fb8bacd710", "translation_date": "2026-01-16T11:22:46+00:00", "source_file": "2-Regression/4-Logistic/images/confusion-matrix.png", - "language_code": "br" + "language_code": "pt-BR" }, "correlation.a9356bb798f5eea5.webp": { "original_hash": "2defd6b5fe95facd4a781f9622902c78", "translation_date": "2026-01-16T11:26:39+00:00", "source_file": "5-Clustering/1-Visualize/images/correlation.png", - "language_code": "br" + "language_code": "pt-BR" }, "counterfactuals-examples.b38a50a504ee0a9f.webp": { "original_hash": "65fb9b98701cc42014f18aa998228333", "translation_date": "2026-01-16T11:30:22+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/counterfactuals-examples.png", - "language_code": "br" + "language_code": "pt-BR" }, "cuisine-dist.d0cc2d551abe5c25.webp": { "original_hash": "c513d1f6832ac06836e0c8c665c8354a", "translation_date": "2026-01-16T11:34:04+00:00", "source_file": "4-Classification/1-Introduction/images/cuisine-dist.png", - "language_code": "br" + "language_code": "pt-BR" }, "currency.e7429812bfc8c608.webp": { "original_hash": "b5ebb401a6bea7c0ad8fa2d3f0fa1e18", "translation_date": "2026-01-16T11:37:45+00:00", "source_file": "7-TimeSeries/1-Introduction/images/currency.png", - "language_code": "br" + "language_code": "pt-BR" }, "data-visualization.54e56dded7c1a804.webp": { "original_hash": "0978cd448f88701c82bc30537b17c1c5", "translation_date": "2026-01-16T11:21:00+00:00", "source_file": "2-Regression/2-Data/images/data-visualization.png", - "language_code": "br" + "language_code": "pt-BR" }, "dataanalysis-cover.8d6d0683a70a5c1e.webp": { "original_hash": "6d92c827e7138869509118dccd983ccd", "translation_date": "2026-01-16T11:33:11+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/dataanalysis-cover.png", - "language_code": "br" + "language_code": "pt-BR" }, "datapoints.aaf6815cd5d87354.webp": { "original_hash": "5a9527dee26b9b255cc5b624dbb51919", "translation_date": "2026-01-16T11:28:53+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/datapoints.png", - "language_code": "br" + "language_code": "pt-BR" }, "distribution.9be11df42356ca95.webp": { "original_hash": "70424f77d27ac2c69e595ea8fdd3e28e", "translation_date": "2026-01-16T11:27:00+00:00", "source_file": "5-Clustering/1-Visualize/images/distribution.png", - "language_code": "br" + "language_code": "pt-BR" }, "dplyr_filter.b480b264b03439ff.webp": { "original_hash": "e71fffc34b1e453f16d5b8e266f46aa2", "translation_date": "2026-01-16T11:34:42+00:00", "source_file": "4-Classification/1-Introduction/images/dplyr_filter.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "dplyr_wrangling.f5f99c64fd4580f1.webp": { "original_hash": "c9623f92bdbfdc2b68fcc8b8c28ec6d1", "translation_date": "2026-01-16T11:21:17+00:00", "source_file": "2-Regression/2-Data/images/dplyr_wrangling.png", - "language_code": "br" + "language_code": "pt-BR" }, "ea-error-cohort.6886209ea5d438c4.webp": { "original_hash": "95030d8832d8931fb4e1ec6ecda699e6", "translation_date": "2026-01-16T11:32:37+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/ea-error-cohort.png", - "language_code": "br" + "language_code": "pt-BR" }, "ea-error-distribution.117452e1177c1dd8.webp": { "original_hash": "15823a9cd18a5ee815e7d6262bc6818f", "translation_date": "2026-01-16T11:28:59+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/ea-error-distribution.png", - "language_code": "br" + "language_code": "pt-BR" }, "ea-heatmap.8d27185e28cee383.webp": { "original_hash": "861a9ea52a5aa2841f4dbf9ba45c7900", "translation_date": "2026-01-16T11:32:30+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/ea-heatmap.png", - "language_code": "br" + "language_code": "pt-BR" }, "elbow.72676169eed744ff.webp": { "original_hash": "bb938c301c0b3fd5deec9f8b277b0506", "translation_date": "2026-01-16T11:25:02+00:00", "source_file": "5-Clustering/2-K-Means/images/elbow.png", - "language_code": "br" + "language_code": "pt-BR" }, "electric-grid.0c21d5214db09ffa.webp": { "original_hash": "d3adac5039330761223c6e9299402b3a", "translation_date": "2026-01-16T11:37:15+00:00", "source_file": "7-TimeSeries/images/electric-grid.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "eliza.84397454cda9559b.webp": { "original_hash": "cf4cf518f649213e8970b1d08fbe6c77", "translation_date": "2026-01-16T11:17:39+00:00", "source_file": "1-Introduction/2-history-of-ML/images/eliza.png", - "language_code": "br" + "language_code": "pt-BR" }, "embedding.2cf8953c4b3101d1.webp": { "original_hash": "1007c6219e1ce7d2a51becd0596a822a", "translation_date": "2026-01-16T11:24:37+00:00", "source_file": "6-NLP/2-Tasks/images/embedding.png", - "language_code": "br" + "language_code": "pt-BR" }, "encouRage.e75d5fe0367fb913.webp": { "original_hash": "7dd96b2ba0df871e1553f743be58a0e5", "translation_date": "2026-01-16T11:20:51+00:00", "source_file": "2-Regression/1-Tools/images/encouRage.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "energy-plot.5fdac3f397a910bc.webp": { "original_hash": "ea7eb60322ee54196efdcac12d2313d5", "translation_date": "2026-01-16T11:37:40+00:00", "source_file": "7-TimeSeries/1-Introduction/images/energy-plot.png", - "language_code": "br" + "language_code": "pt-BR" }, "env_init.04e8f26d2d60089e.webp": { "original_hash": "c98e0e9c3bd656f4518dcb94c1743f5d", "translation_date": "2026-01-16T11:37:09+00:00", "source_file": "8-Reinforcement/1-QLearning/images/env_init.png", - "language_code": "br" + "language_code": "pt-BR" }, "environment.40ba3cb66256c93f.webp": { "original_hash": "3b7f633735a7af2335c024eeb9ed1160", "translation_date": "2026-01-16T11:37:08+00:00", "source_file": "8-Reinforcement/1-QLearning/images/environment.png", - "language_code": "br" + "language_code": "pt-BR" }, "escape.18862db9930337e3.webp": { "original_hash": "992ff5365e7fb990b22e1cd8e421374f", "translation_date": "2026-01-16T11:36:56+00:00", "source_file": "8-Reinforcement/2-Gym/images/escape.png", - "language_code": "br" + "language_code": "pt-BR" }, "facetgrid.9b2e65ce707eba1f.webp": { "original_hash": "8497ce8826ba4d381db1f9ed514dede2", "translation_date": "2026-01-16T11:27:24+00:00", "source_file": "5-Clustering/1-Visualize/images/facetgrid.png", - "language_code": "br" + "language_code": "pt-BR" }, "fairness.25d7c8ce9817272d.webp": { "original_hash": "89c57b68363652950bfa4b8a3cae82c1", "translation_date": "2026-01-16T11:30:31+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/fairness.png", - "language_code": "br" + "language_code": "pt-BR" }, "fairness.b9f9893a4e3dc28b.webp": { "original_hash": "89c57b68363652950bfa4b8a3cae82c1", "translation_date": "2026-01-16T11:18:02+00:00", "source_file": "1-Introduction/3-fairness/images/fairness.png", - "language_code": "br" + "language_code": "pt-BR" }, "favicon.37b561214b36d454.webp": { "original_hash": "228faa6584f8ba1f7e9a75e3200112e9", "translation_date": "2026-01-16T11:14:25+00:00", "source_file": "images/favicon.png", - "language_code": "br" + "language_code": "pt-BR" }, "flat-nonflat.d1c8c6e2a96110c1.webp": { "original_hash": "73d6fedd799f48057e154a4e8ce42f93", "translation_date": "2026-01-16T11:26:06+00:00", "source_file": "5-Clustering/1-Visualize/images/flat-nonflat.png", - "language_code": "br" + "language_code": "pt-BR" }, "full-data-predict.4f0fed16a131c8f3.webp": { "original_hash": "b9ad88a56a196b6b70ffbda06538bca4", "translation_date": "2026-01-16T11:37:36+00:00", "source_file": "7-TimeSeries/3-SVR/images/full-data-predict.png", - "language_code": "br" + "language_code": "pt-BR" }, "full-data.a82ec9957e580e97.webp": { "original_hash": "e428351ccdd1d7019ab5c486385a0cb1", "translation_date": "2026-01-16T11:37:27+00:00", "source_file": "7-TimeSeries/3-SVR/images/full-data.png", - "language_code": "br" + "language_code": "pt-BR" }, "gender-bias-translate-en-tr.bfd87c45da23c085.webp": { "original_hash": "3abc35f319aef1169941603df4db6fd0", "translation_date": "2026-01-16T11:30:27+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/gender-bias-translate-en-tr.png", - "language_code": "br" + "language_code": "pt-BR" }, "gender-bias-translate-en-tr.f185fd8822c2d437.webp": { "original_hash": "3abc35f319aef1169941603df4db6fd0", "translation_date": "2026-01-16T11:17:58+00:00", "source_file": "1-Introduction/3-fairness/images/gender-bias-translate-en-tr.png", - "language_code": "br" + "language_code": "pt-BR" }, "gender-bias-translate-tr-en.1f97568ba9e40e20.webp": { "original_hash": "0e8aac544ac1089cd727075b6083639f", "translation_date": "2026-01-16T11:28:15+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/gender-bias-translate-tr-en.png", - "language_code": "br" + "language_code": "pt-BR" }, "gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp": { "original_hash": "0e8aac544ac1089cd727075b6083639f", "translation_date": "2026-01-16T11:17:46+00:00", "source_file": "1-Introduction/3-fairness/images/gender-bias-translate-tr-en.png", - "language_code": "br" + "language_code": "pt-BR" }, "globe.59f26379ceb40428.webp": { "original_hash": "843aa34b1b65eb8ab23f8a7476b7dcd0", "translation_date": "2026-01-16T11:17:00+00:00", "source_file": "1-Introduction/images/globe.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "grid.464370ad00f3696c.webp": { "original_hash": "79d757e96813e70fbf7844b23dae96bc", "translation_date": "2026-01-16T11:22:38+00:00", "source_file": "2-Regression/4-Logistic/images/grid.png", - "language_code": "br" + "language_code": "pt-BR" }, "heatmap.39952045da50b4eb.webp": { "original_hash": "a62eb0069cc21d495828469ea2d0b506", "translation_date": "2026-01-16T11:19:45+00:00", "source_file": "2-Regression/3-Linear/images/heatmap.png", - "language_code": "br" + "language_code": "pt-BR" }, "hierarchical.bf59403aa43c8c47.webp": { "original_hash": "50b9bc3298659c463ae76564ca645b12", "translation_date": "2026-01-16T11:26:53+00:00", "source_file": "5-Clustering/1-Visualize/images/hierarchical.png", - "language_code": "br" + "language_code": "pt-BR" }, "human.e3840390a2ab7690.webp": { "original_hash": "2779edce282e49929804dec71636094e", "translation_date": "2026-01-16T11:37:05+00:00", "source_file": "8-Reinforcement/1-QLearning/images/human.png", - "language_code": "br" + "language_code": "pt-BR" }, "hype.07183d711a17aafe.webp": { "original_hash": "fdd8cab17e681e45c4fe2647eb58bdb9", "translation_date": "2026-01-16T11:17:13+00:00", "source_file": "1-Introduction/1-intro-to-ML/images/hype.png", - "language_code": "br" + "language_code": "pt-BR" }, "indian.2c4292002af1a1f9.webp": { "original_hash": "9d396f43a0af642a695b6651bff475af", "translation_date": "2026-01-16T11:34:07+00:00", "source_file": "4-Classification/1-Introduction/images/indian.png", - "language_code": "br" + "language_code": "pt-BR" }, "individual-causal-what-if.00e7b86b52a083ce.webp": { "original_hash": "535a0ad1507648542f43293e101eecb6", "translation_date": "2026-01-16T11:31:45+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/individual-causal-what-if.png", - "language_code": "br" + "language_code": "pt-BR" }, "jack-o-lanterns.181c661a9212457d.webp": { "original_hash": "3f6f70bd9fcfd9f85c229fdbbeef8a4a", "translation_date": "2026-01-16T11:18:05+00:00", "source_file": "2-Regression/images/jack-o-lanterns.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "janitor.e4a77dd3d3e6a32e.webp": { "original_hash": "8e34c6515b5a664c4485bed85ace536e", "translation_date": "2026-01-16T11:18:38+00:00", "source_file": "2-Regression/3-Linear/images/janitor.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "japanese.30260486f2a05c46.webp": { "original_hash": "2341f1b464ca87b44d9a1a8581a60068", "translation_date": "2026-01-16T11:34:45+00:00", "source_file": "4-Classification/1-Introduction/images/japanese.png", - "language_code": "br" + "language_code": "pt-BR" }, "july-2014.9e1f7c318ec6d5b3.webp": { "original_hash": "7bee9739087aee3ce5b7157cb92cc043", "translation_date": "2026-01-16T11:37:49+00:00", "source_file": "7-TimeSeries/1-Introduction/images/july-2014.png", - "language_code": "br" + "language_code": "pt-BR" }, "korean.4a4f0274f3d9805a.webp": { "original_hash": "9863922b50bccb4f12b2036825a49a5b", "translation_date": "2026-01-16T11:33:16+00:00", "source_file": "4-Classification/1-Introduction/images/korean.png", - "language_code": "br" + "language_code": "pt-BR" }, "learned.ed28bcd8484b5287.webp": { "original_hash": "084d4af7881e5b990b53dd562a0aca6e", "translation_date": "2026-01-16T11:37:14+00:00", "source_file": "8-Reinforcement/1-QLearning/images/learned.png", - "language_code": "br" + "language_code": "pt-BR" }, "linear-polynomial.5523c7cb6576ccab.webp": { "original_hash": "1b810c7c5447242163be60624c06bf97", "translation_date": "2026-01-16T11:20:13+00:00", "source_file": "2-Regression/3-Linear/images/linear-polynomial.png", - "language_code": "br" + "language_code": "pt-BR" }, "linear-results.f7c3552c85b0ed1c.webp": { "original_hash": "3f6827091179dabc363a4327e4f824fe", "translation_date": "2026-01-16T11:18:47+00:00", "source_file": "2-Regression/3-Linear/images/linear-results.png", - "language_code": "br" + "language_code": "pt-BR" }, "linear-vs-logistic.ba180bf95e7ee667.webp": { "original_hash": "96759faebbd1f2a900347a266e140c4d", "translation_date": "2026-01-16T11:21:54+00:00", "source_file": "2-Regression/4-Logistic/images/linear-vs-logistic.png", - "language_code": "br" + "language_code": "pt-BR" }, "linear.a1b0760a56132551.webp": { "original_hash": "0bc5432c73d2c073cab1b85d8279ff44", "translation_date": "2026-01-16T11:20:24+00:00", "source_file": "2-Regression/3-Linear/images/linear.png", - "language_code": "br" + "language_code": "pt-BR" }, "lobe.2fa0806408ef9923.webp": { "original_hash": "e6ec71dbe350aef39135dbf88bc89163", "translation_date": "2026-01-16T11:24:17+00:00", "source_file": "3-Web-App/1-Web-App/images/lobe.png", - "language_code": "br" + "language_code": "pt-BR" }, "logistic-linear.0f2f6bb73b3134c1.webp": { "original_hash": "7069c082c288ac778688382b8f817d12", "translation_date": "2026-01-16T11:23:47+00:00", "source_file": "2-Regression/4-Logistic/images/logistic-linear.png", - "language_code": "br" + "language_code": "pt-BR" }, "logistic.b0cba6b7db4d5789.webp": { "original_hash": "9794c53dc6a7c7c197cf4e308d45cfe8", "translation_date": "2026-01-16T11:22:05+00:00", "source_file": "2-Regression/4-Logistic/images/logistic.png", - "language_code": "br" + "language_code": "pt-BR" }, "lpathlen.94f211521ed60940.webp": { "original_hash": "ac846488f72765b30a11fb5044342021", "translation_date": "2026-01-16T11:37:03+00:00", "source_file": "8-Reinforcement/1-QLearning/images/lpathlen.png", - "language_code": "br" + "language_code": "pt-BR" }, "lpathlen1.0534784add58d4eb.webp": { "original_hash": "2c699a343a0253fcf0024de108d45266", "translation_date": "2026-01-16T11:37:11+00:00", "source_file": "8-Reinforcement/1-QLearning/images/lpathlen1.png", - "language_code": "br" + "language_code": "pt-BR" }, "map.e963a6a51349425a.webp": { "original_hash": "d8d479d57d050e32c1d77bb859d61ce2", "translation_date": "2026-01-16T11:35:36+00:00", "source_file": "4-Classification/3-Classifiers-2/images/map.png", - "language_code": "br" + "language_code": "pt-BR" }, "mape.fd87bbaf4d346846.webp": { "original_hash": "cdc81fd2d2ffdbc2f8c10d75c954cb74", "translation_date": "2026-01-16T11:37:57+00:00", "source_file": "7-TimeSeries/2-ARIMA/images/mape.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-fairness.ef296ebec6afc98a.webp": { "original_hash": "bceb2f96ebd4940cfddce42307d5e4a9", "translation_date": "2026-01-16T11:15:06+00:00", "source_file": "sketchnotes/ml-fairness.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-for-beginners-video-banner.63f694a100034bc6.webp": { "original_hash": "2ee5851fdd14fb777163c9dfef721412", "translation_date": "2026-01-16T11:14:33+00:00", "source_file": "images/ml-for-beginners-video-banner.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-for-beginners.9eecb963dbfbfb32.webp": { "original_hash": "168efdbeb98bec4da0e91cf8acf77dfe", "translation_date": "2026-01-16T11:14:29+00:00", "source_file": "images/ml-for-beginners.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-history.a1bdfd4ce1f464d9.webp": { "original_hash": "2fe022d2dd04763788b2a5a8ad71fb1f", "translation_date": "2026-01-16T11:16:58+00:00", "source_file": "sketchnotes/ml-history.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-realworld.26ee274671615577.webp": { "original_hash": "3f43444e6254753eb5f23de7f52b2745", "translation_date": "2026-01-16T11:15:52+00:00", "source_file": "sketchnotes/ml-realworld.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-regression.4e4f70e3b3ed446e.webp": { "original_hash": "c9bf1c0fe00e48262b884a679c612372", "translation_date": "2026-01-16T11:15:25+00:00", "source_file": "sketchnotes/ml-regression.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-reinforcement.94024374d63348db.webp": { "original_hash": "c3b55d97bb8edd97fbff43767fb4c563", "translation_date": "2026-01-16T11:16:13+00:00", "source_file": "sketchnotes/ml-reinforcement.png", - "language_code": "br" + "language_code": "pt-BR" }, "ml-timeseries.fb98d25f1013fc0c.webp": { "original_hash": "03443e1e03edffd1a9c8c605903c4e84", "translation_date": "2026-01-16T11:16:34+00:00", "source_file": "sketchnotes/ml-timeseries.png", - "language_code": "br" + "language_code": "pt-BR" }, "model-overview-dataset-cohorts.dfa463fb527a35a0.webp": { "original_hash": "5ba7caa265cee1ff9a7072a4f94e890d", "translation_date": "2026-01-16T11:30:55+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/model-overview-dataset-cohorts.png", - "language_code": "br" + "language_code": "pt-BR" }, "model-overview-feature-cohorts.c5104d575ffd0c80.webp": { "original_hash": "d2b187b7d1ec4bdcd8c985283d54f8e4", "translation_date": "2026-01-16T11:28:10+00:00", "source_file": "9-Real-World/2-Debugging-ML-Models/images/model-overview-feature-cohorts.png", - "language_code": "br" + "language_code": "pt-BR" }, "monnaie.606c5fa8369d5c3b.webp": { "original_hash": "8eb6b1ab4f94ed2f98059f68ebafc014", "translation_date": "2026-01-16T11:24:26+00:00", "source_file": "6-NLP/3-Translation-Sentiment/images/monnaie.png", - "language_code": "br" + "language_code": "pt-BR" }, "mountaincar.43d56e588ce581c2.webp": { "original_hash": "61c868cc389dc92bd2b402ea490cd162", "translation_date": "2026-01-16T11:36:59+00:00", "source_file": "8-Reinforcement/2-Gym/images/mountaincar.png", - "language_code": "br" + "language_code": "pt-BR" }, "multinomial-ordinal.944fe02295fd6cdf.webp": { "original_hash": "c7ccca072d30b5d4b75255a67ddae654", "translation_date": "2026-01-16T11:21:45+00:00", "source_file": "2-Regression/4-Logistic/images/multinomial-ordinal.png", - "language_code": "br" + "language_code": "pt-BR" }, "multinomial-vs-ordinal.36701b4850e37d86.webp": { "original_hash": "f073e94529a3648f2231cdce2cbab8b4", "translation_date": "2026-01-16T11:21:33+00:00", "source_file": "2-Regression/4-Logistic/images/multinomial-vs-ordinal.png", - "language_code": "br" + "language_code": "pt-BR" }, "netron.a05f39410211915e.webp": { "original_hash": "c2b192971dd35d1f9297037e3d9cf2c1", "translation_date": "2026-01-16T11:35:43+00:00", "source_file": "4-Classification/4-Applied/images/netron.png", - "language_code": "br" + "language_code": "pt-BR" }, "notebook.4a3ee31f396b8832.webp": { "original_hash": "53ed9e8157acd2742be1840e5d9c69ab", "translation_date": "2026-01-16T11:20:31+00:00", "source_file": "2-Regression/1-Tools/images/notebook.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "original.b2b15efe0ce92b87.webp": { "original_hash": "6dc5968069b296588e723b0f62f7cb39", "translation_date": "2026-01-16T11:38:00+00:00", "source_file": "7-TimeSeries/2-ARIMA/images/original.png", - "language_code": "br" + "language_code": "pt-BR" }, "overfitting.1c132d92bfd93cb6.webp": { "original_hash": "e9d1a3d88cf81abd87b93ba3cae6f3b1", "translation_date": "2026-01-16T11:17:41+00:00", "source_file": "1-Introduction/4-techniques-of-ML/images/overfitting.png", - "language_code": "br" + "language_code": "pt-BR" }, "p&p.279f1c49ecd88941.webp": { "original_hash": "9896259959fc22aeeb0c5e0d6e0154a7", "translation_date": "2026-01-16T11:24:23+00:00", "source_file": "6-NLP/images/p&p.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "parse.d0c5bbe1106eae8f.webp": { "original_hash": "322098f5a3769e96c7a60b16ad9d02b3", "translation_date": "2026-01-16T11:24:42+00:00", "source_file": "6-NLP/2-Tasks/images/parse.png", - "language_code": "br" + "language_code": "pt-BR" }, "parsnip.cd2ce92622976502.webp": { "original_hash": "898a910cf3763544400593dac6a92389", "translation_date": "2026-01-16T11:36:01+00:00", "source_file": "4-Classification/2-Classifiers-1/images/parsnip.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "peter.779730f9ba3a8a8d.webp": { "original_hash": "dd4a8cb8e3eb15c467a08d45fade443a", "translation_date": "2026-01-16T11:36:54+00:00", "source_file": "8-Reinforcement/images/peter.png", - "language_code": "br" + "language_code": "pt-BR" }, "pie-pumpkins-scatter.d14f9804a53f927e.webp": { "original_hash": "2475f9d321d752ada7e5f431fe59f9e9", "translation_date": "2026-01-16T11:19:52+00:00", "source_file": "2-Regression/3-Linear/images/pie-pumpkins-scatter.png", - "language_code": "br" + "language_code": "pt-BR" }, "pinch.1b035ec9ba7e0d40.webp": { "original_hash": "18f413d7670738c758fee477886c7759", "translation_date": "2026-01-16T11:34:20+00:00", "source_file": "4-Classification/1-Introduction/images/pinch.png", - "language_code": "br" + "language_code": "pt-BR" }, "poly-results.ee587348f0f1f60b.webp": { "original_hash": "e69be7266860f3cae8c750a35e160493", "translation_date": "2026-01-16T11:19:53+00:00", "source_file": "2-Regression/3-Linear/images/poly-results.png", - "language_code": "br" + "language_code": "pt-BR" }, "polynomial.8fce4663e7283dfb.webp": { "original_hash": "7df902a6d0b81a28de48a330b3b4aa76", "translation_date": "2026-01-16T11:18:14+00:00", "source_file": "2-Regression/3-Linear/images/polynomial.png", - "language_code": "br" + "language_code": "pt-BR" }, "popular.9c48d84b3386705f.webp": { "original_hash": "178fa011a311e1411a3750428b0525a7", "translation_date": "2026-01-16T11:27:15+00:00", "source_file": "5-Clustering/1-Visualize/images/popular.png", - "language_code": "br" + "language_code": "pt-BR" }, "price-by-variety.744a2f9925d9bcb4.webp": { "original_hash": "80b85163de4d24d4d0bf67ff0d9b2309", "translation_date": "2026-01-16T11:19:59+00:00", "source_file": "2-Regression/3-Linear/images/price-by-variety.png", - "language_code": "br" + "language_code": "pt-BR" }, "problems.f7fb539ccd80608e.webp": { "original_hash": "d3605f6f944d3a7a5390490be3a94186", "translation_date": "2026-01-16T11:24:57+00:00", "source_file": "5-Clustering/2-K-Means/images/problems.png", - "language_code": "br" + "language_code": "pt-BR" }, "pumpkin-classifier.562771f104ad5436.webp": { "original_hash": "9b4b4ac420310c1c6f70835f8f039666", "translation_date": "2026-01-16T11:22:03+00:00", "source_file": "2-Regression/4-Logistic/images/pumpkin-classifier.png", - "language_code": "br" + "language_code": "pt-BR" }, "pumpkins_catplot_1.c55c409b71fea2ec.webp": { "original_hash": "21156df8979d98c866269dca8da8f884", "translation_date": "2026-01-16T11:23:20+00:00", "source_file": "2-Regression/4-Logistic/images/pumpkins_catplot_1.png", - "language_code": "br" + "language_code": "pt-BR" }, "pumpkins_catplot_2.87a354447880b388.webp": { "original_hash": "64c425c52a46eef297def367d169d32a", "translation_date": "2026-01-16T11:23:13+00:00", "source_file": "2-Regression/4-Logistic/images/pumpkins_catplot_2.png", - "language_code": "br" + "language_code": "pt-BR" }, "r_learners_sm.cd14eb3581a9f28d.webp": { "original_hash": "837c804617ba17f341a8ed2db93105d5", "translation_date": "2026-01-16T11:34:17+00:00", "source_file": "4-Classification/1-Introduction/images/r_learners_sm.jpeg", - "language_code": "br" + "language_code": "pt-BR" }, "r_learners_sm.e25fa9c205b3a3f9.webp": { "original_hash": "837c804617ba17f341a8ed2db93105d5", "translation_date": "2026-01-16T11:23:29+00:00", "source_file": "2-Regression/4-Logistic/images/r_learners_sm.jpeg", - "language_code": "br" + "language_code": "pt-BR" }, "r_learners_sm.e4a71b113ffbedfe.webp": { "original_hash": "837c804617ba17f341a8ed2db93105d5", "translation_date": "2026-01-16T11:25:05+00:00", "source_file": "5-Clustering/2-K-Means/images/r_learners_sm.jpeg", - "language_code": "br" + "language_code": "pt-BR" }, "r_learners_sm.f9199f76f1e2e493.webp": { "original_hash": "837c804617ba17f341a8ed2db93105d5", "translation_date": "2026-01-16T11:35:40+00:00", "source_file": "4-Classification/3-Classifiers-2/images/r_learners_sm.jpeg", - "language_code": "br" + "language_code": "pt-BR" }, "recipes.186acfa8ed2e8f00.webp": { "original_hash": "925552a21bb3687dfd83bb25010273f9", "translation_date": "2026-01-16T11:34:03+00:00", "source_file": "4-Classification/1-Introduction/images/recipes.png", - "language_code": "br" + "language_code": "pt-BR" }, "recipes.9ad10d8a4056bf89.webp": { "original_hash": "925552a21bb3687dfd83bb25010273f9", "translation_date": "2026-01-16T11:19:33+00:00", "source_file": "2-Regression/3-Linear/images/recipes.png", - "language_code": "br" + "language_code": "pt-BR" }, "scaled.91897dfbaa26ca4a.webp": { "original_hash": "789c70fafe6f6dd6e377a90b66e7d740", "translation_date": "2026-01-16T11:37:43+00:00", "source_file": "7-TimeSeries/1-Introduction/images/scaled.png", - "language_code": "br" + "language_code": "pt-BR" }, "scaled.e35258ca5cd3d43f.webp": { "original_hash": "789c70fafe6f6dd6e377a90b66e7d740", "translation_date": "2026-01-16T11:37:51+00:00", "source_file": "7-TimeSeries/2-ARIMA/images/scaled.png", - "language_code": "br" + "language_code": "pt-BR" }, "scatter-dayofyear-color.65790faefbb9d54f.webp": { "original_hash": "57a573b7b038fddf7793cc520baa2ecd", "translation_date": "2026-01-16T11:19:58+00:00", "source_file": "2-Regression/3-Linear/images/scatter-dayofyear-color.png", - "language_code": "br" + "language_code": "pt-BR" }, "scatter-dayofyear.bc171c189c9fd553.webp": { "original_hash": "0dfbd93772844f3b564fefa1750f1f1a", "translation_date": "2026-01-16T11:20:16+00:00", "source_file": "2-Regression/3-Linear/images/scatter-dayofyear.png", - "language_code": "br" + "language_code": "pt-BR" }, "scatterplot.ad8b356bcbb33be6.webp": { "original_hash": "3957c7a107594dadc4758bb3ce04857d", "translation_date": "2026-01-16T11:20:37+00:00", "source_file": "2-Regression/1-Tools/images/scatterplot.png", - "language_code": "br" + "language_code": "pt-BR" }, "scatterplot.b6868f44cbd2051c.webp": { "original_hash": "be95a93bbe7e5ef894f0cc2a9165b524", "translation_date": "2026-01-16T11:21:11+00:00", "source_file": "2-Regression/2-Data/images/scatterplot.png", - "language_code": "br" + "language_code": "pt-BR" }, "shakey.4dc17819c447c05b.webp": { "original_hash": "c1d741be4627f3e75ea5ee912f5896e6", "translation_date": "2026-01-16T11:17:20+00:00", "source_file": "1-Introduction/2-history-of-ML/images/shakey.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "sigmoid.8b7ba9d095c789cf.webp": { "original_hash": "93e362a78005d1964a4a108887df6f65", "translation_date": "2026-01-16T11:21:36+00:00", "source_file": "2-Regression/4-Logistic/images/sigmoid.png", - "language_code": "br" + "language_code": "pt-BR" }, "slope.f3c9d5910ddbfcf9.webp": { "original_hash": "d81920219716f4765a0208ea6d035ec7", "translation_date": "2026-01-16T11:19:50+00:00", "source_file": "2-Regression/3-Linear/images/slope.png", - "language_code": "br" + "language_code": "pt-BR" }, "solvers.5fc648618529e627.webp": { "original_hash": "f792b31c558c35d791f54218c114f11a", "translation_date": "2026-01-16T11:36:19+00:00", "source_file": "4-Classification/2-Classifiers-1/images/solvers.png", - "language_code": "br" + "language_code": "pt-BR" }, "svm.621ae7b516d678e0.webp": { "original_hash": "ce775a75b8ab37b61869cbb31dc76289", "translation_date": "2026-01-16T11:34:53+00:00", "source_file": "4-Classification/3-Classifiers-2/images/svm.png", - "language_code": "br" + "language_code": "pt-BR" }, "swarm.56d253ae80a2c0f5.webp": { "original_hash": "fe1af9f5ac979ea7316753ac7559aaaf", "translation_date": "2026-01-16T11:22:42+00:00", "source_file": "2-Regression/4-Logistic/images/swarm.png", - "language_code": "br" + "language_code": "pt-BR" }, "swarm_2.efeacfca536c2b57.webp": { "original_hash": "734f5d0884220257ff5c7f7e1f6faed2", "translation_date": "2026-01-16T11:23:32+00:00", "source_file": "2-Regression/4-Logistic/images/swarm_2.png", - "language_code": "br" + "language_code": "pt-BR" }, "test-data-predict.8afc47ee7e52874f.webp": { "original_hash": "d9de9b2f4cc312cf745b00a1c3344579", "translation_date": "2026-01-16T11:37:23+00:00", "source_file": "7-TimeSeries/3-SVR/images/test-data-predict.png", - "language_code": "br" + "language_code": "pt-BR" }, "thai-food.c47a7a7f9f05c218.webp": { "original_hash": "d3881195db88ba1cc9fd217f30415da6", "translation_date": "2026-01-16T11:33:13+00:00", "source_file": "4-Classification/images/thai-food.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "thai.0269dbab2e78bd38.webp": { "original_hash": "e2b3c8115e57ff80b2c950d3c783e2cf", "translation_date": "2026-01-16T11:33:19+00:00", "source_file": "4-Classification/1-Introduction/images/thai.png", - "language_code": "br" + "language_code": "pt-BR" }, "tokenization.1641a160c66cd2d9.webp": { "original_hash": "568ebd0acfd2a2712e97c2efb889b5b9", "translation_date": "2026-01-16T11:24:33+00:00", "source_file": "6-NLP/2-Tasks/images/tokenization.png", - "language_code": "br" + "language_code": "pt-BR" }, "train-data-predict.3c4ef4e78553104f.webp": { "original_hash": "8f901e721ed63b25087154a88980eb8c", "translation_date": "2026-01-16T11:37:19+00:00", "source_file": "7-TimeSeries/3-SVR/images/train-data-predict.png", - "language_code": "br" + "language_code": "pt-BR" }, "train-test.8928d14e5b91fc94.webp": { "original_hash": "86bac92c99563659e1acb31bb50bb4e4", "translation_date": "2026-01-16T11:38:04+00:00", "source_file": "7-TimeSeries/2-ARIMA/images/train-test.png", - "language_code": "br" + "language_code": "pt-BR" }, "train-test.ead0cecbfc341921.webp": { "original_hash": "56b4e7e0f3e4bcabfc70dd34c86778ad", "translation_date": "2026-01-16T11:37:31+00:00", "source_file": "7-TimeSeries/3-SVR/images/train-test.png", - "language_code": "br" + "language_code": "pt-BR" }, "train_progress_raw.2adfdf2daea09c59.webp": { "original_hash": "6b053943a2e7d2b4d7d65460517e854a", "translation_date": "2026-01-16T11:37:01+00:00", "source_file": "8-Reinforcement/2-Gym/images/train_progress_raw.png", - "language_code": "br" + "language_code": "pt-BR" }, "train_progress_runav.c71694a8fa9ab359.webp": { "original_hash": "4e4c78e37e5b80687dd1d8452fd8ce78", "translation_date": "2026-01-16T11:36:57+00:00", "source_file": "8-Reinforcement/2-Gym/images/train_progress_runav.png", - "language_code": "br" + "language_code": "pt-BR" }, "turntable.f2b86b13c53302dc.webp": { "original_hash": "02aa654944ce0872a2a6b41ad6f8bae2", "translation_date": "2026-01-16T11:24:43+00:00", "source_file": "5-Clustering/images/turntable.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "ufo.9e787f5161da9d4d.webp": { "original_hash": "99f743b68eb93ed8c683c0f78ac1a180", "translation_date": "2026-01-16T11:23:55+00:00", "source_file": "3-Web-App/images/ufo.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "unruly_data.0eedc7ced92d2d91.webp": { "original_hash": "a4a8c088eb459adbbae497322c640811", "translation_date": "2026-01-16T11:21:05+00:00", "source_file": "2-Regression/2-Data/images/unruly_data.jpg", - "language_code": "br" + "language_code": "pt-BR" }, "violin.ffceb68923177011.webp": { "original_hash": "6552159e8ea391bd6d60d1ee0ee0a40b", "translation_date": "2026-01-16T11:23:23+00:00", "source_file": "2-Regression/4-Logistic/images/violin.png", - "language_code": "br" + "language_code": "pt-BR" }, "voronoi.1dc1613fb0439b95.webp": { "original_hash": "561aedc2bbfa5e0af9f4e1b1d5df00a1", "translation_date": "2026-01-16T11:24:59+00:00", "source_file": "5-Clustering/2-K-Means/images/voronoi.png", - "language_code": "br" + "language_code": "pt-BR" }, "web-app.4c76450cabe20036.webp": { "original_hash": "cbede42b607bbb5910e9a4faf778225c", "translation_date": "2026-01-16T11:35:51+00:00", "source_file": "4-Classification/4-Applied/images/web-app.png", - "language_code": "br" + "language_code": "pt-BR" }, "wolf.a56d3d4070ca0c79.webp": { "original_hash": "36a8284655906f6a4e5c4aaa06671da4", "translation_date": "2026-01-16T11:37:04+00:00", "source_file": "8-Reinforcement/1-QLearning/images/wolf.png", - "language_code": "br" + "language_code": "pt-BR" } } \ No newline at end of file diff --git a/translated_images/br/3.9b58fd8d6c373c20.webp b/translated_images/pt-BR/3.9b58fd8d6c373c20.webp similarity index 100% rename from translated_images/br/3.9b58fd8d6c373c20.webp rename to translated_images/pt-BR/3.9b58fd8d6c373c20.webp diff --git a/translated_images/br/9-feature-importance.cd3193b4bba3fd4b.webp b/translated_images/pt-BR/9-feature-importance.cd3193b4bba3fd4b.webp similarity index 100% rename from translated_images/br/9-feature-importance.cd3193b4bba3fd4b.webp rename to translated_images/pt-BR/9-feature-importance.cd3193b4bba3fd4b.webp diff --git a/translated_images/br/9-features-influence.3ead3d3f68a84029.webp b/translated_images/pt-BR/9-features-influence.3ead3d3f68a84029.webp similarity index 100% rename from translated_images/br/9-features-influence.3ead3d3f68a84029.webp rename to translated_images/pt-BR/9-features-influence.3ead3d3f68a84029.webp diff --git a/translated_images/br/ROC.167a70519c5bf898.webp b/translated_images/pt-BR/ROC.167a70519c5bf898.webp similarity index 100% rename from translated_images/br/ROC.167a70519c5bf898.webp rename to translated_images/pt-BR/ROC.167a70519c5bf898.webp diff --git a/translated_images/br/ROC_2.777f20cdfc4988ca.webp b/translated_images/pt-BR/ROC_2.777f20cdfc4988ca.webp similarity index 100% rename from translated_images/br/ROC_2.777f20cdfc4988ca.webp rename to translated_images/pt-BR/ROC_2.777f20cdfc4988ca.webp diff --git a/translated_images/br/accessibility.c1be5ce816eaea65.webp b/translated_images/pt-BR/accessibility.c1be5ce816eaea65.webp similarity index 100% rename from translated_images/br/accessibility.c1be5ce816eaea65.webp rename to translated_images/pt-BR/accessibility.c1be5ce816eaea65.webp diff --git a/translated_images/br/accountability.41d8c0f4b85b6231.webp b/translated_images/pt-BR/accountability.41d8c0f4b85b6231.webp similarity index 100% rename from translated_images/br/accountability.41d8c0f4b85b6231.webp rename to translated_images/pt-BR/accountability.41d8c0f4b85b6231.webp diff --git a/translated_images/br/accuracy.2c47fe1bf15f44b3.webp b/translated_images/pt-BR/accuracy.2c47fe1bf15f44b3.webp similarity index 100% rename from translated_images/br/accuracy.2c47fe1bf15f44b3.webp rename to translated_images/pt-BR/accuracy.2c47fe1bf15f44b3.webp diff --git a/translated_images/br/ai-ml-ds.537ea441b124ebf6.webp b/translated_images/pt-BR/ai-ml-ds.537ea441b124ebf6.webp similarity index 100% rename from translated_images/br/ai-ml-ds.537ea441b124ebf6.webp rename to translated_images/pt-BR/ai-ml-ds.537ea441b124ebf6.webp diff --git a/translated_images/br/all-genres.1d56ef06cefbfcd6.webp b/translated_images/pt-BR/all-genres.1d56ef06cefbfcd6.webp similarity index 100% rename from translated_images/br/all-genres.1d56ef06cefbfcd6.webp rename to translated_images/pt-BR/all-genres.1d56ef06cefbfcd6.webp diff --git a/translated_images/br/apple.c81c8d5965e5e5da.webp b/translated_images/pt-BR/apple.c81c8d5965e5e5da.webp similarity index 100% rename from translated_images/br/apple.c81c8d5965e5e5da.webp rename to translated_images/pt-BR/apple.c81c8d5965e5e5da.webp diff --git a/translated_images/br/barchart.a833ea9194346d76.webp b/translated_images/pt-BR/barchart.a833ea9194346d76.webp similarity index 100% rename from translated_images/br/barchart.a833ea9194346d76.webp rename to translated_images/pt-BR/barchart.a833ea9194346d76.webp diff --git a/translated_images/br/bellman-equation.7c0c4c722e5a6b7c.webp b/translated_images/pt-BR/bellman-equation.7c0c4c722e5a6b7c.webp similarity index 100% rename from translated_images/br/bellman-equation.7c0c4c722e5a6b7c.webp rename to translated_images/pt-BR/bellman-equation.7c0c4c722e5a6b7c.webp diff --git a/translated_images/br/binary-multiclass.b56d0c86c81105a6.webp b/translated_images/pt-BR/binary-multiclass.b56d0c86c81105a6.webp similarity index 100% rename from translated_images/br/binary-multiclass.b56d0c86c81105a6.webp rename to translated_images/pt-BR/binary-multiclass.b56d0c86c81105a6.webp diff --git a/translated_images/br/boxplots.8228c29dabd0f292.webp b/translated_images/pt-BR/boxplots.8228c29dabd0f292.webp similarity index 100% rename from translated_images/br/boxplots.8228c29dabd0f292.webp rename to translated_images/pt-BR/boxplots.8228c29dabd0f292.webp diff --git a/translated_images/br/calculation.a209813050a1ddb1.webp b/translated_images/pt-BR/calculation.a209813050a1ddb1.webp similarity index 100% rename from translated_images/br/calculation.a209813050a1ddb1.webp rename to translated_images/pt-BR/calculation.a209813050a1ddb1.webp diff --git a/translated_images/br/cartpole.b5609cc0494a14f7.webp b/translated_images/pt-BR/cartpole.b5609cc0494a14f7.webp similarity index 100% rename from translated_images/br/cartpole.b5609cc0494a14f7.webp rename to translated_images/pt-BR/cartpole.b5609cc0494a14f7.webp diff --git a/translated_images/br/centroid.097fde836cf6c918.webp b/translated_images/pt-BR/centroid.097fde836cf6c918.webp similarity index 100% rename from translated_images/br/centroid.097fde836cf6c918.webp rename to translated_images/pt-BR/centroid.097fde836cf6c918.webp diff --git a/translated_images/br/ceos.3de5d092ce8d2753.webp b/translated_images/pt-BR/ceos.3de5d092ce8d2753.webp similarity index 100% rename from translated_images/br/ceos.3de5d092ce8d2753.webp rename to translated_images/pt-BR/ceos.3de5d092ce8d2753.webp diff --git a/translated_images/br/ceos.7a9a67871424a6c0.webp b/translated_images/pt-BR/ceos.7a9a67871424a6c0.webp similarity index 100% rename from translated_images/br/ceos.7a9a67871424a6c0.webp rename to translated_images/pt-BR/ceos.7a9a67871424a6c0.webp diff --git a/translated_images/br/cf-what-if-features.5a92a6924da3e9b5.webp b/translated_images/pt-BR/cf-what-if-features.5a92a6924da3e9b5.webp similarity index 100% rename from translated_images/br/cf-what-if-features.5a92a6924da3e9b5.webp rename to translated_images/pt-BR/cf-what-if-features.5a92a6924da3e9b5.webp diff --git a/translated_images/br/cheatsheet.07a475ea444d2223.webp b/translated_images/pt-BR/cheatsheet.07a475ea444d2223.webp similarity index 100% rename from translated_images/br/cheatsheet.07a475ea444d2223.webp rename to translated_images/pt-BR/cheatsheet.07a475ea444d2223.webp diff --git a/translated_images/br/chess.e704a268781bdad8.webp b/translated_images/pt-BR/chess.e704a268781bdad8.webp similarity index 100% rename from translated_images/br/chess.e704a268781bdad8.webp rename to translated_images/pt-BR/chess.e704a268781bdad8.webp diff --git a/translated_images/br/chinese.e62cafa5309f111a.webp b/translated_images/pt-BR/chinese.e62cafa5309f111a.webp similarity index 100% rename from translated_images/br/chinese.e62cafa5309f111a.webp rename to translated_images/pt-BR/chinese.e62cafa5309f111a.webp diff --git a/translated_images/br/clusters.b635354640d8e4fd.webp b/translated_images/pt-BR/clusters.b635354640d8e4fd.webp similarity index 100% rename from translated_images/br/clusters.b635354640d8e4fd.webp rename to translated_images/pt-BR/clusters.b635354640d8e4fd.webp diff --git a/translated_images/br/comparison.edfab56193a85e7f.webp b/translated_images/pt-BR/comparison.edfab56193a85e7f.webp similarity index 100% rename from translated_images/br/comparison.edfab56193a85e7f.webp rename to translated_images/pt-BR/comparison.edfab56193a85e7f.webp diff --git a/translated_images/br/comprehension.619708fc5959b0f6.webp b/translated_images/pt-BR/comprehension.619708fc5959b0f6.webp similarity index 100% rename from translated_images/br/comprehension.619708fc5959b0f6.webp rename to translated_images/pt-BR/comprehension.619708fc5959b0f6.webp diff --git a/translated_images/br/confusion-matrix.3cc5496a1a37c3e4.webp b/translated_images/pt-BR/confusion-matrix.3cc5496a1a37c3e4.webp similarity index 100% rename from translated_images/br/confusion-matrix.3cc5496a1a37c3e4.webp rename to translated_images/pt-BR/confusion-matrix.3cc5496a1a37c3e4.webp diff --git a/translated_images/br/correlation.a9356bb798f5eea5.webp b/translated_images/pt-BR/correlation.a9356bb798f5eea5.webp similarity index 100% rename from translated_images/br/correlation.a9356bb798f5eea5.webp rename to translated_images/pt-BR/correlation.a9356bb798f5eea5.webp diff --git a/translated_images/br/counterfactuals-examples.b38a50a504ee0a9f.webp b/translated_images/pt-BR/counterfactuals-examples.b38a50a504ee0a9f.webp similarity index 100% rename from translated_images/br/counterfactuals-examples.b38a50a504ee0a9f.webp rename to translated_images/pt-BR/counterfactuals-examples.b38a50a504ee0a9f.webp diff --git a/translated_images/br/cuisine-dist.d0cc2d551abe5c25.webp b/translated_images/pt-BR/cuisine-dist.d0cc2d551abe5c25.webp similarity index 100% rename from translated_images/br/cuisine-dist.d0cc2d551abe5c25.webp rename to translated_images/pt-BR/cuisine-dist.d0cc2d551abe5c25.webp diff --git a/translated_images/br/currency.e7429812bfc8c608.webp b/translated_images/pt-BR/currency.e7429812bfc8c608.webp similarity index 100% rename from translated_images/br/currency.e7429812bfc8c608.webp rename to translated_images/pt-BR/currency.e7429812bfc8c608.webp diff --git a/translated_images/br/data-visualization.54e56dded7c1a804.webp b/translated_images/pt-BR/data-visualization.54e56dded7c1a804.webp similarity index 100% rename from translated_images/br/data-visualization.54e56dded7c1a804.webp rename to translated_images/pt-BR/data-visualization.54e56dded7c1a804.webp diff --git a/translated_images/br/dataanalysis-cover.8d6d0683a70a5c1e.webp b/translated_images/pt-BR/dataanalysis-cover.8d6d0683a70a5c1e.webp similarity index 100% rename from translated_images/br/dataanalysis-cover.8d6d0683a70a5c1e.webp rename to translated_images/pt-BR/dataanalysis-cover.8d6d0683a70a5c1e.webp diff --git a/translated_images/br/datapoints.aaf6815cd5d87354.webp b/translated_images/pt-BR/datapoints.aaf6815cd5d87354.webp similarity index 100% rename from translated_images/br/datapoints.aaf6815cd5d87354.webp rename to translated_images/pt-BR/datapoints.aaf6815cd5d87354.webp diff --git a/translated_images/br/distribution.9be11df42356ca95.webp b/translated_images/pt-BR/distribution.9be11df42356ca95.webp similarity index 100% rename from translated_images/br/distribution.9be11df42356ca95.webp rename to translated_images/pt-BR/distribution.9be11df42356ca95.webp diff --git a/translated_images/br/dplyr_filter.b480b264b03439ff.webp b/translated_images/pt-BR/dplyr_filter.b480b264b03439ff.webp similarity index 100% rename from translated_images/br/dplyr_filter.b480b264b03439ff.webp rename to translated_images/pt-BR/dplyr_filter.b480b264b03439ff.webp diff --git a/translated_images/br/dplyr_wrangling.f5f99c64fd4580f1.webp b/translated_images/pt-BR/dplyr_wrangling.f5f99c64fd4580f1.webp similarity index 100% rename from translated_images/br/dplyr_wrangling.f5f99c64fd4580f1.webp rename to translated_images/pt-BR/dplyr_wrangling.f5f99c64fd4580f1.webp diff --git a/translated_images/br/ea-error-cohort.6886209ea5d438c4.webp b/translated_images/pt-BR/ea-error-cohort.6886209ea5d438c4.webp similarity index 100% rename from translated_images/br/ea-error-cohort.6886209ea5d438c4.webp rename to translated_images/pt-BR/ea-error-cohort.6886209ea5d438c4.webp diff --git a/translated_images/br/ea-error-distribution.117452e1177c1dd8.webp b/translated_images/pt-BR/ea-error-distribution.117452e1177c1dd8.webp similarity index 100% rename from translated_images/br/ea-error-distribution.117452e1177c1dd8.webp rename to translated_images/pt-BR/ea-error-distribution.117452e1177c1dd8.webp diff --git a/translated_images/br/ea-heatmap.8d27185e28cee383.webp b/translated_images/pt-BR/ea-heatmap.8d27185e28cee383.webp similarity index 100% rename from translated_images/br/ea-heatmap.8d27185e28cee383.webp rename to translated_images/pt-BR/ea-heatmap.8d27185e28cee383.webp diff --git a/translated_images/br/elbow.72676169eed744ff.webp b/translated_images/pt-BR/elbow.72676169eed744ff.webp similarity index 100% rename from translated_images/br/elbow.72676169eed744ff.webp rename to translated_images/pt-BR/elbow.72676169eed744ff.webp diff --git a/translated_images/br/electric-grid.0c21d5214db09ffa.webp b/translated_images/pt-BR/electric-grid.0c21d5214db09ffa.webp similarity index 100% rename from translated_images/br/electric-grid.0c21d5214db09ffa.webp rename to translated_images/pt-BR/electric-grid.0c21d5214db09ffa.webp diff --git a/translated_images/br/eliza.84397454cda9559b.webp b/translated_images/pt-BR/eliza.84397454cda9559b.webp similarity index 100% rename from translated_images/br/eliza.84397454cda9559b.webp rename to translated_images/pt-BR/eliza.84397454cda9559b.webp diff --git a/translated_images/br/embedding.2cf8953c4b3101d1.webp b/translated_images/pt-BR/embedding.2cf8953c4b3101d1.webp similarity index 100% rename from translated_images/br/embedding.2cf8953c4b3101d1.webp rename to translated_images/pt-BR/embedding.2cf8953c4b3101d1.webp diff --git a/translated_images/br/encouRage.e75d5fe0367fb913.webp b/translated_images/pt-BR/encouRage.e75d5fe0367fb913.webp similarity index 100% rename from translated_images/br/encouRage.e75d5fe0367fb913.webp rename to translated_images/pt-BR/encouRage.e75d5fe0367fb913.webp diff --git a/translated_images/br/energy-plot.5fdac3f397a910bc.webp b/translated_images/pt-BR/energy-plot.5fdac3f397a910bc.webp similarity index 100% rename from translated_images/br/energy-plot.5fdac3f397a910bc.webp rename to translated_images/pt-BR/energy-plot.5fdac3f397a910bc.webp diff --git a/translated_images/br/env_init.04e8f26d2d60089e.webp b/translated_images/pt-BR/env_init.04e8f26d2d60089e.webp similarity index 100% rename from translated_images/br/env_init.04e8f26d2d60089e.webp rename to translated_images/pt-BR/env_init.04e8f26d2d60089e.webp diff --git a/translated_images/br/environment.40ba3cb66256c93f.webp b/translated_images/pt-BR/environment.40ba3cb66256c93f.webp similarity index 100% rename from translated_images/br/environment.40ba3cb66256c93f.webp rename to translated_images/pt-BR/environment.40ba3cb66256c93f.webp diff --git a/translated_images/br/escape.18862db9930337e3.webp b/translated_images/pt-BR/escape.18862db9930337e3.webp similarity index 100% rename from translated_images/br/escape.18862db9930337e3.webp rename to translated_images/pt-BR/escape.18862db9930337e3.webp diff --git a/translated_images/br/facetgrid.9b2e65ce707eba1f.webp b/translated_images/pt-BR/facetgrid.9b2e65ce707eba1f.webp similarity index 100% rename from translated_images/br/facetgrid.9b2e65ce707eba1f.webp rename to translated_images/pt-BR/facetgrid.9b2e65ce707eba1f.webp diff --git a/translated_images/br/fairness.25d7c8ce9817272d.webp b/translated_images/pt-BR/fairness.25d7c8ce9817272d.webp similarity index 100% rename from translated_images/br/fairness.25d7c8ce9817272d.webp rename to translated_images/pt-BR/fairness.25d7c8ce9817272d.webp diff --git a/translated_images/br/fairness.b9f9893a4e3dc28b.webp b/translated_images/pt-BR/fairness.b9f9893a4e3dc28b.webp similarity index 100% rename from translated_images/br/fairness.b9f9893a4e3dc28b.webp rename to translated_images/pt-BR/fairness.b9f9893a4e3dc28b.webp diff --git a/translated_images/br/favicon.37b561214b36d454.webp b/translated_images/pt-BR/favicon.37b561214b36d454.webp similarity index 100% rename from translated_images/br/favicon.37b561214b36d454.webp rename to translated_images/pt-BR/favicon.37b561214b36d454.webp diff --git a/translated_images/br/flat-nonflat.d1c8c6e2a96110c1.webp b/translated_images/pt-BR/flat-nonflat.d1c8c6e2a96110c1.webp similarity index 100% rename from translated_images/br/flat-nonflat.d1c8c6e2a96110c1.webp rename to translated_images/pt-BR/flat-nonflat.d1c8c6e2a96110c1.webp diff --git a/translated_images/br/full-data-predict.4f0fed16a131c8f3.webp b/translated_images/pt-BR/full-data-predict.4f0fed16a131c8f3.webp similarity index 100% rename from translated_images/br/full-data-predict.4f0fed16a131c8f3.webp rename to translated_images/pt-BR/full-data-predict.4f0fed16a131c8f3.webp diff --git a/translated_images/br/full-data.a82ec9957e580e97.webp b/translated_images/pt-BR/full-data.a82ec9957e580e97.webp similarity index 100% rename from translated_images/br/full-data.a82ec9957e580e97.webp rename to translated_images/pt-BR/full-data.a82ec9957e580e97.webp diff --git a/translated_images/br/gender-bias-translate-en-tr.bfd87c45da23c085.webp b/translated_images/pt-BR/gender-bias-translate-en-tr.bfd87c45da23c085.webp similarity index 100% rename from translated_images/br/gender-bias-translate-en-tr.bfd87c45da23c085.webp rename to translated_images/pt-BR/gender-bias-translate-en-tr.bfd87c45da23c085.webp diff --git a/translated_images/br/gender-bias-translate-en-tr.f185fd8822c2d437.webp b/translated_images/pt-BR/gender-bias-translate-en-tr.f185fd8822c2d437.webp similarity index 100% rename from translated_images/br/gender-bias-translate-en-tr.f185fd8822c2d437.webp rename to translated_images/pt-BR/gender-bias-translate-en-tr.f185fd8822c2d437.webp diff --git a/translated_images/br/gender-bias-translate-tr-en.1f97568ba9e40e20.webp b/translated_images/pt-BR/gender-bias-translate-tr-en.1f97568ba9e40e20.webp similarity index 100% rename from translated_images/br/gender-bias-translate-tr-en.1f97568ba9e40e20.webp rename to translated_images/pt-BR/gender-bias-translate-tr-en.1f97568ba9e40e20.webp diff --git a/translated_images/br/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp b/translated_images/pt-BR/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp similarity index 100% rename from translated_images/br/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp rename to translated_images/pt-BR/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp diff --git a/translated_images/br/globe.59f26379ceb40428.webp b/translated_images/pt-BR/globe.59f26379ceb40428.webp similarity index 100% rename from translated_images/br/globe.59f26379ceb40428.webp rename to translated_images/pt-BR/globe.59f26379ceb40428.webp diff --git a/translated_images/br/grid.464370ad00f3696c.webp b/translated_images/pt-BR/grid.464370ad00f3696c.webp similarity index 100% rename from translated_images/br/grid.464370ad00f3696c.webp rename to translated_images/pt-BR/grid.464370ad00f3696c.webp diff --git a/translated_images/br/heatmap.39952045da50b4eb.webp b/translated_images/pt-BR/heatmap.39952045da50b4eb.webp similarity index 100% rename from translated_images/br/heatmap.39952045da50b4eb.webp rename to translated_images/pt-BR/heatmap.39952045da50b4eb.webp diff --git a/translated_images/br/hierarchical.bf59403aa43c8c47.webp b/translated_images/pt-BR/hierarchical.bf59403aa43c8c47.webp similarity index 100% rename from translated_images/br/hierarchical.bf59403aa43c8c47.webp rename to translated_images/pt-BR/hierarchical.bf59403aa43c8c47.webp diff --git a/translated_images/br/human.e3840390a2ab7690.webp b/translated_images/pt-BR/human.e3840390a2ab7690.webp similarity index 100% rename from translated_images/br/human.e3840390a2ab7690.webp rename to translated_images/pt-BR/human.e3840390a2ab7690.webp diff --git a/translated_images/br/hype.07183d711a17aafe.webp b/translated_images/pt-BR/hype.07183d711a17aafe.webp similarity index 100% rename from translated_images/br/hype.07183d711a17aafe.webp rename to translated_images/pt-BR/hype.07183d711a17aafe.webp diff --git a/translated_images/br/indian.2c4292002af1a1f9.webp b/translated_images/pt-BR/indian.2c4292002af1a1f9.webp similarity index 100% rename from translated_images/br/indian.2c4292002af1a1f9.webp rename to translated_images/pt-BR/indian.2c4292002af1a1f9.webp diff --git a/translated_images/br/individual-causal-what-if.00e7b86b52a083ce.webp b/translated_images/pt-BR/individual-causal-what-if.00e7b86b52a083ce.webp similarity index 100% rename from translated_images/br/individual-causal-what-if.00e7b86b52a083ce.webp rename to translated_images/pt-BR/individual-causal-what-if.00e7b86b52a083ce.webp diff --git a/translated_images/br/jack-o-lanterns.181c661a9212457d.webp b/translated_images/pt-BR/jack-o-lanterns.181c661a9212457d.webp similarity index 100% rename from translated_images/br/jack-o-lanterns.181c661a9212457d.webp rename to translated_images/pt-BR/jack-o-lanterns.181c661a9212457d.webp diff --git a/translated_images/br/janitor.e4a77dd3d3e6a32e.webp b/translated_images/pt-BR/janitor.e4a77dd3d3e6a32e.webp similarity index 100% rename from translated_images/br/janitor.e4a77dd3d3e6a32e.webp rename to translated_images/pt-BR/janitor.e4a77dd3d3e6a32e.webp diff --git a/translated_images/br/japanese.30260486f2a05c46.webp b/translated_images/pt-BR/japanese.30260486f2a05c46.webp similarity index 100% rename from translated_images/br/japanese.30260486f2a05c46.webp rename to translated_images/pt-BR/japanese.30260486f2a05c46.webp diff --git a/translated_images/br/july-2014.9e1f7c318ec6d5b3.webp b/translated_images/pt-BR/july-2014.9e1f7c318ec6d5b3.webp similarity index 100% rename from translated_images/br/july-2014.9e1f7c318ec6d5b3.webp rename to translated_images/pt-BR/july-2014.9e1f7c318ec6d5b3.webp diff --git a/translated_images/br/korean.4a4f0274f3d9805a.webp b/translated_images/pt-BR/korean.4a4f0274f3d9805a.webp similarity index 100% rename from translated_images/br/korean.4a4f0274f3d9805a.webp rename to translated_images/pt-BR/korean.4a4f0274f3d9805a.webp diff --git a/translated_images/br/learned.ed28bcd8484b5287.webp b/translated_images/pt-BR/learned.ed28bcd8484b5287.webp similarity index 100% rename from translated_images/br/learned.ed28bcd8484b5287.webp rename to translated_images/pt-BR/learned.ed28bcd8484b5287.webp diff --git a/translated_images/br/linear-polynomial.5523c7cb6576ccab.webp b/translated_images/pt-BR/linear-polynomial.5523c7cb6576ccab.webp similarity index 100% rename from translated_images/br/linear-polynomial.5523c7cb6576ccab.webp rename to translated_images/pt-BR/linear-polynomial.5523c7cb6576ccab.webp diff --git a/translated_images/br/linear-results.f7c3552c85b0ed1c.webp b/translated_images/pt-BR/linear-results.f7c3552c85b0ed1c.webp similarity index 100% rename from translated_images/br/linear-results.f7c3552c85b0ed1c.webp rename to translated_images/pt-BR/linear-results.f7c3552c85b0ed1c.webp diff --git a/translated_images/br/linear-vs-logistic.ba180bf95e7ee667.webp b/translated_images/pt-BR/linear-vs-logistic.ba180bf95e7ee667.webp similarity index 100% rename from translated_images/br/linear-vs-logistic.ba180bf95e7ee667.webp rename to translated_images/pt-BR/linear-vs-logistic.ba180bf95e7ee667.webp diff --git a/translated_images/br/linear.a1b0760a56132551.webp b/translated_images/pt-BR/linear.a1b0760a56132551.webp similarity index 100% rename from translated_images/br/linear.a1b0760a56132551.webp rename to translated_images/pt-BR/linear.a1b0760a56132551.webp diff --git a/translated_images/br/lobe.2fa0806408ef9923.webp b/translated_images/pt-BR/lobe.2fa0806408ef9923.webp similarity index 100% rename from translated_images/br/lobe.2fa0806408ef9923.webp rename to translated_images/pt-BR/lobe.2fa0806408ef9923.webp diff --git a/translated_images/br/logistic-linear.0f2f6bb73b3134c1.webp b/translated_images/pt-BR/logistic-linear.0f2f6bb73b3134c1.webp similarity index 100% rename from translated_images/br/logistic-linear.0f2f6bb73b3134c1.webp rename to translated_images/pt-BR/logistic-linear.0f2f6bb73b3134c1.webp diff --git a/translated_images/br/logistic.b0cba6b7db4d5789.webp b/translated_images/pt-BR/logistic.b0cba6b7db4d5789.webp similarity index 100% rename from translated_images/br/logistic.b0cba6b7db4d5789.webp rename to translated_images/pt-BR/logistic.b0cba6b7db4d5789.webp diff --git a/translated_images/br/lpathlen.94f211521ed60940.webp b/translated_images/pt-BR/lpathlen.94f211521ed60940.webp similarity index 100% rename from translated_images/br/lpathlen.94f211521ed60940.webp rename to translated_images/pt-BR/lpathlen.94f211521ed60940.webp diff --git a/translated_images/br/lpathlen1.0534784add58d4eb.webp b/translated_images/pt-BR/lpathlen1.0534784add58d4eb.webp similarity index 100% rename from translated_images/br/lpathlen1.0534784add58d4eb.webp rename to translated_images/pt-BR/lpathlen1.0534784add58d4eb.webp diff --git a/translated_images/br/map.e963a6a51349425a.webp b/translated_images/pt-BR/map.e963a6a51349425a.webp similarity index 100% rename from translated_images/br/map.e963a6a51349425a.webp rename to translated_images/pt-BR/map.e963a6a51349425a.webp diff --git a/translated_images/br/mape.fd87bbaf4d346846.webp b/translated_images/pt-BR/mape.fd87bbaf4d346846.webp similarity index 100% rename from translated_images/br/mape.fd87bbaf4d346846.webp rename to translated_images/pt-BR/mape.fd87bbaf4d346846.webp diff --git a/translated_images/br/ml-fairness.ef296ebec6afc98a.webp b/translated_images/pt-BR/ml-fairness.ef296ebec6afc98a.webp similarity index 100% rename from translated_images/br/ml-fairness.ef296ebec6afc98a.webp rename to translated_images/pt-BR/ml-fairness.ef296ebec6afc98a.webp diff --git a/translated_images/br/ml-for-beginners-video-banner.63f694a100034bc6.webp b/translated_images/pt-BR/ml-for-beginners-video-banner.63f694a100034bc6.webp similarity index 100% rename from translated_images/br/ml-for-beginners-video-banner.63f694a100034bc6.webp rename to translated_images/pt-BR/ml-for-beginners-video-banner.63f694a100034bc6.webp diff --git a/translated_images/br/ml-for-beginners.9eecb963dbfbfb32.webp b/translated_images/pt-BR/ml-for-beginners.9eecb963dbfbfb32.webp similarity index 100% rename from translated_images/br/ml-for-beginners.9eecb963dbfbfb32.webp rename to translated_images/pt-BR/ml-for-beginners.9eecb963dbfbfb32.webp diff --git a/translated_images/br/ml-history.a1bdfd4ce1f464d9.webp b/translated_images/pt-BR/ml-history.a1bdfd4ce1f464d9.webp similarity index 100% rename from translated_images/br/ml-history.a1bdfd4ce1f464d9.webp rename to translated_images/pt-BR/ml-history.a1bdfd4ce1f464d9.webp diff --git a/translated_images/br/ml-realworld.26ee274671615577.webp b/translated_images/pt-BR/ml-realworld.26ee274671615577.webp similarity index 100% rename from translated_images/br/ml-realworld.26ee274671615577.webp rename to translated_images/pt-BR/ml-realworld.26ee274671615577.webp diff --git a/translated_images/br/ml-regression.4e4f70e3b3ed446e.webp b/translated_images/pt-BR/ml-regression.4e4f70e3b3ed446e.webp similarity index 100% rename from translated_images/br/ml-regression.4e4f70e3b3ed446e.webp rename to translated_images/pt-BR/ml-regression.4e4f70e3b3ed446e.webp diff --git a/translated_images/br/ml-reinforcement.94024374d63348db.webp b/translated_images/pt-BR/ml-reinforcement.94024374d63348db.webp similarity index 100% rename from translated_images/br/ml-reinforcement.94024374d63348db.webp rename to translated_images/pt-BR/ml-reinforcement.94024374d63348db.webp diff --git a/translated_images/br/ml-timeseries.fb98d25f1013fc0c.webp b/translated_images/pt-BR/ml-timeseries.fb98d25f1013fc0c.webp similarity index 100% rename from translated_images/br/ml-timeseries.fb98d25f1013fc0c.webp rename to translated_images/pt-BR/ml-timeseries.fb98d25f1013fc0c.webp diff --git a/translated_images/br/model-overview-dataset-cohorts.dfa463fb527a35a0.webp b/translated_images/pt-BR/model-overview-dataset-cohorts.dfa463fb527a35a0.webp similarity index 100% rename from translated_images/br/model-overview-dataset-cohorts.dfa463fb527a35a0.webp rename to translated_images/pt-BR/model-overview-dataset-cohorts.dfa463fb527a35a0.webp diff --git a/translated_images/br/model-overview-feature-cohorts.c5104d575ffd0c80.webp b/translated_images/pt-BR/model-overview-feature-cohorts.c5104d575ffd0c80.webp similarity index 100% rename from translated_images/br/model-overview-feature-cohorts.c5104d575ffd0c80.webp rename to translated_images/pt-BR/model-overview-feature-cohorts.c5104d575ffd0c80.webp diff --git a/translated_images/br/monnaie.606c5fa8369d5c3b.webp b/translated_images/pt-BR/monnaie.606c5fa8369d5c3b.webp similarity index 100% rename from translated_images/br/monnaie.606c5fa8369d5c3b.webp rename to translated_images/pt-BR/monnaie.606c5fa8369d5c3b.webp diff --git a/translated_images/br/mountaincar.43d56e588ce581c2.webp b/translated_images/pt-BR/mountaincar.43d56e588ce581c2.webp similarity index 100% rename from translated_images/br/mountaincar.43d56e588ce581c2.webp rename to translated_images/pt-BR/mountaincar.43d56e588ce581c2.webp diff --git a/translated_images/br/multinomial-ordinal.944fe02295fd6cdf.webp b/translated_images/pt-BR/multinomial-ordinal.944fe02295fd6cdf.webp similarity index 100% rename from translated_images/br/multinomial-ordinal.944fe02295fd6cdf.webp rename to translated_images/pt-BR/multinomial-ordinal.944fe02295fd6cdf.webp diff --git a/translated_images/br/multinomial-vs-ordinal.36701b4850e37d86.webp b/translated_images/pt-BR/multinomial-vs-ordinal.36701b4850e37d86.webp similarity index 100% rename from translated_images/br/multinomial-vs-ordinal.36701b4850e37d86.webp rename to translated_images/pt-BR/multinomial-vs-ordinal.36701b4850e37d86.webp diff --git a/translated_images/br/netron.a05f39410211915e.webp b/translated_images/pt-BR/netron.a05f39410211915e.webp similarity index 100% rename from translated_images/br/netron.a05f39410211915e.webp rename to translated_images/pt-BR/netron.a05f39410211915e.webp diff --git a/translated_images/br/notebook.4a3ee31f396b8832.webp b/translated_images/pt-BR/notebook.4a3ee31f396b8832.webp similarity index 100% rename from translated_images/br/notebook.4a3ee31f396b8832.webp rename to translated_images/pt-BR/notebook.4a3ee31f396b8832.webp diff --git a/translated_images/br/original.b2b15efe0ce92b87.webp b/translated_images/pt-BR/original.b2b15efe0ce92b87.webp similarity index 100% rename from translated_images/br/original.b2b15efe0ce92b87.webp rename to translated_images/pt-BR/original.b2b15efe0ce92b87.webp diff --git a/translated_images/br/overfitting.1c132d92bfd93cb6.webp b/translated_images/pt-BR/overfitting.1c132d92bfd93cb6.webp similarity index 100% rename from translated_images/br/overfitting.1c132d92bfd93cb6.webp rename to translated_images/pt-BR/overfitting.1c132d92bfd93cb6.webp diff --git a/translated_images/br/p&p.279f1c49ecd88941.webp b/translated_images/pt-BR/p&p.279f1c49ecd88941.webp similarity index 100% rename from translated_images/br/p&p.279f1c49ecd88941.webp rename to translated_images/pt-BR/p&p.279f1c49ecd88941.webp diff --git a/translated_images/br/parse.d0c5bbe1106eae8f.webp b/translated_images/pt-BR/parse.d0c5bbe1106eae8f.webp similarity index 100% rename from translated_images/br/parse.d0c5bbe1106eae8f.webp rename to translated_images/pt-BR/parse.d0c5bbe1106eae8f.webp diff --git a/translated_images/br/parsnip.cd2ce92622976502.webp b/translated_images/pt-BR/parsnip.cd2ce92622976502.webp similarity index 100% rename from translated_images/br/parsnip.cd2ce92622976502.webp rename to translated_images/pt-BR/parsnip.cd2ce92622976502.webp diff --git a/translated_images/br/peter.779730f9ba3a8a8d.webp b/translated_images/pt-BR/peter.779730f9ba3a8a8d.webp similarity index 100% rename from translated_images/br/peter.779730f9ba3a8a8d.webp rename to translated_images/pt-BR/peter.779730f9ba3a8a8d.webp diff --git a/translated_images/br/pie-pumpkins-scatter.d14f9804a53f927e.webp b/translated_images/pt-BR/pie-pumpkins-scatter.d14f9804a53f927e.webp similarity index 100% rename from translated_images/br/pie-pumpkins-scatter.d14f9804a53f927e.webp rename to translated_images/pt-BR/pie-pumpkins-scatter.d14f9804a53f927e.webp diff --git a/translated_images/br/pinch.1b035ec9ba7e0d40.webp b/translated_images/pt-BR/pinch.1b035ec9ba7e0d40.webp similarity index 100% rename from translated_images/br/pinch.1b035ec9ba7e0d40.webp rename to translated_images/pt-BR/pinch.1b035ec9ba7e0d40.webp diff --git a/translated_images/br/poly-results.ee587348f0f1f60b.webp b/translated_images/pt-BR/poly-results.ee587348f0f1f60b.webp similarity index 100% rename from translated_images/br/poly-results.ee587348f0f1f60b.webp rename to translated_images/pt-BR/poly-results.ee587348f0f1f60b.webp diff --git a/translated_images/br/polynomial.8fce4663e7283dfb.webp b/translated_images/pt-BR/polynomial.8fce4663e7283dfb.webp similarity index 100% rename from translated_images/br/polynomial.8fce4663e7283dfb.webp rename to translated_images/pt-BR/polynomial.8fce4663e7283dfb.webp diff --git a/translated_images/br/popular.9c48d84b3386705f.webp b/translated_images/pt-BR/popular.9c48d84b3386705f.webp similarity index 100% rename from translated_images/br/popular.9c48d84b3386705f.webp rename to translated_images/pt-BR/popular.9c48d84b3386705f.webp diff --git a/translated_images/br/price-by-variety.744a2f9925d9bcb4.webp b/translated_images/pt-BR/price-by-variety.744a2f9925d9bcb4.webp similarity index 100% rename from translated_images/br/price-by-variety.744a2f9925d9bcb4.webp rename to translated_images/pt-BR/price-by-variety.744a2f9925d9bcb4.webp diff --git a/translated_images/pt/.co-op-translator.json b/translated_images/pt/.co-op-translator.json deleted file mode 100644 index b0049db85..000000000 --- a/translated_images/pt/.co-op-translator.json +++ /dev/null @@ -1,920 +0,0 @@ -{ - "3.9b58fd8d6c373c20.webp": { - "original_hash": "2de21431c87bb9ebc9bf4ddcb3ba2bdd", - "translation_date": "2026-01-16T11:14:39+00:00", - "source_file": "images/3.png", - "language_code": "pt" - }, - "9-feature-importance.cd3193b4bba3fd4b.webp": { - "original_hash": "479e68fc76c6b6fc8cbc2b90eb2981e1", - "translation_date": "2026-01-16T11:29:16+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/9-feature-importance.png", - "language_code": "pt" - }, - "9-features-influence.3ead3d3f68a84029.webp": { - "original_hash": "7a522f0212ca4c9d15c9d3d9f01f86f5", - "translation_date": "2026-01-16T11:32:02+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/9-features-influence.png", - "language_code": "pt" - }, - "ROC.167a70519c5bf898.webp": { - "original_hash": "63e5567374ae1de1cd1e775dda7c81e9", - "translation_date": "2026-01-16T11:22:08+00:00", - "source_file": "2-Regression/4-Logistic/images/ROC.png", - "language_code": "pt" - }, - "ROC_2.777f20cdfc4988ca.webp": { - "original_hash": "7e020247ea2b610881d260a38315aeae", - "translation_date": "2026-01-16T11:22:50+00:00", - "source_file": "2-Regression/4-Logistic/images/ROC_2.png", - "language_code": "pt" - }, - "accessibility.c1be5ce816eaea65.webp": { - "original_hash": "ff169fe805ae6b4b0067443121c4c7ce", - "translation_date": "2026-01-16T11:18:04+00:00", - "source_file": "1-Introduction/3-fairness/images/accessibility.png", - "language_code": "pt" - }, - "accountability.41d8c0f4b85b6231.webp": { - "original_hash": "65e19795f4a18a0878133c71c8862c42", - "translation_date": "2026-01-16T11:17:48+00:00", - "source_file": "1-Introduction/3-fairness/images/accountability.png", - "language_code": "pt" - }, - "accuracy.2c47fe1bf15f44b3.webp": { - "original_hash": "f8fcd7ea58a80666ad22914c3c992c55", - "translation_date": "2026-01-16T11:37:53+00:00", - "source_file": "7-TimeSeries/2-ARIMA/images/accuracy.png", - "language_code": "pt" - }, - "ai-ml-ds.537ea441b124ebf6.webp": { - "original_hash": "22725868b26ca27e64c946ee025d45a3", - "translation_date": "2026-01-16T11:17:02+00:00", - "source_file": "1-Introduction/1-intro-to-ML/images/ai-ml-ds.png", - "language_code": "pt" - }, - "all-genres.1d56ef06cefbfcd6.webp": { - "original_hash": "b65f4a4412b6559b03529f10eb450c17", - "translation_date": "2026-01-16T11:27:17+00:00", - "source_file": "5-Clustering/1-Visualize/images/all-genres.png", - "language_code": "pt" - }, - "apple.c81c8d5965e5e5da.webp": { - "original_hash": "ed62bd6204e6efabc031ea19173bafb7", - "translation_date": "2026-01-16T11:37:11+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/apple.png", - "language_code": "pt" - }, - "barchart.a833ea9194346d76.webp": { - "original_hash": "49c21ba1929ad7ee26b6cd2fcf243929", - "translation_date": "2026-01-16T11:21:21+00:00", - "source_file": "2-Regression/2-Data/images/barchart.png", - "language_code": "pt" - }, - "bellman-equation.7c0c4c722e5a6b7c.webp": { - "original_hash": "7adc065a5ea494b45531f754c9b76469", - "translation_date": "2026-01-16T11:37:06+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/bellman-equation.png", - "language_code": "pt" - }, - "binary-multiclass.b56d0c86c81105a6.webp": { - "original_hash": "e1a17ceb5d6b5a8bb91bae9ca474cfb5", - "translation_date": "2026-01-16T11:34:09+00:00", - "source_file": "4-Classification/1-Introduction/images/binary-multiclass.png", - "language_code": "pt" - }, - "boxplots.8228c29dabd0f292.webp": { - "original_hash": "841ff52a90f91c88278604315d9cd6e5", - "translation_date": "2026-01-16T11:25:37+00:00", - "source_file": "5-Clustering/2-K-Means/images/boxplots.png", - "language_code": "pt" - }, - "calculation.a209813050a1ddb1.webp": { - "original_hash": "b2131ec1d3e6db2e2abd7bc8c699dbcf", - "translation_date": "2026-01-16T11:18:43+00:00", - "source_file": "2-Regression/3-Linear/images/calculation.png", - "language_code": "pt" - }, - "cartpole.b5609cc0494a14f7.webp": { - "original_hash": "5399242e127ea1c18aa6ee405daecf51", - "translation_date": "2026-01-16T11:36:54+00:00", - "source_file": "8-Reinforcement/2-Gym/images/cartpole.png", - "language_code": "pt" - }, - "centroid.097fde836cf6c918.webp": { - "original_hash": "c8f866ed446563d8e59087f1bca1f97d", - "translation_date": "2026-01-16T11:27:07+00:00", - "source_file": "5-Clustering/1-Visualize/images/centroid.png", - "language_code": "pt" - }, - "ceos.3de5d092ce8d2753.webp": { - "original_hash": "f403a92005c5f0c581fd27587dd69eb8", - "translation_date": "2026-01-16T11:29:28+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/ceos.png", - "language_code": "pt" - }, - "ceos.7a9a67871424a6c0.webp": { - "original_hash": "f403a92005c5f0c581fd27587dd69eb8", - "translation_date": "2026-01-16T11:17:52+00:00", - "source_file": "1-Introduction/3-fairness/images/ceos.png", - "language_code": "pt" - }, - "cf-what-if-features.5a92a6924da3e9b5.webp": { - "original_hash": "0cbbda81885b2341ee63ff33aaa4fff0", - "translation_date": "2026-01-16T11:32:45+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/cf-what-if-features.png", - "language_code": "pt" - }, - "cheatsheet.07a475ea444d2223.webp": { - "original_hash": "d4728a3bd3332576e35f206ee6ad3fbb", - "translation_date": "2026-01-16T11:36:50+00:00", - "source_file": "4-Classification/2-Classifiers-1/images/cheatsheet.png", - "language_code": "pt" - }, - "chess.e704a268781bdad8.webp": { - "original_hash": "5b6c7fdfb0b6262a3938b18cce2f4a2b", - "translation_date": "2026-01-16T11:27:27+00:00", - "source_file": "9-Real-World/images/chess.jpg", - "language_code": "pt" - }, - "chinese.e62cafa5309f111a.webp": { - "original_hash": "e7afddb049bc5e60e1594d3b0dd7e7c6", - "translation_date": "2026-01-16T11:34:12+00:00", - "source_file": "4-Classification/1-Introduction/images/chinese.png", - "language_code": "pt" - }, - "clusters.b635354640d8e4fd.webp": { - "original_hash": "1bf916ab2a323ca1ff9524b957d191d9", - "translation_date": "2026-01-16T11:24:58+00:00", - "source_file": "5-Clustering/2-K-Means/images/clusters.png", - "language_code": "pt" - }, - "comparison.edfab56193a85e7f.webp": { - "original_hash": "7f24bd09d9d7f8a13007c1028041fbf5", - "translation_date": "2026-01-16T11:36:35+00:00", - "source_file": "4-Classification/2-Classifiers-1/images/comparison.png", - "language_code": "pt" - }, - "comprehension.619708fc5959b0f6.webp": { - "original_hash": "199ba9874415c9ac69ab90ca0c7a5798", - "translation_date": "2026-01-16T11:24:29+00:00", - "source_file": "6-NLP/1-Introduction-to-NLP/images/comprehension.png", - "language_code": "pt" - }, - "confusion-matrix.3cc5496a1a37c3e4.webp": { - "original_hash": "4150f5e65462636d31a355fb8bacd710", - "translation_date": "2026-01-16T11:22:44+00:00", - "source_file": "2-Regression/4-Logistic/images/confusion-matrix.png", - "language_code": "pt" - }, - "correlation.a9356bb798f5eea5.webp": { - "original_hash": "2defd6b5fe95facd4a781f9622902c78", - "translation_date": "2026-01-16T11:26:29+00:00", - "source_file": "5-Clustering/1-Visualize/images/correlation.png", - "language_code": "pt" - }, - "counterfactuals-examples.b38a50a504ee0a9f.webp": { - "original_hash": "65fb9b98701cc42014f18aa998228333", - "translation_date": "2026-01-16T11:30:07+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/counterfactuals-examples.png", - "language_code": "pt" - }, - "cuisine-dist.d0cc2d551abe5c25.webp": { - "original_hash": "c513d1f6832ac06836e0c8c665c8354a", - "translation_date": "2026-01-16T11:34:04+00:00", - "source_file": "4-Classification/1-Introduction/images/cuisine-dist.png", - "language_code": "pt" - }, - "currency.e7429812bfc8c608.webp": { - "original_hash": "b5ebb401a6bea7c0ad8fa2d3f0fa1e18", - "translation_date": "2026-01-16T11:37:45+00:00", - "source_file": "7-TimeSeries/1-Introduction/images/currency.png", - "language_code": "pt" - }, - "data-visualization.54e56dded7c1a804.webp": { - "original_hash": "0978cd448f88701c82bc30537b17c1c5", - "translation_date": "2026-01-16T11:20:58+00:00", - "source_file": "2-Regression/2-Data/images/data-visualization.png", - "language_code": "pt" - }, - "dataanalysis-cover.8d6d0683a70a5c1e.webp": { - "original_hash": "6d92c827e7138869509118dccd983ccd", - "translation_date": "2026-01-16T11:33:03+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/dataanalysis-cover.png", - "language_code": "pt" - }, - "datapoints.aaf6815cd5d87354.webp": { - "original_hash": "5a9527dee26b9b255cc5b624dbb51919", - "translation_date": "2026-01-16T11:28:48+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/datapoints.png", - "language_code": "pt" - }, - "distribution.9be11df42356ca95.webp": { - "original_hash": "70424f77d27ac2c69e595ea8fdd3e28e", - "translation_date": "2026-01-16T11:26:58+00:00", - "source_file": "5-Clustering/1-Visualize/images/distribution.png", - "language_code": "pt" - }, - "dplyr_filter.b480b264b03439ff.webp": { - "original_hash": "e71fffc34b1e453f16d5b8e266f46aa2", - "translation_date": "2026-01-16T11:34:34+00:00", - "source_file": "4-Classification/1-Introduction/images/dplyr_filter.jpg", - "language_code": "pt" - }, - "dplyr_wrangling.f5f99c64fd4580f1.webp": { - "original_hash": "c9623f92bdbfdc2b68fcc8b8c28ec6d1", - "translation_date": "2026-01-16T11:21:16+00:00", - "source_file": "2-Regression/2-Data/images/dplyr_wrangling.png", - "language_code": "pt" - }, - "ea-error-cohort.6886209ea5d438c4.webp": { - "original_hash": "95030d8832d8931fb4e1ec6ecda699e6", - "translation_date": "2026-01-16T11:32:35+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/ea-error-cohort.png", - "language_code": "pt" - }, - "ea-error-distribution.117452e1177c1dd8.webp": { - "original_hash": "15823a9cd18a5ee815e7d6262bc6818f", - "translation_date": "2026-01-16T11:28:57+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/ea-error-distribution.png", - "language_code": "pt" - }, - "ea-heatmap.8d27185e28cee383.webp": { - "original_hash": "861a9ea52a5aa2841f4dbf9ba45c7900", - "translation_date": "2026-01-16T11:32:23+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/ea-heatmap.png", - "language_code": "pt" - }, - "elbow.72676169eed744ff.webp": { - "original_hash": "bb938c301c0b3fd5deec9f8b277b0506", - "translation_date": "2026-01-16T11:25:01+00:00", - "source_file": "5-Clustering/2-K-Means/images/elbow.png", - "language_code": "pt" - }, - "electric-grid.0c21d5214db09ffa.webp": { - "original_hash": "d3adac5039330761223c6e9299402b3a", - "translation_date": "2026-01-16T11:37:15+00:00", - "source_file": "7-TimeSeries/images/electric-grid.jpg", - "language_code": "pt" - }, - "eliza.84397454cda9559b.webp": { - "original_hash": "cf4cf518f649213e8970b1d08fbe6c77", - "translation_date": "2026-01-16T11:17:34+00:00", - "source_file": "1-Introduction/2-history-of-ML/images/eliza.png", - "language_code": "pt" - }, - "embedding.2cf8953c4b3101d1.webp": { - "original_hash": "1007c6219e1ce7d2a51becd0596a822a", - "translation_date": "2026-01-16T11:24:36+00:00", - "source_file": "6-NLP/2-Tasks/images/embedding.png", - "language_code": "pt" - }, - "encouRage.e75d5fe0367fb913.webp": { - "original_hash": "7dd96b2ba0df871e1553f743be58a0e5", - "translation_date": "2026-01-16T11:20:47+00:00", - "source_file": "2-Regression/1-Tools/images/encouRage.jpg", - "language_code": "pt" - }, - "energy-plot.5fdac3f397a910bc.webp": { - "original_hash": "ea7eb60322ee54196efdcac12d2313d5", - "translation_date": "2026-01-16T11:37:39+00:00", - "source_file": "7-TimeSeries/1-Introduction/images/energy-plot.png", - "language_code": "pt" - }, - "env_init.04e8f26d2d60089e.webp": { - "original_hash": "c98e0e9c3bd656f4518dcb94c1743f5d", - "translation_date": "2026-01-16T11:37:09+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/env_init.png", - "language_code": "pt" - }, - "environment.40ba3cb66256c93f.webp": { - "original_hash": "3b7f633735a7af2335c024eeb9ed1160", - "translation_date": "2026-01-16T11:37:08+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/environment.png", - "language_code": "pt" - }, - "escape.18862db9930337e3.webp": { - "original_hash": "992ff5365e7fb990b22e1cd8e421374f", - "translation_date": "2026-01-16T11:36:55+00:00", - "source_file": "8-Reinforcement/2-Gym/images/escape.png", - "language_code": "pt" - }, - "facetgrid.9b2e65ce707eba1f.webp": { - "original_hash": "8497ce8826ba4d381db1f9ed514dede2", - "translation_date": "2026-01-16T11:27:23+00:00", - "source_file": "5-Clustering/1-Visualize/images/facetgrid.png", - "language_code": "pt" - }, - "fairness.25d7c8ce9817272d.webp": { - "original_hash": "89c57b68363652950bfa4b8a3cae82c1", - "translation_date": "2026-01-16T11:30:30+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/fairness.png", - "language_code": "pt" - }, - "fairness.b9f9893a4e3dc28b.webp": { - "original_hash": "89c57b68363652950bfa4b8a3cae82c1", - "translation_date": "2026-01-16T11:18:01+00:00", - "source_file": "1-Introduction/3-fairness/images/fairness.png", - "language_code": "pt" - }, - "favicon.37b561214b36d454.webp": { - "original_hash": "228faa6584f8ba1f7e9a75e3200112e9", - "translation_date": "2026-01-16T11:14:25+00:00", - "source_file": "images/favicon.png", - "language_code": "pt" - }, - "flat-nonflat.d1c8c6e2a96110c1.webp": { - "original_hash": "73d6fedd799f48057e154a4e8ce42f93", - "translation_date": "2026-01-16T11:26:02+00:00", - "source_file": "5-Clustering/1-Visualize/images/flat-nonflat.png", - "language_code": "pt" - }, - "full-data-predict.4f0fed16a131c8f3.webp": { - "original_hash": "b9ad88a56a196b6b70ffbda06538bca4", - "translation_date": "2026-01-16T11:37:35+00:00", - "source_file": "7-TimeSeries/3-SVR/images/full-data-predict.png", - "language_code": "pt" - }, - "full-data.a82ec9957e580e97.webp": { - "original_hash": "e428351ccdd1d7019ab5c486385a0cb1", - "translation_date": "2026-01-16T11:37:25+00:00", - "source_file": "7-TimeSeries/3-SVR/images/full-data.png", - "language_code": "pt" - }, - "gender-bias-translate-en-tr.bfd87c45da23c085.webp": { - "original_hash": "3abc35f319aef1169941603df4db6fd0", - "translation_date": "2026-01-16T11:30:26+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/gender-bias-translate-en-tr.png", - "language_code": "pt" - }, - "gender-bias-translate-en-tr.f185fd8822c2d437.webp": { - "original_hash": "3abc35f319aef1169941603df4db6fd0", - "translation_date": "2026-01-16T11:17:57+00:00", - "source_file": "1-Introduction/3-fairness/images/gender-bias-translate-en-tr.png", - "language_code": "pt" - }, - "gender-bias-translate-tr-en.1f97568ba9e40e20.webp": { - "original_hash": "0e8aac544ac1089cd727075b6083639f", - "translation_date": "2026-01-16T11:28:14+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/gender-bias-translate-tr-en.png", - "language_code": "pt" - }, - "gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp": { - "original_hash": "0e8aac544ac1089cd727075b6083639f", - "translation_date": "2026-01-16T11:17:45+00:00", - "source_file": "1-Introduction/3-fairness/images/gender-bias-translate-tr-en.png", - "language_code": "pt" - }, - "globe.59f26379ceb40428.webp": { - "original_hash": "843aa34b1b65eb8ab23f8a7476b7dcd0", - "translation_date": "2026-01-16T11:16:59+00:00", - "source_file": "1-Introduction/images/globe.jpg", - "language_code": "pt" - }, - "grid.464370ad00f3696c.webp": { - "original_hash": "79d757e96813e70fbf7844b23dae96bc", - "translation_date": "2026-01-16T11:22:28+00:00", - "source_file": "2-Regression/4-Logistic/images/grid.png", - "language_code": "pt" - }, - "heatmap.39952045da50b4eb.webp": { - "original_hash": "a62eb0069cc21d495828469ea2d0b506", - "translation_date": "2026-01-16T11:19:41+00:00", - "source_file": "2-Regression/3-Linear/images/heatmap.png", - "language_code": "pt" - }, - "hierarchical.bf59403aa43c8c47.webp": { - "original_hash": "50b9bc3298659c463ae76564ca645b12", - "translation_date": "2026-01-16T11:26:49+00:00", - "source_file": "5-Clustering/1-Visualize/images/hierarchical.png", - "language_code": "pt" - }, - "human.e3840390a2ab7690.webp": { - "original_hash": "2779edce282e49929804dec71636094e", - "translation_date": "2026-01-16T11:37:04+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/human.png", - "language_code": "pt" - }, - "hype.07183d711a17aafe.webp": { - "original_hash": "fdd8cab17e681e45c4fe2647eb58bdb9", - "translation_date": "2026-01-16T11:17:10+00:00", - "source_file": "1-Introduction/1-intro-to-ML/images/hype.png", - "language_code": "pt" - }, - "indian.2c4292002af1a1f9.webp": { - "original_hash": "9d396f43a0af642a695b6651bff475af", - "translation_date": "2026-01-16T11:34:06+00:00", - "source_file": "4-Classification/1-Introduction/images/indian.png", - "language_code": "pt" - }, - "individual-causal-what-if.00e7b86b52a083ce.webp": { - "original_hash": "535a0ad1507648542f43293e101eecb6", - "translation_date": "2026-01-16T11:31:31+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/individual-causal-what-if.png", - "language_code": "pt" - }, - "jack-o-lanterns.181c661a9212457d.webp": { - "original_hash": "3f6f70bd9fcfd9f85c229fdbbeef8a4a", - "translation_date": "2026-01-16T11:18:05+00:00", - "source_file": "2-Regression/images/jack-o-lanterns.jpg", - "language_code": "pt" - }, - "janitor.e4a77dd3d3e6a32e.webp": { - "original_hash": "8e34c6515b5a664c4485bed85ace536e", - "translation_date": "2026-01-16T11:18:30+00:00", - "source_file": "2-Regression/3-Linear/images/janitor.jpg", - "language_code": "pt" - }, - "japanese.30260486f2a05c46.webp": { - "original_hash": "2341f1b464ca87b44d9a1a8581a60068", - "translation_date": "2026-01-16T11:34:44+00:00", - "source_file": "4-Classification/1-Introduction/images/japanese.png", - "language_code": "pt" - }, - "july-2014.9e1f7c318ec6d5b3.webp": { - "original_hash": "7bee9739087aee3ce5b7157cb92cc043", - "translation_date": "2026-01-16T11:37:48+00:00", - "source_file": "7-TimeSeries/1-Introduction/images/july-2014.png", - "language_code": "pt" - }, - "korean.4a4f0274f3d9805a.webp": { - "original_hash": "9863922b50bccb4f12b2036825a49a5b", - "translation_date": "2026-01-16T11:33:15+00:00", - "source_file": "4-Classification/1-Introduction/images/korean.png", - "language_code": "pt" - }, - "learned.ed28bcd8484b5287.webp": { - "original_hash": "084d4af7881e5b990b53dd562a0aca6e", - "translation_date": "2026-01-16T11:37:13+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/learned.png", - "language_code": "pt" - }, - "linear-polynomial.5523c7cb6576ccab.webp": { - "original_hash": "1b810c7c5447242163be60624c06bf97", - "translation_date": "2026-01-16T11:20:09+00:00", - "source_file": "2-Regression/3-Linear/images/linear-polynomial.png", - "language_code": "pt" - }, - "linear-results.f7c3552c85b0ed1c.webp": { - "original_hash": "3f6827091179dabc363a4327e4f824fe", - "translation_date": "2026-01-16T11:18:46+00:00", - "source_file": "2-Regression/3-Linear/images/linear-results.png", - "language_code": "pt" - }, - "linear-vs-logistic.ba180bf95e7ee667.webp": { - "original_hash": "96759faebbd1f2a900347a266e140c4d", - "translation_date": "2026-01-16T11:21:51+00:00", - "source_file": "2-Regression/4-Logistic/images/linear-vs-logistic.png", - "language_code": "pt" - }, - "linear.a1b0760a56132551.webp": { - "original_hash": "0bc5432c73d2c073cab1b85d8279ff44", - "translation_date": "2026-01-16T11:20:22+00:00", - "source_file": "2-Regression/3-Linear/images/linear.png", - "language_code": "pt" - }, - "lobe.2fa0806408ef9923.webp": { - "original_hash": "e6ec71dbe350aef39135dbf88bc89163", - "translation_date": "2026-01-16T11:24:10+00:00", - "source_file": "3-Web-App/1-Web-App/images/lobe.png", - "language_code": "pt" - }, - "logistic-linear.0f2f6bb73b3134c1.webp": { - "original_hash": "7069c082c288ac778688382b8f817d12", - "translation_date": "2026-01-16T11:23:43+00:00", - "source_file": "2-Regression/4-Logistic/images/logistic-linear.png", - "language_code": "pt" - }, - "logistic.b0cba6b7db4d5789.webp": { - "original_hash": "9794c53dc6a7c7c197cf4e308d45cfe8", - "translation_date": "2026-01-16T11:22:05+00:00", - "source_file": "2-Regression/4-Logistic/images/logistic.png", - "language_code": "pt" - }, - "lpathlen.94f211521ed60940.webp": { - "original_hash": "ac846488f72765b30a11fb5044342021", - "translation_date": "2026-01-16T11:37:02+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/lpathlen.png", - "language_code": "pt" - }, - "lpathlen1.0534784add58d4eb.webp": { - "original_hash": "2c699a343a0253fcf0024de108d45266", - "translation_date": "2026-01-16T11:37:10+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/lpathlen1.png", - "language_code": "pt" - }, - "map.e963a6a51349425a.webp": { - "original_hash": "d8d479d57d050e32c1d77bb859d61ce2", - "translation_date": "2026-01-16T11:35:23+00:00", - "source_file": "4-Classification/3-Classifiers-2/images/map.png", - "language_code": "pt" - }, - "mape.fd87bbaf4d346846.webp": { - "original_hash": "cdc81fd2d2ffdbc2f8c10d75c954cb74", - "translation_date": "2026-01-16T11:37:56+00:00", - "source_file": "7-TimeSeries/2-ARIMA/images/mape.png", - "language_code": "pt" - }, - "ml-fairness.ef296ebec6afc98a.webp": { - "original_hash": "bceb2f96ebd4940cfddce42307d5e4a9", - "translation_date": "2026-01-16T11:14:59+00:00", - "source_file": "sketchnotes/ml-fairness.png", - "language_code": "pt" - }, - "ml-for-beginners-video-banner.63f694a100034bc6.webp": { - "original_hash": "2ee5851fdd14fb777163c9dfef721412", - "translation_date": "2026-01-16T11:14:31+00:00", - "source_file": "images/ml-for-beginners-video-banner.png", - "language_code": "pt" - }, - "ml-for-beginners.9eecb963dbfbfb32.webp": { - "original_hash": "168efdbeb98bec4da0e91cf8acf77dfe", - "translation_date": "2026-01-16T11:14:28+00:00", - "source_file": "images/ml-for-beginners.png", - "language_code": "pt" - }, - "ml-history.a1bdfd4ce1f464d9.webp": { - "original_hash": "2fe022d2dd04763788b2a5a8ad71fb1f", - "translation_date": "2026-01-16T11:16:50+00:00", - "source_file": "sketchnotes/ml-history.png", - "language_code": "pt" - }, - "ml-realworld.26ee274671615577.webp": { - "original_hash": "3f43444e6254753eb5f23de7f52b2745", - "translation_date": "2026-01-16T11:15:44+00:00", - "source_file": "sketchnotes/ml-realworld.png", - "language_code": "pt" - }, - "ml-regression.4e4f70e3b3ed446e.webp": { - "original_hash": "c9bf1c0fe00e48262b884a679c612372", - "translation_date": "2026-01-16T11:15:19+00:00", - "source_file": "sketchnotes/ml-regression.png", - "language_code": "pt" - }, - "ml-reinforcement.94024374d63348db.webp": { - "original_hash": "c3b55d97bb8edd97fbff43767fb4c563", - "translation_date": "2026-01-16T11:16:08+00:00", - "source_file": "sketchnotes/ml-reinforcement.png", - "language_code": "pt" - }, - "ml-timeseries.fb98d25f1013fc0c.webp": { - "original_hash": "03443e1e03edffd1a9c8c605903c4e84", - "translation_date": "2026-01-16T11:16:27+00:00", - "source_file": "sketchnotes/ml-timeseries.png", - "language_code": "pt" - }, - "model-overview-dataset-cohorts.dfa463fb527a35a0.webp": { - "original_hash": "5ba7caa265cee1ff9a7072a4f94e890d", - "translation_date": "2026-01-16T11:30:48+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/model-overview-dataset-cohorts.png", - "language_code": "pt" - }, - "model-overview-feature-cohorts.c5104d575ffd0c80.webp": { - "original_hash": "d2b187b7d1ec4bdcd8c985283d54f8e4", - "translation_date": "2026-01-16T11:27:57+00:00", - "source_file": "9-Real-World/2-Debugging-ML-Models/images/model-overview-feature-cohorts.png", - "language_code": "pt" - }, - "monnaie.606c5fa8369d5c3b.webp": { - "original_hash": "8eb6b1ab4f94ed2f98059f68ebafc014", - "translation_date": "2026-01-16T11:24:25+00:00", - "source_file": "6-NLP/3-Translation-Sentiment/images/monnaie.png", - "language_code": "pt" - }, - "mountaincar.43d56e588ce581c2.webp": { - "original_hash": "61c868cc389dc92bd2b402ea490cd162", - "translation_date": "2026-01-16T11:36:59+00:00", - "source_file": "8-Reinforcement/2-Gym/images/mountaincar.png", - "language_code": "pt" - }, - "multinomial-ordinal.944fe02295fd6cdf.webp": { - "original_hash": "c7ccca072d30b5d4b75255a67ddae654", - "translation_date": "2026-01-16T11:21:42+00:00", - "source_file": "2-Regression/4-Logistic/images/multinomial-ordinal.png", - "language_code": "pt" - }, - "multinomial-vs-ordinal.36701b4850e37d86.webp": { - "original_hash": "f073e94529a3648f2231cdce2cbab8b4", - "translation_date": "2026-01-16T11:21:30+00:00", - "source_file": "2-Regression/4-Logistic/images/multinomial-vs-ordinal.png", - "language_code": "pt" - }, - "netron.a05f39410211915e.webp": { - "original_hash": "c2b192971dd35d1f9297037e3d9cf2c1", - "translation_date": "2026-01-16T11:35:42+00:00", - "source_file": "4-Classification/4-Applied/images/netron.png", - "language_code": "pt" - }, - "notebook.4a3ee31f396b8832.webp": { - "original_hash": "53ed9e8157acd2742be1840e5d9c69ab", - "translation_date": "2026-01-16T11:20:29+00:00", - "source_file": "2-Regression/1-Tools/images/notebook.jpg", - "language_code": "pt" - }, - "original.b2b15efe0ce92b87.webp": { - "original_hash": "6dc5968069b296588e723b0f62f7cb39", - "translation_date": "2026-01-16T11:37:59+00:00", - "source_file": "7-TimeSeries/2-ARIMA/images/original.png", - "language_code": "pt" - }, - "overfitting.1c132d92bfd93cb6.webp": { - "original_hash": "e9d1a3d88cf81abd87b93ba3cae6f3b1", - "translation_date": "2026-01-16T11:17:41+00:00", - "source_file": "1-Introduction/4-techniques-of-ML/images/overfitting.png", - "language_code": "pt" - }, - "p&p.279f1c49ecd88941.webp": { - "original_hash": "9896259959fc22aeeb0c5e0d6e0154a7", - "translation_date": "2026-01-16T11:24:21+00:00", - "source_file": "6-NLP/images/p&p.jpg", - "language_code": "pt" - }, - "parse.d0c5bbe1106eae8f.webp": { - "original_hash": "322098f5a3769e96c7a60b16ad9d02b3", - "translation_date": "2026-01-16T11:24:40+00:00", - "source_file": "6-NLP/2-Tasks/images/parse.png", - "language_code": "pt" - }, - "parsnip.cd2ce92622976502.webp": { - "original_hash": "898a910cf3763544400593dac6a92389", - "translation_date": "2026-01-16T11:35:57+00:00", - "source_file": "4-Classification/2-Classifiers-1/images/parsnip.jpg", - "language_code": "pt" - }, - "peter.779730f9ba3a8a8d.webp": { - "original_hash": "dd4a8cb8e3eb15c467a08d45fade443a", - "translation_date": "2026-01-16T11:36:54+00:00", - "source_file": "8-Reinforcement/images/peter.png", - "language_code": "pt" - }, - "pie-pumpkins-scatter.d14f9804a53f927e.webp": { - "original_hash": "2475f9d321d752ada7e5f431fe59f9e9", - "translation_date": "2026-01-16T11:19:51+00:00", - "source_file": "2-Regression/3-Linear/images/pie-pumpkins-scatter.png", - "language_code": "pt" - }, - "pinch.1b035ec9ba7e0d40.webp": { - "original_hash": "18f413d7670738c758fee477886c7759", - "translation_date": "2026-01-16T11:34:19+00:00", - "source_file": "4-Classification/1-Introduction/images/pinch.png", - "language_code": "pt" - }, - "poly-results.ee587348f0f1f60b.webp": { - "original_hash": "e69be7266860f3cae8c750a35e160493", - "translation_date": "2026-01-16T11:19:53+00:00", - "source_file": "2-Regression/3-Linear/images/poly-results.png", - "language_code": "pt" - }, - "polynomial.8fce4663e7283dfb.webp": { - "original_hash": "7df902a6d0b81a28de48a330b3b4aa76", - "translation_date": "2026-01-16T11:18:11+00:00", - "source_file": "2-Regression/3-Linear/images/polynomial.png", - "language_code": "pt" - }, - "popular.9c48d84b3386705f.webp": { - "original_hash": "178fa011a311e1411a3750428b0525a7", - "translation_date": "2026-01-16T11:27:13+00:00", - "source_file": "5-Clustering/1-Visualize/images/popular.png", - "language_code": "pt" - }, - "price-by-variety.744a2f9925d9bcb4.webp": { - "original_hash": "80b85163de4d24d4d0bf67ff0d9b2309", - "translation_date": "2026-01-16T11:19:59+00:00", - "source_file": "2-Regression/3-Linear/images/price-by-variety.png", - "language_code": "pt" - }, - "problems.f7fb539ccd80608e.webp": { - "original_hash": "d3605f6f944d3a7a5390490be3a94186", - "translation_date": "2026-01-16T11:24:52+00:00", - "source_file": "5-Clustering/2-K-Means/images/problems.png", - "language_code": "pt" - }, - "pumpkin-classifier.562771f104ad5436.webp": { - "original_hash": "9b4b4ac420310c1c6f70835f8f039666", - "translation_date": "2026-01-16T11:22:01+00:00", - "source_file": "2-Regression/4-Logistic/images/pumpkin-classifier.png", - "language_code": "pt" - }, - "pumpkins_catplot_1.c55c409b71fea2ec.webp": { - "original_hash": "21156df8979d98c866269dca8da8f884", - "translation_date": "2026-01-16T11:23:18+00:00", - "source_file": "2-Regression/4-Logistic/images/pumpkins_catplot_1.png", - "language_code": "pt" - }, - "pumpkins_catplot_2.87a354447880b388.webp": { - "original_hash": "64c425c52a46eef297def367d169d32a", - "translation_date": "2026-01-16T11:23:06+00:00", - "source_file": "2-Regression/4-Logistic/images/pumpkins_catplot_2.png", - "language_code": "pt" - }, - "r_learners_sm.cd14eb3581a9f28d.webp": { - "original_hash": "837c804617ba17f341a8ed2db93105d5", - "translation_date": "2026-01-16T11:34:16+00:00", - "source_file": "4-Classification/1-Introduction/images/r_learners_sm.jpeg", - "language_code": "pt" - }, - "r_learners_sm.e25fa9c205b3a3f9.webp": { - "original_hash": "837c804617ba17f341a8ed2db93105d5", - "translation_date": "2026-01-16T11:23:28+00:00", - "source_file": "2-Regression/4-Logistic/images/r_learners_sm.jpeg", - "language_code": "pt" - }, - "r_learners_sm.e4a71b113ffbedfe.webp": { - "original_hash": "837c804617ba17f341a8ed2db93105d5", - "translation_date": "2026-01-16T11:25:04+00:00", - "source_file": "5-Clustering/2-K-Means/images/r_learners_sm.jpeg", - "language_code": "pt" - }, - "r_learners_sm.f9199f76f1e2e493.webp": { - "original_hash": "837c804617ba17f341a8ed2db93105d5", - "translation_date": "2026-01-16T11:35:38+00:00", - "source_file": "4-Classification/3-Classifiers-2/images/r_learners_sm.jpeg", - "language_code": "pt" - }, - "recipes.186acfa8ed2e8f00.webp": { - "original_hash": "925552a21bb3687dfd83bb25010273f9", - "translation_date": "2026-01-16T11:33:48+00:00", - "source_file": "4-Classification/1-Introduction/images/recipes.png", - "language_code": "pt" - }, - "recipes.9ad10d8a4056bf89.webp": { - "original_hash": "925552a21bb3687dfd83bb25010273f9", - "translation_date": "2026-01-16T11:19:16+00:00", - "source_file": "2-Regression/3-Linear/images/recipes.png", - "language_code": "pt" - }, - "scaled.91897dfbaa26ca4a.webp": { - "original_hash": "789c70fafe6f6dd6e377a90b66e7d740", - "translation_date": "2026-01-16T11:37:42+00:00", - "source_file": "7-TimeSeries/1-Introduction/images/scaled.png", - "language_code": "pt" - }, - "scaled.e35258ca5cd3d43f.webp": { - "original_hash": "789c70fafe6f6dd6e377a90b66e7d740", - "translation_date": "2026-01-16T11:37:50+00:00", - "source_file": "7-TimeSeries/2-ARIMA/images/scaled.png", - "language_code": "pt" - }, - "scatter-dayofyear-color.65790faefbb9d54f.webp": { - "original_hash": "57a573b7b038fddf7793cc520baa2ecd", - "translation_date": "2026-01-16T11:19:56+00:00", - "source_file": "2-Regression/3-Linear/images/scatter-dayofyear-color.png", - "language_code": "pt" - }, - "scatter-dayofyear.bc171c189c9fd553.webp": { - "original_hash": "0dfbd93772844f3b564fefa1750f1f1a", - "translation_date": "2026-01-16T11:20:15+00:00", - "source_file": "2-Regression/3-Linear/images/scatter-dayofyear.png", - "language_code": "pt" - }, - "scatterplot.ad8b356bcbb33be6.webp": { - "original_hash": "3957c7a107594dadc4758bb3ce04857d", - "translation_date": "2026-01-16T11:20:35+00:00", - "source_file": "2-Regression/1-Tools/images/scatterplot.png", - "language_code": "pt" - }, - "scatterplot.b6868f44cbd2051c.webp": { - "original_hash": "be95a93bbe7e5ef894f0cc2a9165b524", - "translation_date": "2026-01-16T11:21:09+00:00", - "source_file": "2-Regression/2-Data/images/scatterplot.png", - "language_code": "pt" - }, - "shakey.4dc17819c447c05b.webp": { - "original_hash": "c1d741be4627f3e75ea5ee912f5896e6", - "translation_date": "2026-01-16T11:17:18+00:00", - "source_file": "1-Introduction/2-history-of-ML/images/shakey.jpg", - "language_code": "pt" - }, - "sigmoid.8b7ba9d095c789cf.webp": { - "original_hash": "93e362a78005d1964a4a108887df6f65", - "translation_date": "2026-01-16T11:21:35+00:00", - "source_file": "2-Regression/4-Logistic/images/sigmoid.png", - "language_code": "pt" - }, - "slope.f3c9d5910ddbfcf9.webp": { - "original_hash": "d81920219716f4765a0208ea6d035ec7", - "translation_date": "2026-01-16T11:19:48+00:00", - "source_file": "2-Regression/3-Linear/images/slope.png", - "language_code": "pt" - }, - "solvers.5fc648618529e627.webp": { - "original_hash": "f792b31c558c35d791f54218c114f11a", - "translation_date": "2026-01-16T11:36:13+00:00", - "source_file": "4-Classification/2-Classifiers-1/images/solvers.png", - "language_code": "pt" - }, - "svm.621ae7b516d678e0.webp": { - "original_hash": "ce775a75b8ab37b61869cbb31dc76289", - "translation_date": "2026-01-16T11:34:51+00:00", - "source_file": "4-Classification/3-Classifiers-2/images/svm.png", - "language_code": "pt" - }, - "swarm.56d253ae80a2c0f5.webp": { - "original_hash": "fe1af9f5ac979ea7316753ac7559aaaf", - "translation_date": "2026-01-16T11:22:41+00:00", - "source_file": "2-Regression/4-Logistic/images/swarm.png", - "language_code": "pt" - }, - "swarm_2.efeacfca536c2b57.webp": { - "original_hash": "734f5d0884220257ff5c7f7e1f6faed2", - "translation_date": "2026-01-16T11:23:31+00:00", - "source_file": "2-Regression/4-Logistic/images/swarm_2.png", - "language_code": "pt" - }, - "test-data-predict.8afc47ee7e52874f.webp": { - "original_hash": "d9de9b2f4cc312cf745b00a1c3344579", - "translation_date": "2026-01-16T11:37:22+00:00", - "source_file": "7-TimeSeries/3-SVR/images/test-data-predict.png", - "language_code": "pt" - }, - "thai-food.c47a7a7f9f05c218.webp": { - "original_hash": "d3881195db88ba1cc9fd217f30415da6", - "translation_date": "2026-01-16T11:33:12+00:00", - "source_file": "4-Classification/images/thai-food.jpg", - "language_code": "pt" - }, - "thai.0269dbab2e78bd38.webp": { - "original_hash": "e2b3c8115e57ff80b2c950d3c783e2cf", - "translation_date": "2026-01-16T11:33:18+00:00", - "source_file": "4-Classification/1-Introduction/images/thai.png", - "language_code": "pt" - }, - "tokenization.1641a160c66cd2d9.webp": { - "original_hash": "568ebd0acfd2a2712e97c2efb889b5b9", - "translation_date": "2026-01-16T11:24:32+00:00", - "source_file": "6-NLP/2-Tasks/images/tokenization.png", - "language_code": "pt" - }, - "train-data-predict.3c4ef4e78553104f.webp": { - "original_hash": "8f901e721ed63b25087154a88980eb8c", - "translation_date": "2026-01-16T11:37:18+00:00", - "source_file": "7-TimeSeries/3-SVR/images/train-data-predict.png", - "language_code": "pt" - }, - "train-test.8928d14e5b91fc94.webp": { - "original_hash": "86bac92c99563659e1acb31bb50bb4e4", - "translation_date": "2026-01-16T11:38:02+00:00", - "source_file": "7-TimeSeries/2-ARIMA/images/train-test.png", - "language_code": "pt" - }, - "train-test.ead0cecbfc341921.webp": { - "original_hash": "56b4e7e0f3e4bcabfc70dd34c86778ad", - "translation_date": "2026-01-16T11:37:29+00:00", - "source_file": "7-TimeSeries/3-SVR/images/train-test.png", - "language_code": "pt" - }, - "train_progress_raw.2adfdf2daea09c59.webp": { - "original_hash": "6b053943a2e7d2b4d7d65460517e854a", - "translation_date": "2026-01-16T11:37:01+00:00", - "source_file": "8-Reinforcement/2-Gym/images/train_progress_raw.png", - "language_code": "pt" - }, - "train_progress_runav.c71694a8fa9ab359.webp": { - "original_hash": "4e4c78e37e5b80687dd1d8452fd8ce78", - "translation_date": "2026-01-16T11:36:57+00:00", - "source_file": "8-Reinforcement/2-Gym/images/train_progress_runav.png", - "language_code": "pt" - }, - "turntable.f2b86b13c53302dc.webp": { - "original_hash": "02aa654944ce0872a2a6b41ad6f8bae2", - "translation_date": "2026-01-16T11:24:42+00:00", - "source_file": "5-Clustering/images/turntable.jpg", - "language_code": "pt" - }, - "ufo.9e787f5161da9d4d.webp": { - "original_hash": "99f743b68eb93ed8c683c0f78ac1a180", - "translation_date": "2026-01-16T11:23:53+00:00", - "source_file": "3-Web-App/images/ufo.jpg", - "language_code": "pt" - }, - "unruly_data.0eedc7ced92d2d91.webp": { - "original_hash": "a4a8c088eb459adbbae497322c640811", - "translation_date": "2026-01-16T11:21:03+00:00", - "source_file": "2-Regression/2-Data/images/unruly_data.jpg", - "language_code": "pt" - }, - "violin.ffceb68923177011.webp": { - "original_hash": "6552159e8ea391bd6d60d1ee0ee0a40b", - "translation_date": "2026-01-16T11:23:22+00:00", - "source_file": "2-Regression/4-Logistic/images/violin.png", - "language_code": "pt" - }, - "voronoi.1dc1613fb0439b95.webp": { - "original_hash": "561aedc2bbfa5e0af9f4e1b1d5df00a1", - "translation_date": "2026-01-16T11:24:59+00:00", - "source_file": "5-Clustering/2-K-Means/images/voronoi.png", - "language_code": "pt" - }, - "web-app.4c76450cabe20036.webp": { - "original_hash": "cbede42b607bbb5910e9a4faf778225c", - "translation_date": "2026-01-16T11:35:48+00:00", - "source_file": "4-Classification/4-Applied/images/web-app.png", - "language_code": "pt" - }, - "wolf.a56d3d4070ca0c79.webp": { - "original_hash": "36a8284655906f6a4e5c4aaa06671da4", - "translation_date": "2026-01-16T11:37:03+00:00", - "source_file": "8-Reinforcement/1-QLearning/images/wolf.png", - "language_code": "pt" - } -} \ No newline at end of file diff --git a/translated_images/pt/3.9b58fd8d6c373c20.webp b/translated_images/pt/3.9b58fd8d6c373c20.webp deleted file mode 100644 index 07f3bff08..000000000 Binary files a/translated_images/pt/3.9b58fd8d6c373c20.webp and /dev/null differ diff --git a/translated_images/pt/9-feature-importance.cd3193b4bba3fd4b.webp b/translated_images/pt/9-feature-importance.cd3193b4bba3fd4b.webp deleted file mode 100644 index 44cc3e22f..000000000 Binary files a/translated_images/pt/9-feature-importance.cd3193b4bba3fd4b.webp and /dev/null differ diff --git a/translated_images/pt/9-features-influence.3ead3d3f68a84029.webp b/translated_images/pt/9-features-influence.3ead3d3f68a84029.webp deleted file mode 100644 index a4129e8d7..000000000 Binary files a/translated_images/pt/9-features-influence.3ead3d3f68a84029.webp and /dev/null differ diff --git a/translated_images/pt/ROC.167a70519c5bf898.webp b/translated_images/pt/ROC.167a70519c5bf898.webp deleted file mode 100644 index 5151eafbd..000000000 Binary files a/translated_images/pt/ROC.167a70519c5bf898.webp and /dev/null differ diff --git a/translated_images/pt/ROC_2.777f20cdfc4988ca.webp b/translated_images/pt/ROC_2.777f20cdfc4988ca.webp deleted file mode 100644 index b78162f15..000000000 Binary files a/translated_images/pt/ROC_2.777f20cdfc4988ca.webp and /dev/null differ diff --git a/translated_images/pt/accessibility.c1be5ce816eaea65.webp b/translated_images/pt/accessibility.c1be5ce816eaea65.webp deleted file mode 100644 index 19c748f83..000000000 Binary files a/translated_images/pt/accessibility.c1be5ce816eaea65.webp and /dev/null differ diff --git a/translated_images/pt/accountability.41d8c0f4b85b6231.webp b/translated_images/pt/accountability.41d8c0f4b85b6231.webp deleted file mode 100644 index 061eed1d7..000000000 Binary files a/translated_images/pt/accountability.41d8c0f4b85b6231.webp and /dev/null differ diff --git a/translated_images/pt/accuracy.2c47fe1bf15f44b3.webp b/translated_images/pt/accuracy.2c47fe1bf15f44b3.webp deleted file mode 100644 index 39b918898..000000000 Binary files a/translated_images/pt/accuracy.2c47fe1bf15f44b3.webp and /dev/null differ diff --git a/translated_images/pt/ai-ml-ds.537ea441b124ebf6.webp b/translated_images/pt/ai-ml-ds.537ea441b124ebf6.webp deleted file mode 100644 index e33e38c17..000000000 Binary files a/translated_images/pt/ai-ml-ds.537ea441b124ebf6.webp and /dev/null differ diff --git a/translated_images/pt/all-genres.1d56ef06cefbfcd6.webp b/translated_images/pt/all-genres.1d56ef06cefbfcd6.webp deleted file mode 100644 index 2e487a77e..000000000 Binary files a/translated_images/pt/all-genres.1d56ef06cefbfcd6.webp and /dev/null differ diff --git a/translated_images/pt/apple.c81c8d5965e5e5da.webp b/translated_images/pt/apple.c81c8d5965e5e5da.webp deleted file mode 100644 index b2217e923..000000000 Binary files a/translated_images/pt/apple.c81c8d5965e5e5da.webp and /dev/null differ diff --git a/translated_images/pt/barchart.a833ea9194346d76.webp b/translated_images/pt/barchart.a833ea9194346d76.webp deleted file mode 100644 index 11cd1cb6d..000000000 Binary files a/translated_images/pt/barchart.a833ea9194346d76.webp and /dev/null differ diff --git a/translated_images/pt/bellman-equation.7c0c4c722e5a6b7c.webp b/translated_images/pt/bellman-equation.7c0c4c722e5a6b7c.webp deleted file mode 100644 index f3c61b632..000000000 Binary files a/translated_images/pt/bellman-equation.7c0c4c722e5a6b7c.webp and /dev/null differ diff --git a/translated_images/pt/binary-multiclass.b56d0c86c81105a6.webp b/translated_images/pt/binary-multiclass.b56d0c86c81105a6.webp deleted file mode 100644 index 341412524..000000000 Binary files a/translated_images/pt/binary-multiclass.b56d0c86c81105a6.webp and /dev/null differ diff --git a/translated_images/pt/boxplots.8228c29dabd0f292.webp b/translated_images/pt/boxplots.8228c29dabd0f292.webp deleted file mode 100644 index 24a5f7c4a..000000000 Binary files a/translated_images/pt/boxplots.8228c29dabd0f292.webp and /dev/null differ diff --git a/translated_images/pt/calculation.a209813050a1ddb1.webp b/translated_images/pt/calculation.a209813050a1ddb1.webp deleted file mode 100644 index 224d8742f..000000000 Binary files a/translated_images/pt/calculation.a209813050a1ddb1.webp and /dev/null differ diff --git a/translated_images/pt/cartpole.b5609cc0494a14f7.webp b/translated_images/pt/cartpole.b5609cc0494a14f7.webp deleted file mode 100644 index 848d3ee7b..000000000 Binary files a/translated_images/pt/cartpole.b5609cc0494a14f7.webp and /dev/null differ diff --git a/translated_images/pt/centroid.097fde836cf6c918.webp b/translated_images/pt/centroid.097fde836cf6c918.webp deleted file mode 100644 index 92c904199..000000000 Binary files a/translated_images/pt/centroid.097fde836cf6c918.webp and /dev/null differ diff --git a/translated_images/pt/ceos.3de5d092ce8d2753.webp b/translated_images/pt/ceos.3de5d092ce8d2753.webp deleted file mode 100644 index d212b0f27..000000000 Binary files a/translated_images/pt/ceos.3de5d092ce8d2753.webp and /dev/null differ diff --git a/translated_images/pt/ceos.7a9a67871424a6c0.webp b/translated_images/pt/ceos.7a9a67871424a6c0.webp deleted file mode 100644 index d212b0f27..000000000 Binary files a/translated_images/pt/ceos.7a9a67871424a6c0.webp and /dev/null differ diff --git a/translated_images/pt/cf-what-if-features.5a92a6924da3e9b5.webp b/translated_images/pt/cf-what-if-features.5a92a6924da3e9b5.webp deleted file mode 100644 index 2f63a0721..000000000 Binary files a/translated_images/pt/cf-what-if-features.5a92a6924da3e9b5.webp and /dev/null differ diff --git a/translated_images/pt/cheatsheet.07a475ea444d2223.webp b/translated_images/pt/cheatsheet.07a475ea444d2223.webp deleted file mode 100644 index 68b698898..000000000 Binary files a/translated_images/pt/cheatsheet.07a475ea444d2223.webp and /dev/null differ diff --git a/translated_images/pt/chess.e704a268781bdad8.webp b/translated_images/pt/chess.e704a268781bdad8.webp deleted file mode 100644 index 03d0850d8..000000000 Binary files a/translated_images/pt/chess.e704a268781bdad8.webp and /dev/null differ diff --git a/translated_images/pt/chinese.e62cafa5309f111a.webp b/translated_images/pt/chinese.e62cafa5309f111a.webp deleted file mode 100644 index 12be21d5f..000000000 Binary files a/translated_images/pt/chinese.e62cafa5309f111a.webp and /dev/null differ diff --git a/translated_images/pt/clusters.b635354640d8e4fd.webp b/translated_images/pt/clusters.b635354640d8e4fd.webp deleted file mode 100644 index 874b4928b..000000000 Binary files a/translated_images/pt/clusters.b635354640d8e4fd.webp and /dev/null differ diff --git a/translated_images/pt/comparison.edfab56193a85e7f.webp b/translated_images/pt/comparison.edfab56193a85e7f.webp deleted file mode 100644 index 44a277ad6..000000000 Binary files a/translated_images/pt/comparison.edfab56193a85e7f.webp and /dev/null differ diff --git a/translated_images/pt/comprehension.619708fc5959b0f6.webp b/translated_images/pt/comprehension.619708fc5959b0f6.webp deleted file mode 100644 index 89f6de3d6..000000000 Binary files a/translated_images/pt/comprehension.619708fc5959b0f6.webp and /dev/null differ diff --git a/translated_images/pt/confusion-matrix.3cc5496a1a37c3e4.webp b/translated_images/pt/confusion-matrix.3cc5496a1a37c3e4.webp deleted file mode 100644 index 56e14f42a..000000000 Binary files a/translated_images/pt/confusion-matrix.3cc5496a1a37c3e4.webp and /dev/null differ diff --git a/translated_images/pt/correlation.a9356bb798f5eea5.webp b/translated_images/pt/correlation.a9356bb798f5eea5.webp deleted file mode 100644 index 649aef6ab..000000000 Binary files a/translated_images/pt/correlation.a9356bb798f5eea5.webp and /dev/null differ diff --git a/translated_images/pt/counterfactuals-examples.b38a50a504ee0a9f.webp b/translated_images/pt/counterfactuals-examples.b38a50a504ee0a9f.webp deleted file mode 100644 index 8a0e3b7a5..000000000 Binary files a/translated_images/pt/counterfactuals-examples.b38a50a504ee0a9f.webp and /dev/null differ diff --git a/translated_images/pt/cuisine-dist.d0cc2d551abe5c25.webp b/translated_images/pt/cuisine-dist.d0cc2d551abe5c25.webp deleted file mode 100644 index fe9e34467..000000000 Binary files a/translated_images/pt/cuisine-dist.d0cc2d551abe5c25.webp and /dev/null differ diff --git a/translated_images/pt/currency.e7429812bfc8c608.webp b/translated_images/pt/currency.e7429812bfc8c608.webp deleted file mode 100644 index 43245ac20..000000000 Binary files a/translated_images/pt/currency.e7429812bfc8c608.webp and /dev/null differ diff --git a/translated_images/pt/data-visualization.54e56dded7c1a804.webp b/translated_images/pt/data-visualization.54e56dded7c1a804.webp deleted file mode 100644 index b0bcb9cea..000000000 Binary files a/translated_images/pt/data-visualization.54e56dded7c1a804.webp and /dev/null differ diff --git a/translated_images/pt/dataanalysis-cover.8d6d0683a70a5c1e.webp b/translated_images/pt/dataanalysis-cover.8d6d0683a70a5c1e.webp deleted file mode 100644 index 4311dac32..000000000 Binary files a/translated_images/pt/dataanalysis-cover.8d6d0683a70a5c1e.webp and /dev/null differ diff --git a/translated_images/pt/datapoints.aaf6815cd5d87354.webp b/translated_images/pt/datapoints.aaf6815cd5d87354.webp deleted file mode 100644 index 44d6fb752..000000000 Binary files a/translated_images/pt/datapoints.aaf6815cd5d87354.webp and /dev/null differ diff --git a/translated_images/pt/distribution.9be11df42356ca95.webp b/translated_images/pt/distribution.9be11df42356ca95.webp deleted file mode 100644 index 7d8388a26..000000000 Binary files a/translated_images/pt/distribution.9be11df42356ca95.webp and /dev/null differ diff --git a/translated_images/pt/dplyr_filter.b480b264b03439ff.webp b/translated_images/pt/dplyr_filter.b480b264b03439ff.webp deleted file mode 100644 index d6348a901..000000000 Binary files a/translated_images/pt/dplyr_filter.b480b264b03439ff.webp and /dev/null differ diff --git a/translated_images/pt/dplyr_wrangling.f5f99c64fd4580f1.webp b/translated_images/pt/dplyr_wrangling.f5f99c64fd4580f1.webp deleted file mode 100644 index 1f5a6b31f..000000000 Binary files a/translated_images/pt/dplyr_wrangling.f5f99c64fd4580f1.webp and /dev/null differ diff --git a/translated_images/pt/ea-error-cohort.6886209ea5d438c4.webp b/translated_images/pt/ea-error-cohort.6886209ea5d438c4.webp deleted file mode 100644 index 2efc7aa0f..000000000 Binary files a/translated_images/pt/ea-error-cohort.6886209ea5d438c4.webp and /dev/null differ diff --git a/translated_images/pt/ea-error-distribution.117452e1177c1dd8.webp b/translated_images/pt/ea-error-distribution.117452e1177c1dd8.webp deleted file mode 100644 index 671e1af17..000000000 Binary files a/translated_images/pt/ea-error-distribution.117452e1177c1dd8.webp and /dev/null differ diff --git a/translated_images/pt/ea-heatmap.8d27185e28cee383.webp b/translated_images/pt/ea-heatmap.8d27185e28cee383.webp deleted file mode 100644 index 86b7d27a4..000000000 Binary files a/translated_images/pt/ea-heatmap.8d27185e28cee383.webp and /dev/null differ diff --git a/translated_images/pt/elbow.72676169eed744ff.webp b/translated_images/pt/elbow.72676169eed744ff.webp deleted file mode 100644 index 485041cba..000000000 Binary files a/translated_images/pt/elbow.72676169eed744ff.webp and /dev/null differ diff --git a/translated_images/pt/electric-grid.0c21d5214db09ffa.webp b/translated_images/pt/electric-grid.0c21d5214db09ffa.webp deleted file mode 100644 index e4badeb83..000000000 Binary files a/translated_images/pt/electric-grid.0c21d5214db09ffa.webp and /dev/null differ diff --git a/translated_images/pt/eliza.84397454cda9559b.webp b/translated_images/pt/eliza.84397454cda9559b.webp deleted file mode 100644 index 3cd080a2f..000000000 Binary files a/translated_images/pt/eliza.84397454cda9559b.webp and /dev/null differ diff --git a/translated_images/pt/embedding.2cf8953c4b3101d1.webp b/translated_images/pt/embedding.2cf8953c4b3101d1.webp deleted file mode 100644 index a8021c601..000000000 Binary files a/translated_images/pt/embedding.2cf8953c4b3101d1.webp and /dev/null differ diff --git a/translated_images/pt/encouRage.e75d5fe0367fb913.webp b/translated_images/pt/encouRage.e75d5fe0367fb913.webp deleted file mode 100644 index 76173aaa2..000000000 Binary files a/translated_images/pt/encouRage.e75d5fe0367fb913.webp and /dev/null differ diff --git a/translated_images/pt/energy-plot.5fdac3f397a910bc.webp b/translated_images/pt/energy-plot.5fdac3f397a910bc.webp deleted file mode 100644 index bc5f0af9f..000000000 Binary files a/translated_images/pt/energy-plot.5fdac3f397a910bc.webp and /dev/null differ diff --git a/translated_images/pt/env_init.04e8f26d2d60089e.webp b/translated_images/pt/env_init.04e8f26d2d60089e.webp deleted file mode 100644 index a527dfdbc..000000000 Binary files a/translated_images/pt/env_init.04e8f26d2d60089e.webp and /dev/null differ diff --git a/translated_images/pt/environment.40ba3cb66256c93f.webp b/translated_images/pt/environment.40ba3cb66256c93f.webp deleted file mode 100644 index ac2fff7d1..000000000 Binary files a/translated_images/pt/environment.40ba3cb66256c93f.webp and /dev/null differ diff --git a/translated_images/pt/escape.18862db9930337e3.webp b/translated_images/pt/escape.18862db9930337e3.webp deleted file mode 100644 index b5960137f..000000000 Binary files a/translated_images/pt/escape.18862db9930337e3.webp and /dev/null differ diff --git a/translated_images/pt/facetgrid.9b2e65ce707eba1f.webp b/translated_images/pt/facetgrid.9b2e65ce707eba1f.webp deleted file mode 100644 index ac74166c2..000000000 Binary files a/translated_images/pt/facetgrid.9b2e65ce707eba1f.webp and /dev/null differ diff --git a/translated_images/pt/fairness.25d7c8ce9817272d.webp b/translated_images/pt/fairness.25d7c8ce9817272d.webp deleted file mode 100644 index 65cc5a113..000000000 Binary files a/translated_images/pt/fairness.25d7c8ce9817272d.webp and /dev/null differ diff --git a/translated_images/pt/fairness.b9f9893a4e3dc28b.webp b/translated_images/pt/fairness.b9f9893a4e3dc28b.webp deleted file mode 100644 index 26e7a944e..000000000 Binary files a/translated_images/pt/fairness.b9f9893a4e3dc28b.webp and /dev/null differ diff --git a/translated_images/pt/favicon.37b561214b36d454.webp b/translated_images/pt/favicon.37b561214b36d454.webp deleted file mode 100644 index 48a53960d..000000000 Binary files a/translated_images/pt/favicon.37b561214b36d454.webp and /dev/null differ diff --git a/translated_images/pt/flat-nonflat.d1c8c6e2a96110c1.webp b/translated_images/pt/flat-nonflat.d1c8c6e2a96110c1.webp deleted file mode 100644 index 22c9dd456..000000000 Binary files a/translated_images/pt/flat-nonflat.d1c8c6e2a96110c1.webp and /dev/null differ diff --git a/translated_images/pt/full-data-predict.4f0fed16a131c8f3.webp b/translated_images/pt/full-data-predict.4f0fed16a131c8f3.webp deleted file mode 100644 index ff9ab0b2a..000000000 Binary files a/translated_images/pt/full-data-predict.4f0fed16a131c8f3.webp and /dev/null differ diff --git a/translated_images/pt/full-data.a82ec9957e580e97.webp b/translated_images/pt/full-data.a82ec9957e580e97.webp deleted file mode 100644 index 274f7d7b1..000000000 Binary files a/translated_images/pt/full-data.a82ec9957e580e97.webp and /dev/null differ diff --git a/translated_images/pt/gender-bias-translate-en-tr.bfd87c45da23c085.webp b/translated_images/pt/gender-bias-translate-en-tr.bfd87c45da23c085.webp deleted file mode 100644 index 7d652c0e6..000000000 Binary files a/translated_images/pt/gender-bias-translate-en-tr.bfd87c45da23c085.webp and /dev/null differ diff --git a/translated_images/pt/gender-bias-translate-en-tr.f185fd8822c2d437.webp b/translated_images/pt/gender-bias-translate-en-tr.f185fd8822c2d437.webp deleted file mode 100644 index 692f69914..000000000 Binary files a/translated_images/pt/gender-bias-translate-en-tr.f185fd8822c2d437.webp and /dev/null differ diff --git a/translated_images/pt/gender-bias-translate-tr-en.1f97568ba9e40e20.webp b/translated_images/pt/gender-bias-translate-tr-en.1f97568ba9e40e20.webp deleted file mode 100644 index 587250ef3..000000000 Binary files a/translated_images/pt/gender-bias-translate-tr-en.1f97568ba9e40e20.webp and /dev/null differ diff --git a/translated_images/pt/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp b/translated_images/pt/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp deleted file mode 100644 index 587250ef3..000000000 Binary files a/translated_images/pt/gender-bias-translate-tr-en.4eee7e3cecb8c70e.webp and /dev/null differ diff --git a/translated_images/pt/globe.59f26379ceb40428.webp b/translated_images/pt/globe.59f26379ceb40428.webp deleted file mode 100644 index c14c59c3e..000000000 Binary files a/translated_images/pt/globe.59f26379ceb40428.webp and /dev/null differ diff --git a/translated_images/pt/grid.464370ad00f3696c.webp b/translated_images/pt/grid.464370ad00f3696c.webp deleted file mode 100644 index 8384e3100..000000000 Binary files a/translated_images/pt/grid.464370ad00f3696c.webp and /dev/null differ diff --git a/translated_images/pt/heatmap.39952045da50b4eb.webp b/translated_images/pt/heatmap.39952045da50b4eb.webp deleted file mode 100644 index e3c8dcfbf..000000000 Binary files a/translated_images/pt/heatmap.39952045da50b4eb.webp and /dev/null differ diff --git a/translated_images/pt/hierarchical.bf59403aa43c8c47.webp b/translated_images/pt/hierarchical.bf59403aa43c8c47.webp deleted file mode 100644 index 10e6f5d7e..000000000 Binary files a/translated_images/pt/hierarchical.bf59403aa43c8c47.webp and /dev/null differ diff --git a/translated_images/pt/human.e3840390a2ab7690.webp b/translated_images/pt/human.e3840390a2ab7690.webp deleted file mode 100644 index 35faa2269..000000000 Binary files a/translated_images/pt/human.e3840390a2ab7690.webp and /dev/null differ diff --git a/translated_images/pt/hype.07183d711a17aafe.webp b/translated_images/pt/hype.07183d711a17aafe.webp deleted file mode 100644 index 28b693472..000000000 Binary files a/translated_images/pt/hype.07183d711a17aafe.webp and /dev/null differ diff --git a/translated_images/pt/indian.2c4292002af1a1f9.webp b/translated_images/pt/indian.2c4292002af1a1f9.webp deleted file mode 100644 index 68e58b39b..000000000 Binary files a/translated_images/pt/indian.2c4292002af1a1f9.webp and /dev/null differ diff --git a/translated_images/pt/individual-causal-what-if.00e7b86b52a083ce.webp b/translated_images/pt/individual-causal-what-if.00e7b86b52a083ce.webp deleted file mode 100644 index befd92eec..000000000 Binary files a/translated_images/pt/individual-causal-what-if.00e7b86b52a083ce.webp and /dev/null differ diff --git a/translated_images/pt/jack-o-lanterns.181c661a9212457d.webp b/translated_images/pt/jack-o-lanterns.181c661a9212457d.webp deleted file mode 100644 index 425e879b1..000000000 Binary files a/translated_images/pt/jack-o-lanterns.181c661a9212457d.webp and /dev/null differ diff --git a/translated_images/pt/janitor.e4a77dd3d3e6a32e.webp b/translated_images/pt/janitor.e4a77dd3d3e6a32e.webp deleted file mode 100644 index 861d3085c..000000000 Binary files a/translated_images/pt/janitor.e4a77dd3d3e6a32e.webp and /dev/null differ diff --git a/translated_images/pt/japanese.30260486f2a05c46.webp b/translated_images/pt/japanese.30260486f2a05c46.webp deleted file mode 100644 index f93774b63..000000000 Binary files a/translated_images/pt/japanese.30260486f2a05c46.webp and /dev/null differ diff --git a/translated_images/pt/july-2014.9e1f7c318ec6d5b3.webp b/translated_images/pt/july-2014.9e1f7c318ec6d5b3.webp deleted file mode 100644 index 8c085d25d..000000000 Binary files a/translated_images/pt/july-2014.9e1f7c318ec6d5b3.webp and /dev/null differ diff --git a/translated_images/pt/korean.4a4f0274f3d9805a.webp b/translated_images/pt/korean.4a4f0274f3d9805a.webp deleted file mode 100644 index 1bdea0444..000000000 Binary files a/translated_images/pt/korean.4a4f0274f3d9805a.webp and /dev/null differ diff --git a/translated_images/pt/learned.ed28bcd8484b5287.webp b/translated_images/pt/learned.ed28bcd8484b5287.webp deleted file mode 100644 index fb38b596b..000000000 Binary files a/translated_images/pt/learned.ed28bcd8484b5287.webp and /dev/null differ diff --git a/translated_images/pt/linear-polynomial.5523c7cb6576ccab.webp b/translated_images/pt/linear-polynomial.5523c7cb6576ccab.webp deleted file mode 100644 index 2a5957054..000000000 Binary files a/translated_images/pt/linear-polynomial.5523c7cb6576ccab.webp and /dev/null differ diff --git a/translated_images/pt/linear-results.f7c3552c85b0ed1c.webp b/translated_images/pt/linear-results.f7c3552c85b0ed1c.webp deleted file mode 100644 index 0cb94631a..000000000 Binary files a/translated_images/pt/linear-results.f7c3552c85b0ed1c.webp and /dev/null differ diff --git a/translated_images/pt/linear-vs-logistic.ba180bf95e7ee667.webp b/translated_images/pt/linear-vs-logistic.ba180bf95e7ee667.webp deleted file mode 100644 index 634b45e84..000000000 Binary files a/translated_images/pt/linear-vs-logistic.ba180bf95e7ee667.webp and /dev/null differ diff --git a/translated_images/pt/linear.a1b0760a56132551.webp b/translated_images/pt/linear.a1b0760a56132551.webp deleted file mode 100644 index d59d4cdd2..000000000 Binary files a/translated_images/pt/linear.a1b0760a56132551.webp and /dev/null differ diff --git a/translated_images/pt/lobe.2fa0806408ef9923.webp b/translated_images/pt/lobe.2fa0806408ef9923.webp deleted file mode 100644 index 9a28eb3b7..000000000 Binary files a/translated_images/pt/lobe.2fa0806408ef9923.webp and /dev/null differ diff --git a/translated_images/pt/logistic-linear.0f2f6bb73b3134c1.webp b/translated_images/pt/logistic-linear.0f2f6bb73b3134c1.webp deleted file mode 100644 index f3ca573cd..000000000 Binary files a/translated_images/pt/logistic-linear.0f2f6bb73b3134c1.webp and /dev/null differ diff --git a/translated_images/pt/logistic.b0cba6b7db4d5789.webp b/translated_images/pt/logistic.b0cba6b7db4d5789.webp deleted file mode 100644 index 082998eb6..000000000 Binary files a/translated_images/pt/logistic.b0cba6b7db4d5789.webp and /dev/null differ diff --git a/translated_images/pt/lpathlen.94f211521ed60940.webp b/translated_images/pt/lpathlen.94f211521ed60940.webp deleted file mode 100644 index 44d57cf19..000000000 Binary files a/translated_images/pt/lpathlen.94f211521ed60940.webp and /dev/null differ diff --git a/translated_images/pt/lpathlen1.0534784add58d4eb.webp b/translated_images/pt/lpathlen1.0534784add58d4eb.webp deleted file mode 100644 index 3725aebf3..000000000 Binary files a/translated_images/pt/lpathlen1.0534784add58d4eb.webp and /dev/null differ diff --git a/translated_images/pt/map.e963a6a51349425a.webp b/translated_images/pt/map.e963a6a51349425a.webp deleted file mode 100644 index 4a048db91..000000000 Binary files a/translated_images/pt/map.e963a6a51349425a.webp and /dev/null differ diff --git a/translated_images/pt/mape.fd87bbaf4d346846.webp b/translated_images/pt/mape.fd87bbaf4d346846.webp deleted file mode 100644 index 40d3f94ef..000000000 Binary files a/translated_images/pt/mape.fd87bbaf4d346846.webp and /dev/null differ diff --git a/translated_images/pt/ml-fairness.ef296ebec6afc98a.webp b/translated_images/pt/ml-fairness.ef296ebec6afc98a.webp deleted file mode 100644 index 90c848694..000000000 Binary files a/translated_images/pt/ml-fairness.ef296ebec6afc98a.webp and /dev/null differ diff --git a/translated_images/pt/ml-for-beginners-video-banner.63f694a100034bc6.webp b/translated_images/pt/ml-for-beginners-video-banner.63f694a100034bc6.webp deleted file mode 100644 index f722ad0b1..000000000 Binary files a/translated_images/pt/ml-for-beginners-video-banner.63f694a100034bc6.webp and /dev/null differ diff --git a/translated_images/pt/ml-for-beginners.9eecb963dbfbfb32.webp b/translated_images/pt/ml-for-beginners.9eecb963dbfbfb32.webp deleted file mode 100644 index 0133f66b2..000000000 Binary files a/translated_images/pt/ml-for-beginners.9eecb963dbfbfb32.webp and /dev/null differ diff --git a/translated_images/pt/ml-history.a1bdfd4ce1f464d9.webp b/translated_images/pt/ml-history.a1bdfd4ce1f464d9.webp deleted file mode 100644 index f93686534..000000000 Binary files a/translated_images/pt/ml-history.a1bdfd4ce1f464d9.webp and /dev/null differ diff --git a/translated_images/pt/ml-realworld.26ee274671615577.webp b/translated_images/pt/ml-realworld.26ee274671615577.webp deleted file mode 100644 index 607a417aa..000000000 Binary files a/translated_images/pt/ml-realworld.26ee274671615577.webp and /dev/null differ diff --git a/translated_images/pt/ml-regression.4e4f70e3b3ed446e.webp b/translated_images/pt/ml-regression.4e4f70e3b3ed446e.webp deleted file mode 100644 index 88aaf6a15..000000000 Binary files a/translated_images/pt/ml-regression.4e4f70e3b3ed446e.webp and /dev/null differ diff --git a/translated_images/pt/ml-reinforcement.94024374d63348db.webp b/translated_images/pt/ml-reinforcement.94024374d63348db.webp deleted file mode 100644 index ec0ab5c97..000000000 Binary files a/translated_images/pt/ml-reinforcement.94024374d63348db.webp and /dev/null differ diff --git a/translated_images/pt/ml-timeseries.fb98d25f1013fc0c.webp b/translated_images/pt/ml-timeseries.fb98d25f1013fc0c.webp deleted file mode 100644 index 49cb2b29e..000000000 Binary files a/translated_images/pt/ml-timeseries.fb98d25f1013fc0c.webp and /dev/null differ diff --git a/translated_images/pt/model-overview-dataset-cohorts.dfa463fb527a35a0.webp b/translated_images/pt/model-overview-dataset-cohorts.dfa463fb527a35a0.webp deleted file mode 100644 index 0e422785b..000000000 Binary files a/translated_images/pt/model-overview-dataset-cohorts.dfa463fb527a35a0.webp and /dev/null differ diff --git a/translated_images/pt/model-overview-feature-cohorts.c5104d575ffd0c80.webp b/translated_images/pt/model-overview-feature-cohorts.c5104d575ffd0c80.webp deleted file mode 100644 index ede36383f..000000000 Binary files a/translated_images/pt/model-overview-feature-cohorts.c5104d575ffd0c80.webp and /dev/null differ diff --git a/translated_images/pt/monnaie.606c5fa8369d5c3b.webp b/translated_images/pt/monnaie.606c5fa8369d5c3b.webp deleted file mode 100644 index 72a343b60..000000000 Binary files a/translated_images/pt/monnaie.606c5fa8369d5c3b.webp and /dev/null differ diff --git a/translated_images/pt/mountaincar.43d56e588ce581c2.webp b/translated_images/pt/mountaincar.43d56e588ce581c2.webp deleted file mode 100644 index 8fc8cec1d..000000000 Binary files a/translated_images/pt/mountaincar.43d56e588ce581c2.webp and /dev/null differ diff --git a/translated_images/pt/multinomial-ordinal.944fe02295fd6cdf.webp b/translated_images/pt/multinomial-ordinal.944fe02295fd6cdf.webp deleted file mode 100644 index 8eee5e53a..000000000 Binary files a/translated_images/pt/multinomial-ordinal.944fe02295fd6cdf.webp and /dev/null differ diff --git a/translated_images/pt/multinomial-vs-ordinal.36701b4850e37d86.webp b/translated_images/pt/multinomial-vs-ordinal.36701b4850e37d86.webp deleted file mode 100644 index 5cc4db537..000000000 Binary files a/translated_images/pt/multinomial-vs-ordinal.36701b4850e37d86.webp and /dev/null differ diff --git a/translated_images/pt/netron.a05f39410211915e.webp b/translated_images/pt/netron.a05f39410211915e.webp deleted file mode 100644 index d8d4e6237..000000000 Binary files a/translated_images/pt/netron.a05f39410211915e.webp and /dev/null differ diff --git a/translated_images/pt/notebook.4a3ee31f396b8832.webp b/translated_images/pt/notebook.4a3ee31f396b8832.webp deleted file mode 100644 index 8f5a3c4f7..000000000 Binary files a/translated_images/pt/notebook.4a3ee31f396b8832.webp and /dev/null differ diff --git a/translated_images/pt/original.b2b15efe0ce92b87.webp b/translated_images/pt/original.b2b15efe0ce92b87.webp deleted file mode 100644 index df7a5a11a..000000000 Binary files a/translated_images/pt/original.b2b15efe0ce92b87.webp and /dev/null differ diff --git a/translated_images/pt/overfitting.1c132d92bfd93cb6.webp b/translated_images/pt/overfitting.1c132d92bfd93cb6.webp deleted file mode 100644 index 615aac897..000000000 Binary files a/translated_images/pt/overfitting.1c132d92bfd93cb6.webp and /dev/null differ diff --git a/translated_images/pt/p&p.279f1c49ecd88941.webp b/translated_images/pt/p&p.279f1c49ecd88941.webp deleted file mode 100644 index 93be23802..000000000 Binary files a/translated_images/pt/p&p.279f1c49ecd88941.webp and /dev/null differ diff --git a/translated_images/pt/parse.d0c5bbe1106eae8f.webp b/translated_images/pt/parse.d0c5bbe1106eae8f.webp deleted file mode 100644 index 7428889c1..000000000 Binary files a/translated_images/pt/parse.d0c5bbe1106eae8f.webp and /dev/null differ diff --git a/translated_images/pt/parsnip.cd2ce92622976502.webp b/translated_images/pt/parsnip.cd2ce92622976502.webp deleted file mode 100644 index 67fc0145c..000000000 Binary files a/translated_images/pt/parsnip.cd2ce92622976502.webp and /dev/null differ diff --git a/translated_images/pt/peter.779730f9ba3a8a8d.webp b/translated_images/pt/peter.779730f9ba3a8a8d.webp deleted file mode 100644 index a6a517271..000000000 Binary files a/translated_images/pt/peter.779730f9ba3a8a8d.webp and /dev/null differ diff --git a/translated_images/pt/pie-pumpkins-scatter.d14f9804a53f927e.webp b/translated_images/pt/pie-pumpkins-scatter.d14f9804a53f927e.webp deleted file mode 100644 index c606bc6ee..000000000 Binary files a/translated_images/pt/pie-pumpkins-scatter.d14f9804a53f927e.webp and /dev/null differ diff --git a/translated_images/pt/pinch.1b035ec9ba7e0d40.webp b/translated_images/pt/pinch.1b035ec9ba7e0d40.webp deleted file mode 100644 index 61c6f4f80..000000000 Binary files a/translated_images/pt/pinch.1b035ec9ba7e0d40.webp and /dev/null differ diff --git a/translated_images/pt/poly-results.ee587348f0f1f60b.webp b/translated_images/pt/poly-results.ee587348f0f1f60b.webp deleted file mode 100644 index 6743c245c..000000000 Binary files a/translated_images/pt/poly-results.ee587348f0f1f60b.webp and /dev/null differ diff --git a/translated_images/pt/polynomial.8fce4663e7283dfb.webp b/translated_images/pt/polynomial.8fce4663e7283dfb.webp deleted file mode 100644 index f91e147b9..000000000 Binary files a/translated_images/pt/polynomial.8fce4663e7283dfb.webp and /dev/null differ diff --git a/translated_images/pt/popular.9c48d84b3386705f.webp b/translated_images/pt/popular.9c48d84b3386705f.webp deleted file mode 100644 index 2476933f2..000000000 Binary files a/translated_images/pt/popular.9c48d84b3386705f.webp and /dev/null differ diff --git a/translated_images/pt/price-by-variety.744a2f9925d9bcb4.webp b/translated_images/pt/price-by-variety.744a2f9925d9bcb4.webp deleted file mode 100644 index d001a164a..000000000 Binary files a/translated_images/pt/price-by-variety.744a2f9925d9bcb4.webp and /dev/null differ diff --git a/translated_images/pt/problems.f7fb539ccd80608e.webp b/translated_images/pt/problems.f7fb539ccd80608e.webp deleted file mode 100644 index 6085c6e8a..000000000 Binary files a/translated_images/pt/problems.f7fb539ccd80608e.webp and /dev/null differ diff --git a/translated_images/pt/pumpkin-classifier.562771f104ad5436.webp b/translated_images/pt/pumpkin-classifier.562771f104ad5436.webp deleted file mode 100644 index 0c741f7fb..000000000 Binary files a/translated_images/pt/pumpkin-classifier.562771f104ad5436.webp and /dev/null differ diff --git a/translated_images/pt/pumpkins_catplot_1.c55c409b71fea2ec.webp b/translated_images/pt/pumpkins_catplot_1.c55c409b71fea2ec.webp deleted file mode 100644 index c4244ac82..000000000 Binary files a/translated_images/pt/pumpkins_catplot_1.c55c409b71fea2ec.webp and /dev/null differ diff --git a/translated_images/pt/pumpkins_catplot_2.87a354447880b388.webp b/translated_images/pt/pumpkins_catplot_2.87a354447880b388.webp deleted file mode 100644 index a318bd27d..000000000 Binary files a/translated_images/pt/pumpkins_catplot_2.87a354447880b388.webp and /dev/null differ diff --git a/translated_images/pt/r_learners_sm.cd14eb3581a9f28d.webp b/translated_images/pt/r_learners_sm.cd14eb3581a9f28d.webp deleted file mode 100644 index 516f71d47..000000000 Binary files a/translated_images/pt/r_learners_sm.cd14eb3581a9f28d.webp and /dev/null differ diff --git a/translated_images/pt/r_learners_sm.e25fa9c205b3a3f9.webp b/translated_images/pt/r_learners_sm.e25fa9c205b3a3f9.webp deleted file mode 100644 index b6e73d3da..000000000 Binary files a/translated_images/pt/r_learners_sm.e25fa9c205b3a3f9.webp and /dev/null differ diff --git a/translated_images/pt/r_learners_sm.e4a71b113ffbedfe.webp b/translated_images/pt/r_learners_sm.e4a71b113ffbedfe.webp deleted file mode 100644 index 8e18aa306..000000000 Binary files a/translated_images/pt/r_learners_sm.e4a71b113ffbedfe.webp and /dev/null differ diff --git a/translated_images/pt/r_learners_sm.f9199f76f1e2e493.webp b/translated_images/pt/r_learners_sm.f9199f76f1e2e493.webp deleted file mode 100644 index e12c56478..000000000 Binary files a/translated_images/pt/r_learners_sm.f9199f76f1e2e493.webp and /dev/null differ diff --git a/translated_images/pt/recipes.186acfa8ed2e8f00.webp b/translated_images/pt/recipes.186acfa8ed2e8f00.webp deleted file mode 100644 index 54537364e..000000000 Binary files a/translated_images/pt/recipes.186acfa8ed2e8f00.webp and /dev/null differ diff --git a/translated_images/pt/recipes.9ad10d8a4056bf89.webp b/translated_images/pt/recipes.9ad10d8a4056bf89.webp deleted file mode 100644 index cad988266..000000000 Binary files a/translated_images/pt/recipes.9ad10d8a4056bf89.webp and /dev/null differ diff --git a/translated_images/pt/scaled.91897dfbaa26ca4a.webp b/translated_images/pt/scaled.91897dfbaa26ca4a.webp deleted file mode 100644 index d63f2b0f7..000000000 Binary files a/translated_images/pt/scaled.91897dfbaa26ca4a.webp and /dev/null differ diff --git a/translated_images/pt/scaled.e35258ca5cd3d43f.webp b/translated_images/pt/scaled.e35258ca5cd3d43f.webp deleted file mode 100644 index d63f2b0f7..000000000 Binary files a/translated_images/pt/scaled.e35258ca5cd3d43f.webp and /dev/null differ diff --git a/translated_images/pt/scatter-dayofyear-color.65790faefbb9d54f.webp b/translated_images/pt/scatter-dayofyear-color.65790faefbb9d54f.webp deleted file mode 100644 index eeb8a9f10..000000000 Binary files a/translated_images/pt/scatter-dayofyear-color.65790faefbb9d54f.webp and /dev/null differ diff --git a/translated_images/pt/scatter-dayofyear.bc171c189c9fd553.webp b/translated_images/pt/scatter-dayofyear.bc171c189c9fd553.webp deleted file mode 100644 index aec045037..000000000 Binary files a/translated_images/pt/scatter-dayofyear.bc171c189c9fd553.webp and /dev/null differ diff --git a/translated_images/pt/scatterplot.ad8b356bcbb33be6.webp b/translated_images/pt/scatterplot.ad8b356bcbb33be6.webp deleted file mode 100644 index 885789a2b..000000000 Binary files a/translated_images/pt/scatterplot.ad8b356bcbb33be6.webp and /dev/null differ diff --git a/translated_images/pt/scatterplot.b6868f44cbd2051c.webp b/translated_images/pt/scatterplot.b6868f44cbd2051c.webp deleted file mode 100644 index bf0ce25bc..000000000 Binary files a/translated_images/pt/scatterplot.b6868f44cbd2051c.webp and /dev/null differ diff --git a/translated_images/pt/shakey.4dc17819c447c05b.webp b/translated_images/pt/shakey.4dc17819c447c05b.webp deleted file mode 100644 index 441676011..000000000 Binary files a/translated_images/pt/shakey.4dc17819c447c05b.webp and /dev/null differ diff --git a/translated_images/pt/sigmoid.8b7ba9d095c789cf.webp b/translated_images/pt/sigmoid.8b7ba9d095c789cf.webp deleted file mode 100644 index f513a38cc..000000000 Binary files a/translated_images/pt/sigmoid.8b7ba9d095c789cf.webp and /dev/null differ diff --git a/translated_images/pt/slope.f3c9d5910ddbfcf9.webp b/translated_images/pt/slope.f3c9d5910ddbfcf9.webp deleted file mode 100644 index a65bed28c..000000000 Binary files a/translated_images/pt/slope.f3c9d5910ddbfcf9.webp and /dev/null differ diff --git a/translated_images/pt/solvers.5fc648618529e627.webp b/translated_images/pt/solvers.5fc648618529e627.webp deleted file mode 100644 index 7c0e0f24b..000000000 Binary files a/translated_images/pt/solvers.5fc648618529e627.webp and /dev/null differ diff --git a/translated_images/pt/svm.621ae7b516d678e0.webp b/translated_images/pt/svm.621ae7b516d678e0.webp deleted file mode 100644 index 02d774a2a..000000000 Binary files a/translated_images/pt/svm.621ae7b516d678e0.webp and /dev/null differ diff --git a/translated_images/pt/swarm.56d253ae80a2c0f5.webp b/translated_images/pt/swarm.56d253ae80a2c0f5.webp deleted file mode 100644 index 752d00904..000000000 Binary files a/translated_images/pt/swarm.56d253ae80a2c0f5.webp and /dev/null differ diff --git a/translated_images/pt/swarm_2.efeacfca536c2b57.webp b/translated_images/pt/swarm_2.efeacfca536c2b57.webp deleted file mode 100644 index c536e6e73..000000000 Binary files a/translated_images/pt/swarm_2.efeacfca536c2b57.webp and /dev/null differ diff --git a/translated_images/pt/test-data-predict.8afc47ee7e52874f.webp b/translated_images/pt/test-data-predict.8afc47ee7e52874f.webp deleted file mode 100644 index 4fe86dd49..000000000 Binary files a/translated_images/pt/test-data-predict.8afc47ee7e52874f.webp and /dev/null differ diff --git a/translated_images/pt/thai-food.c47a7a7f9f05c218.webp b/translated_images/pt/thai-food.c47a7a7f9f05c218.webp deleted file mode 100644 index 1eda3cea3..000000000 Binary files a/translated_images/pt/thai-food.c47a7a7f9f05c218.webp and /dev/null differ diff --git a/translated_images/pt/thai.0269dbab2e78bd38.webp b/translated_images/pt/thai.0269dbab2e78bd38.webp deleted file mode 100644 index e9e7d8a79..000000000 Binary files a/translated_images/pt/thai.0269dbab2e78bd38.webp and /dev/null differ diff --git a/translated_images/pt/tokenization.1641a160c66cd2d9.webp b/translated_images/pt/tokenization.1641a160c66cd2d9.webp deleted file mode 100644 index eb74e9e4f..000000000 Binary files a/translated_images/pt/tokenization.1641a160c66cd2d9.webp and /dev/null differ diff --git a/translated_images/pt/train-data-predict.3c4ef4e78553104f.webp b/translated_images/pt/train-data-predict.3c4ef4e78553104f.webp deleted file mode 100644 index 9b3938d97..000000000 Binary files a/translated_images/pt/train-data-predict.3c4ef4e78553104f.webp and /dev/null differ diff --git a/translated_images/pt/train-test.8928d14e5b91fc94.webp b/translated_images/pt/train-test.8928d14e5b91fc94.webp deleted file mode 100644 index 508e3b216..000000000 Binary files a/translated_images/pt/train-test.8928d14e5b91fc94.webp and /dev/null differ diff --git a/translated_images/pt/train-test.ead0cecbfc341921.webp b/translated_images/pt/train-test.ead0cecbfc341921.webp deleted file mode 100644 index 512f4dc5e..000000000 Binary files a/translated_images/pt/train-test.ead0cecbfc341921.webp and /dev/null differ diff --git a/translated_images/pt/train_progress_raw.2adfdf2daea09c59.webp b/translated_images/pt/train_progress_raw.2adfdf2daea09c59.webp deleted file mode 100644 index 9cb93e6e5..000000000 Binary files a/translated_images/pt/train_progress_raw.2adfdf2daea09c59.webp and /dev/null differ diff --git a/translated_images/pt/train_progress_runav.c71694a8fa9ab359.webp b/translated_images/pt/train_progress_runav.c71694a8fa9ab359.webp deleted file mode 100644 index 46fb46ea5..000000000 Binary files a/translated_images/pt/train_progress_runav.c71694a8fa9ab359.webp and /dev/null differ diff --git a/translated_images/pt/turntable.f2b86b13c53302dc.webp b/translated_images/pt/turntable.f2b86b13c53302dc.webp deleted file mode 100644 index 27c674f5b..000000000 Binary files a/translated_images/pt/turntable.f2b86b13c53302dc.webp and /dev/null differ diff --git a/translated_images/pt/ufo.9e787f5161da9d4d.webp b/translated_images/pt/ufo.9e787f5161da9d4d.webp deleted file mode 100644 index 44a08cb65..000000000 Binary files a/translated_images/pt/ufo.9e787f5161da9d4d.webp and /dev/null differ diff --git a/translated_images/pt/unruly_data.0eedc7ced92d2d91.webp b/translated_images/pt/unruly_data.0eedc7ced92d2d91.webp deleted file mode 100644 index 87862b3a6..000000000 Binary files a/translated_images/pt/unruly_data.0eedc7ced92d2d91.webp and /dev/null differ diff --git a/translated_images/pt/violin.ffceb68923177011.webp b/translated_images/pt/violin.ffceb68923177011.webp deleted file mode 100644 index 5e5bfc849..000000000 Binary files a/translated_images/pt/violin.ffceb68923177011.webp and /dev/null differ diff --git a/translated_images/pt/voronoi.1dc1613fb0439b95.webp b/translated_images/pt/voronoi.1dc1613fb0439b95.webp deleted file mode 100644 index 4a7d11723..000000000 Binary files a/translated_images/pt/voronoi.1dc1613fb0439b95.webp and /dev/null differ diff --git a/translated_images/pt/web-app.4c76450cabe20036.webp b/translated_images/pt/web-app.4c76450cabe20036.webp deleted file mode 100644 index 880f3df7e..000000000 Binary files a/translated_images/pt/web-app.4c76450cabe20036.webp and /dev/null differ diff --git a/translated_images/pt/wolf.a56d3d4070ca0c79.webp b/translated_images/pt/wolf.a56d3d4070ca0c79.webp deleted file mode 100644 index a9f12f4bd..000000000 Binary files a/translated_images/pt/wolf.a56d3d4070ca0c79.webp and /dev/null differ diff --git a/translations/br/1-Introduction/1-intro-to-ML/README.md b/translations/br/1-Introduction/1-intro-to-ML/README.md deleted file mode 100644 index 9107eec80..000000000 --- a/translations/br/1-Introduction/1-intro-to-ML/README.md +++ /dev/null @@ -1,159 +0,0 @@ - -# Introdução ao aprendizado de máquina - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- - -[![ML para iniciantes - Introdução ao Aprendizado de Máquina para Iniciantes](https://img.youtube.com/vi/6mSx_KJxcHI/0.jpg)](https://youtu.be/6mSx_KJxcHI "ML para iniciantes - Introdução ao Aprendizado de Máquina para Iniciantes") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre esta lição. - -Bem-vindo a este curso sobre aprendizado de máquina clássico para iniciantes! Seja você completamente novo neste tópico ou um praticante experiente de ML buscando revisar alguma área, estamos felizes em tê-lo conosco! Queremos criar um ponto de partida amigável para seus estudos de ML e ficaremos felizes em avaliar, responder e incorporar seu [feedback](https://github.com/microsoft/ML-For-Beginners/discussions). - -[![Introdução ao ML](https://img.youtube.com/vi/h0e2HAPTGF4/0.jpg)](https://youtu.be/h0e2HAPTGF4 "Introdução ao ML") - -> 🎥 Clique na imagem acima para assistir a um vídeo: John Guttag do MIT apresenta aprendizado de máquina. - ---- -## Começando com aprendizado de máquina - -Antes de começar com este currículo, você precisa configurar seu computador e estar pronto para executar notebooks localmente. - -- **Configure sua máquina com estes vídeos**. Use os links a seguir para aprender [como instalar Python](https://youtu.be/CXZYvNRIAKM) no seu sistema e [configurar um editor de texto](https://youtu.be/EU8eayHWoZg) para desenvolvimento. -- **Aprenda Python**. Também é recomendado ter um entendimento básico de [Python](https://docs.microsoft.com/learn/paths/python-language/?WT.mc_id=academic-77952-leestott), uma linguagem de programação útil para cientistas de dados que utilizamos neste curso. -- **Aprenda Node.js e JavaScript**. Também utilizamos JavaScript algumas vezes neste curso ao construir aplicativos web, então você precisará ter [node](https://nodejs.org) e [npm](https://www.npmjs.com/) instalados, além de [Visual Studio Code](https://code.visualstudio.com/) disponível para desenvolvimento em Python e JavaScript. -- **Crie uma conta no GitHub**. Já que você nos encontrou aqui no [GitHub](https://github.com), talvez já tenha uma conta, mas se não, crie uma e depois faça um fork deste currículo para usar por conta própria. (Sinta-se à vontade para nos dar uma estrela também 😊) -- **Explore o Scikit-learn**. Familiarize-se com [Scikit-learn](https://scikit-learn.org/stable/user_guide.html), um conjunto de bibliotecas de ML que referenciamos nestas lições. - ---- -## O que é aprendizado de máquina? - -O termo 'aprendizado de máquina' é um dos mais populares e frequentemente usados atualmente. Existe uma possibilidade não trivial de que você já tenha ouvido este termo pelo menos uma vez, caso tenha algum tipo de familiaridade com tecnologia, independentemente da área em que trabalha. No entanto, a mecânica do aprendizado de máquina é um mistério para a maioria das pessoas. Para um iniciante em aprendizado de máquina, o assunto pode às vezes parecer intimidante. Portanto, é importante entender o que realmente é aprendizado de máquina e aprender sobre ele passo a passo, por meio de exemplos práticos. - ---- -## A curva de hype - -![ml hype curve](../../../../1-Introduction/1-intro-to-ML/images/hype.png) - -> O Google Trends mostra a recente 'curva de hype' do termo 'aprendizado de máquina' - ---- -## Um universo misterioso - -Vivemos em um universo cheio de mistérios fascinantes. Grandes cientistas como Stephen Hawking, Albert Einstein e muitos outros dedicaram suas vidas à busca de informações significativas que desvendassem os mistérios do mundo ao nosso redor. Esta é a condição humana de aprender: uma criança humana aprende coisas novas e descobre a estrutura de seu mundo ano após ano enquanto cresce até a idade adulta. - ---- -## O cérebro da criança - -O cérebro e os sentidos de uma criança percebem os fatos ao seu redor e gradualmente aprendem os padrões ocultos da vida, que ajudam a criança a criar regras lógicas para identificar padrões aprendidos. O processo de aprendizado do cérebro humano torna os humanos as criaturas mais sofisticadas deste mundo. Aprender continuamente, descobrindo padrões ocultos e depois inovando com base nesses padrões, nos permite melhorar continuamente ao longo de nossas vidas. Essa capacidade de aprendizado e evolução está relacionada a um conceito chamado [plasticidade cerebral](https://www.simplypsychology.org/brain-plasticity.html). Superficialmente, podemos traçar algumas semelhanças motivacionais entre o processo de aprendizado do cérebro humano e os conceitos de aprendizado de máquina. - ---- -## O cérebro humano - -O [cérebro humano](https://www.livescience.com/29365-human-brain.html) percebe coisas do mundo real, processa as informações percebidas, toma decisões racionais e realiza certas ações com base nas circunstâncias. Isso é o que chamamos de comportamento inteligente. Quando programamos uma réplica do processo de comportamento inteligente em uma máquina, isso é chamado de inteligência artificial (IA). - ---- -## Alguns termos - -Embora os termos possam ser confundidos, aprendizado de máquina (ML) é um subconjunto importante da inteligência artificial. **ML está relacionado ao uso de algoritmos especializados para descobrir informações significativas e encontrar padrões ocultos a partir de dados percebidos, corroborando o processo de tomada de decisão racional**. - ---- -## IA, ML, Aprendizado Profundo - -![AI, ML, deep learning, data science](../../../../1-Introduction/1-intro-to-ML/images/ai-ml-ds.png) - -> Um diagrama mostrando as relações entre IA, ML, aprendizado profundo e ciência de dados. Infográfico por [Jen Looper](https://twitter.com/jenlooper) inspirado por [este gráfico](https://softwareengineering.stackexchange.com/questions/366996/distinction-between-ai-ml-neural-networks-deep-learning-and-data-mining) - ---- -## Conceitos abordados - -Neste currículo, vamos abordar apenas os conceitos principais de aprendizado de máquina que um iniciante deve conhecer. Abordamos o que chamamos de 'aprendizado de máquina clássico', principalmente usando Scikit-learn, uma excelente biblioteca que muitos estudantes utilizam para aprender o básico. Para entender conceitos mais amplos de inteligência artificial ou aprendizado profundo, um conhecimento fundamental sólido de aprendizado de máquina é indispensável, e é isso que queremos oferecer aqui. - ---- -## Neste curso você aprenderá: - -- conceitos principais de aprendizado de máquina -- a história do ML -- ML e justiça -- técnicas de regressão em ML -- técnicas de classificação em ML -- técnicas de agrupamento em ML -- técnicas de processamento de linguagem natural em ML -- técnicas de previsão de séries temporais em ML -- aprendizado por reforço -- aplicações reais de ML - ---- -## O que não abordaremos - -- aprendizado profundo -- redes neurais -- IA - -Para proporcionar uma melhor experiência de aprendizado, evitaremos as complexidades de redes neurais, 'aprendizado profundo' - construção de modelos com muitas camadas usando redes neurais - e IA, que discutiremos em um currículo diferente. Também ofereceremos um futuro currículo de ciência de dados para focar nesse aspecto deste campo maior. - ---- -## Por que estudar aprendizado de máquina? - -Aprendizado de máquina, de uma perspectiva de sistemas, é definido como a criação de sistemas automatizados que podem aprender padrões ocultos a partir de dados para ajudar na tomada de decisões inteligentes. - -Essa motivação é vagamente inspirada por como o cérebro humano aprende certas coisas com base nos dados que percebe do mundo exterior. - -✅ Pense por um momento por que uma empresa gostaria de usar estratégias de aprendizado de máquina em vez de criar um mecanismo baseado em regras codificadas. - ---- -## Aplicações do aprendizado de máquina - -As aplicações do aprendizado de máquina estão agora quase em todos os lugares e são tão onipresentes quanto os dados que circulam em nossas sociedades, gerados por nossos smartphones, dispositivos conectados e outros sistemas. Considerando o imenso potencial dos algoritmos de aprendizado de máquina de última geração, pesquisadores têm explorado sua capacidade de resolver problemas reais multidimensionais e multidisciplinares com ótimos resultados positivos. - ---- -## Exemplos de ML aplicado - -**Você pode usar aprendizado de máquina de várias maneiras**: - -- Para prever a probabilidade de uma doença com base no histórico médico ou relatórios de um paciente. -- Para aproveitar dados meteorológicos e prever eventos climáticos. -- Para entender o sentimento de um texto. -- Para detectar notícias falsas e impedir a propagação de propaganda. - -Finanças, economia, ciência da terra, exploração espacial, engenharia biomédica, ciência cognitiva e até mesmo áreas das humanidades têm adaptado o aprendizado de máquina para resolver os problemas árduos e pesados em processamento de dados de seus domínios. - ---- -## Conclusão - -O aprendizado de máquina automatiza o processo de descoberta de padrões ao encontrar insights significativos a partir de dados reais ou gerados. Ele tem se mostrado altamente valioso em aplicações de negócios, saúde e finanças, entre outras. - -No futuro próximo, entender os fundamentos do aprendizado de máquina será essencial para pessoas de qualquer área devido à sua ampla adoção. - ---- -# 🚀 Desafio - -Desenhe, no papel ou usando um aplicativo online como [Excalidraw](https://excalidraw.com/), sua compreensão das diferenças entre IA, ML, aprendizado profundo e ciência de dados. Adicione algumas ideias de problemas que cada uma dessas técnicas é boa em resolver. - -# [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- -# Revisão e Autoestudo - -Para aprender mais sobre como trabalhar com algoritmos de ML na nuvem, siga este [Caminho de Aprendizado](https://docs.microsoft.com/learn/paths/create-no-code-predictive-models-azure-machine-learning/?WT.mc_id=academic-77952-leestott). - -Faça um [Caminho de Aprendizado](https://docs.microsoft.com/learn/modules/introduction-to-machine-learning/?WT.mc_id=academic-77952-leestott) sobre os fundamentos de ML. - ---- -# Tarefa - -[Prepare-se e comece](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/1-intro-to-ML/assignment.md b/translations/br/1-Introduction/1-intro-to-ML/assignment.md deleted file mode 100644 index e307be1b7..000000000 --- a/translations/br/1-Introduction/1-intro-to-ML/assignment.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Comece a Trabalhar - -## Instruções - -Nesta atividade não avaliada, você deve revisar seus conhecimentos em Python e configurar seu ambiente para executar notebooks. - -Siga este [Caminho de Aprendizado em Python](https://docs.microsoft.com/learn/paths/python-language/?WT.mc_id=academic-77952-leestott) e, em seguida, configure seus sistemas assistindo a estes vídeos introdutórios: - -https://www.youtube.com/playlist?list=PLlrxD0HtieHhS8VzuMCfQD4uJ9yne1mE6 - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/2-history-of-ML/README.md b/translations/br/1-Introduction/2-history-of-ML/README.md deleted file mode 100644 index 4e9877229..000000000 --- a/translations/br/1-Introduction/2-history-of-ML/README.md +++ /dev/null @@ -1,164 +0,0 @@ - -# História do aprendizado de máquina - -![Resumo da história do aprendizado de máquina em um sketchnote](../../../../sketchnotes/ml-history.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- - -[![ML para iniciantes - História do aprendizado de máquina](https://img.youtube.com/vi/N6wxM4wZ7V0/0.jpg)](https://youtu.be/N6wxM4wZ7V0 "ML para iniciantes - História do aprendizado de máquina") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre esta lição. - -Nesta lição, vamos explorar os principais marcos na história do aprendizado de máquina e da inteligência artificial. - -A história da inteligência artificial (IA) como campo está entrelaçada com a história do aprendizado de máquina, já que os algoritmos e avanços computacionais que sustentam o aprendizado de máquina contribuíram para o desenvolvimento da IA. É útil lembrar que, embora esses campos como áreas distintas de estudo tenham começado a se cristalizar na década de 1950, importantes [descobertas algorítmicas, estatísticas, matemáticas, computacionais e técnicas](https://wikipedia.org/wiki/Timeline_of_machine_learning) precederam e se sobrepuseram a essa era. Na verdade, as pessoas têm pensado sobre essas questões por [centenas de anos](https://wikipedia.org/wiki/History_of_artificial_intelligence): este artigo discute as bases intelectuais históricas da ideia de uma 'máquina pensante'. - ---- -## Descobertas notáveis - -- 1763, 1812 [Teorema de Bayes](https://wikipedia.org/wiki/Bayes%27_theorem) e seus predecessores. Este teorema e suas aplicações fundamentam a inferência, descrevendo a probabilidade de um evento ocorrer com base em conhecimento prévio. -- 1805 [Teoria dos Mínimos Quadrados](https://wikipedia.org/wiki/Least_squares) pelo matemático francês Adrien-Marie Legendre. Esta teoria, que você aprenderá em nossa unidade de regressão, ajuda no ajuste de dados. -- 1913 [Cadeias de Markov](https://wikipedia.org/wiki/Markov_chain), nomeadas em homenagem ao matemático russo Andrey Markov, são usadas para descrever uma sequência de eventos possíveis com base em um estado anterior. -- 1957 [Perceptron](https://wikipedia.org/wiki/Perceptron) é um tipo de classificador linear inventado pelo psicólogo americano Frank Rosenblatt que fundamenta avanços em aprendizado profundo. - ---- - -- 1967 [Vizinho Mais Próximo](https://wikipedia.org/wiki/Nearest_neighbor) é um algoritmo originalmente projetado para mapear rotas. No contexto de aprendizado de máquina, é usado para detectar padrões. -- 1970 [Retropropagação](https://wikipedia.org/wiki/Backpropagation) é usada para treinar [redes neurais feedforward](https://wikipedia.org/wiki/Feedforward_neural_network). -- 1982 [Redes Neurais Recorrentes](https://wikipedia.org/wiki/Recurrent_neural_network) são redes neurais artificiais derivadas de redes neurais feedforward que criam gráficos temporais. - -✅ Faça uma pequena pesquisa. Quais outras datas se destacam como marcos na história do aprendizado de máquina e da IA? - ---- -## 1950: Máquinas que pensam - -Alan Turing, uma pessoa verdadeiramente notável que foi eleito [pelo público em 2019](https://wikipedia.org/wiki/Icons:_The_Greatest_Person_of_the_20th_Century) como o maior cientista do século 20, é creditado por ajudar a estabelecer as bases para o conceito de uma 'máquina que pode pensar'. Ele enfrentou críticos e sua própria necessidade de evidências empíricas desse conceito, em parte, criando o [Teste de Turing](https://www.bbc.com/news/technology-18475646), que você explorará em nossas lições de PLN. - ---- -## 1956: Projeto de Pesquisa de Verão em Dartmouth - -"O Projeto de Pesquisa de Verão em Dartmouth sobre inteligência artificial foi um evento seminal para a inteligência artificial como campo", e foi aqui que o termo 'inteligência artificial' foi cunhado ([fonte](https://250.dartmouth.edu/highlights/artificial-intelligence-ai-coined-dartmouth)). - -> Todo aspecto de aprendizado ou qualquer outra característica da inteligência pode, em princípio, ser descrito tão precisamente que uma máquina pode ser feita para simulá-lo. - ---- - -O pesquisador principal, o professor de matemática John McCarthy, esperava "prosseguir com base na conjectura de que todo aspecto de aprendizado ou qualquer outra característica da inteligência pode, em princípio, ser descrito tão precisamente que uma máquina pode ser feita para simulá-lo." Os participantes incluíram outro grande nome do campo, Marvin Minsky. - -O workshop é creditado por ter iniciado e incentivado várias discussões, incluindo "a ascensão de métodos simbólicos, sistemas focados em domínios limitados (primeiros sistemas especialistas) e sistemas dedutivos versus sistemas indutivos." ([fonte](https://wikipedia.org/wiki/Dartmouth_workshop)). - ---- -## 1956 - 1974: "Os anos dourados" - -Dos anos 1950 até meados dos anos 70, o otimismo era alto na esperança de que a IA pudesse resolver muitos problemas. Em 1967, Marvin Minsky afirmou confiantemente que "Dentro de uma geração... o problema de criar 'inteligência artificial' será substancialmente resolvido." (Minsky, Marvin (1967), Computation: Finite and Infinite Machines, Englewood Cliffs, N.J.: Prentice-Hall) - -Pesquisas em processamento de linguagem natural floresceram, buscas foram refinadas e tornadas mais poderosas, e o conceito de 'micro-mundos' foi criado, onde tarefas simples eram realizadas usando instruções em linguagem comum. - ---- - -A pesquisa foi bem financiada por agências governamentais, avanços foram feitos em computação e algoritmos, e protótipos de máquinas inteligentes foram construídos. Algumas dessas máquinas incluem: - -* [Shakey, o robô](https://wikipedia.org/wiki/Shakey_the_robot), que podia se mover e decidir como realizar tarefas 'inteligentemente'. - - ![Shakey, um robô inteligente](../../../../1-Introduction/2-history-of-ML/images/shakey.jpg) - > Shakey em 1972 - ---- - -* Eliza, um dos primeiros 'chatterbots', podia conversar com pessoas e agir como um 'terapeuta' primitivo. Você aprenderá mais sobre Eliza nas lições de PLN. - - ![Eliza, um bot](../../../../1-Introduction/2-history-of-ML/images/eliza.png) - > Uma versão de Eliza, um chatbot - ---- - -* "Blocks world" foi um exemplo de micro-mundo onde blocos podiam ser empilhados e organizados, e experimentos em ensinar máquinas a tomar decisões podiam ser testados. Avanços construídos com bibliotecas como [SHRDLU](https://wikipedia.org/wiki/SHRDLU) ajudaram a impulsionar o processamento de linguagem. - - [![blocks world com SHRDLU](https://img.youtube.com/vi/QAJz4YKUwqw/0.jpg)](https://www.youtube.com/watch?v=QAJz4YKUwqw "blocks world com SHRDLU") - - > 🎥 Clique na imagem acima para assistir a um vídeo: Blocks world com SHRDLU - ---- -## 1974 - 1980: "Inverno da IA" - -Por volta de meados dos anos 1970, tornou-se evidente que a complexidade de criar 'máquinas inteligentes' havia sido subestimada e que sua promessa, dada a capacidade computacional disponível, havia sido exagerada. O financiamento secou e a confiança no campo diminuiu. Alguns problemas que impactaram a confiança incluíram: ---- -- **Limitações**. A capacidade computacional era muito limitada. -- **Explosão combinatória**. A quantidade de parâmetros necessários para treinamento cresceu exponencialmente à medida que mais era exigido dos computadores, sem uma evolução paralela da capacidade computacional. -- **Escassez de dados**. Havia uma escassez de dados que dificultava o processo de teste, desenvolvimento e refinamento de algoritmos. -- **Estamos fazendo as perguntas certas?**. As próprias perguntas que estavam sendo feitas começaram a ser questionadas. Pesquisadores começaram a enfrentar críticas sobre suas abordagens: - - Testes de Turing foram questionados por meio, entre outras ideias, da 'teoria da sala chinesa', que postulava que "programar um computador digital pode fazê-lo parecer entender a linguagem, mas não poderia produzir compreensão real." ([fonte](https://plato.stanford.edu/entries/chinese-room/)) - - A ética de introduzir inteligências artificiais como o "terapeuta" ELIZA na sociedade foi desafiada. - ---- - -Ao mesmo tempo, várias escolas de pensamento em IA começaram a se formar. Uma dicotomia foi estabelecida entre práticas de ["IA desleixada" vs. "IA organizada"](https://wikipedia.org/wiki/Neats_and_scruffies). Laboratórios _desleixados_ ajustavam programas por horas até obterem os resultados desejados. Laboratórios _organizados_ "focavam em lógica e resolução formal de problemas". ELIZA e SHRDLU eram sistemas _desleixados_ bem conhecidos. Nos anos 1980, à medida que surgiu a demanda por sistemas de aprendizado de máquina reproduzíveis, a abordagem _organizada_ gradualmente tomou a dianteira, pois seus resultados são mais explicáveis. - ---- -## Sistemas especialistas nos anos 1980 - -À medida que o campo crescia, seus benefícios para os negócios tornaram-se mais claros, e nos anos 1980 também ocorreu a proliferação de 'sistemas especialistas'. "Sistemas especialistas estavam entre as primeiras formas verdadeiramente bem-sucedidas de software de inteligência artificial (IA)." ([fonte](https://wikipedia.org/wiki/Expert_system)). - -Este tipo de sistema é na verdade _híbrido_, consistindo parcialmente de um motor de regras que define requisitos de negócios e um motor de inferência que utiliza o sistema de regras para deduzir novos fatos. - -Esta era também viu uma atenção crescente às redes neurais. - ---- -## 1987 - 1993: "Resfriamento da IA" - -A proliferação de hardware especializado para sistemas especialistas teve o efeito infeliz de se tornar muito especializado. O surgimento dos computadores pessoais também competiu com esses sistemas grandes, especializados e centralizados. A democratização da computação havia começado, e isso eventualmente abriu caminho para a explosão moderna de big data. - ---- -## 1993 - 2011 - -Este período viu uma nova era para o aprendizado de máquina e a IA, permitindo resolver alguns dos problemas causados anteriormente pela falta de dados e capacidade computacional. A quantidade de dados começou a aumentar rapidamente e se tornar mais amplamente disponível, para o bem e para o mal, especialmente com o advento do smartphone por volta de 2007. A capacidade computacional expandiu exponencialmente, e os algoritmos evoluíram junto. O campo começou a ganhar maturidade à medida que os dias livres do passado começaram a se cristalizar em uma verdadeira disciplina. - ---- -## Hoje - -Hoje, o aprendizado de máquina e a IA tocam quase todas as partes de nossas vidas. Esta era exige uma compreensão cuidadosa dos riscos e dos potenciais efeitos desses algoritmos na vida humana. Como Brad Smith, da Microsoft, afirmou: "A tecnologia da informação levanta questões que vão ao cerne das proteções fundamentais dos direitos humanos, como privacidade e liberdade de expressão. Essas questões aumentam a responsabilidade das empresas de tecnologia que criam esses produtos. Em nossa visão, elas também exigem uma regulamentação governamental cuidadosa e o desenvolvimento de normas sobre usos aceitáveis" ([fonte](https://www.technologyreview.com/2019/12/18/102365/the-future-of-ais-impact-on-society/)). - ---- - -Ainda não se sabe o que o futuro reserva, mas é importante entender esses sistemas computacionais e o software e os algoritmos que eles executam. Esperamos que este currículo ajude você a obter uma melhor compreensão para que possa decidir por si mesmo. - -[![A história do aprendizado profundo](https://img.youtube.com/vi/mTtDfKgLm54/0.jpg)](https://www.youtube.com/watch?v=mTtDfKgLm54 "A história do aprendizado profundo") -> 🎥 Clique na imagem acima para assistir a um vídeo: Yann LeCun discute a história do aprendizado profundo nesta palestra - ---- -## 🚀Desafio - -Aprofunde-se em um desses momentos históricos e aprenda mais sobre as pessoas por trás deles. Há personagens fascinantes, e nenhuma descoberta científica foi criada em um vácuo cultural. O que você descobre? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- -## Revisão e autoestudo - -Aqui estão itens para assistir e ouvir: - -[Este podcast onde Amy Boyd discute a evolução da IA](http://runasradio.com/Shows/Show/739) - -[![A história da IA por Amy Boyd](https://img.youtube.com/vi/EJt3_bFYKss/0.jpg)](https://www.youtube.com/watch?v=EJt3_bFYKss "A história da IA por Amy Boyd") - ---- - -## Tarefa - -[Criar uma linha do tempo](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/2-history-of-ML/assignment.md b/translations/br/1-Introduction/2-history-of-ML/assignment.md deleted file mode 100644 index ed2985e93..000000000 --- a/translations/br/1-Introduction/2-history-of-ML/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Criar uma linha do tempo - -## Instruções - -Usando [este repositório](https://github.com/Digital-Humanities-Toolkit/timeline-builder), crie uma linha do tempo sobre algum aspecto da história dos algoritmos, matemática, estatística, IA ou ML, ou uma combinação desses temas. Você pode focar em uma pessoa, uma ideia ou um longo período de pensamento. Certifique-se de adicionar elementos multimídia. - -## Rubrica - -| Critérios | Exemplares | Adequado | Precisa de Melhorias | -| --------- | -------------------------------------------------- | --------------------------------------- | ---------------------------------------------------------------- | -| | Uma linha do tempo implantada é apresentada como uma página do GitHub | O código está incompleto e não foi implantado | A linha do tempo está incompleta, não bem pesquisada e não foi implantada | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/3-fairness/README.md b/translations/br/1-Introduction/3-fairness/README.md deleted file mode 100644 index c317fb4f1..000000000 --- a/translations/br/1-Introduction/3-fairness/README.md +++ /dev/null @@ -1,170 +0,0 @@ - -# Construindo soluções de Machine Learning com IA responsável - -![Resumo de IA responsável em Machine Learning em um sketchnote](../../../../sketchnotes/ml-fairness.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -Neste currículo, você começará a descobrir como o aprendizado de máquina pode impactar e já está impactando nossas vidas cotidianas. Atualmente, sistemas e modelos estão envolvidos em tarefas de tomada de decisão diária, como diagnósticos de saúde, aprovações de empréstimos ou detecção de fraudes. Por isso, é importante que esses modelos funcionem bem para fornecer resultados confiáveis. Assim como qualquer aplicação de software, sistemas de IA podem não atender às expectativas ou ter resultados indesejáveis. É por isso que é essencial entender e explicar o comportamento de um modelo de IA. - -Imagine o que pode acontecer quando os dados usados para construir esses modelos carecem de certos grupos demográficos, como raça, gênero, visão política, religião, ou representam esses grupos de forma desproporcional. E se a saída do modelo for interpretada de forma a favorecer algum grupo demográfico? Qual é a consequência para a aplicação? Além disso, o que acontece quando o modelo tem um resultado adverso e prejudica pessoas? Quem é responsável pelo comportamento dos sistemas de IA? Estas são algumas das questões que exploraremos neste currículo. - -Nesta lição, você irá: - -- Aumentar sua conscientização sobre a importância da equidade no aprendizado de máquina e os danos relacionados à falta de equidade. -- Familiarizar-se com a prática de explorar outliers e cenários incomuns para garantir confiabilidade e segurança. -- Compreender a necessidade de capacitar todos ao projetar sistemas inclusivos. -- Explorar como é vital proteger a privacidade e a segurança dos dados e das pessoas. -- Ver a importância de ter uma abordagem transparente para explicar o comportamento dos modelos de IA. -- Ser consciente de como a responsabilidade é essencial para construir confiança em sistemas de IA. - -## Pré-requisito - -Como pré-requisito, faça o "Caminho de Aprendizado sobre Princípios de IA Responsável" e assista ao vídeo abaixo sobre o tema: - -Saiba mais sobre IA Responsável seguindo este [Caminho de Aprendizado](https://docs.microsoft.com/learn/modules/responsible-ai-principles/?WT.mc_id=academic-77952-leestott) - -[![Abordagem da Microsoft para IA Responsável](https://img.youtube.com/vi/dnC8-uUZXSc/0.jpg)](https://youtu.be/dnC8-uUZXSc "Abordagem da Microsoft para IA Responsável") - -> 🎥 Clique na imagem acima para assistir ao vídeo: Abordagem da Microsoft para IA Responsável - -## Equidade - -Sistemas de IA devem tratar todos de forma justa e evitar afetar grupos semelhantes de pessoas de maneiras diferentes. Por exemplo, quando sistemas de IA fornecem orientações sobre tratamento médico, solicitações de empréstimos ou emprego, eles devem fazer as mesmas recomendações para todos com sintomas, circunstâncias financeiras ou qualificações profissionais semelhantes. Cada um de nós, como seres humanos, carrega preconceitos herdados que afetam nossas decisões e ações. Esses preconceitos podem estar evidentes nos dados que usamos para treinar sistemas de IA. Essa manipulação pode, às vezes, acontecer de forma não intencional. Muitas vezes, é difícil perceber conscientemente quando você está introduzindo preconceitos nos dados. - -**“Injustiça”** abrange impactos negativos, ou “danos”, para um grupo de pessoas, como aqueles definidos em termos de raça, gênero, idade ou status de deficiência. Os principais danos relacionados à equidade podem ser classificados como: - -- **Alocação**, quando, por exemplo, um gênero ou etnia é favorecido em detrimento de outro. -- **Qualidade do serviço**. Se você treinar os dados para um cenário específico, mas a realidade for muito mais complexa, isso leva a um serviço de desempenho ruim. Por exemplo, um dispensador de sabão que não consegue detectar pessoas com pele escura. [Referência](https://gizmodo.com/why-cant-this-soap-dispenser-identify-dark-skin-1797931773) -- **Denigração**. Criticar ou rotular algo ou alguém de forma injusta. Por exemplo, uma tecnologia de rotulagem de imagens que infamemente rotulou imagens de pessoas de pele escura como gorilas. -- **Super ou sub-representação**. A ideia de que um determinado grupo não é visto em uma certa profissão, e qualquer serviço ou função que continue promovendo isso está contribuindo para o dano. -- **Estereotipagem**. Associar um grupo específico a atributos pré-definidos. Por exemplo, um sistema de tradução entre inglês e turco pode ter imprecisões devido a palavras com associações estereotipadas de gênero. - -![tradução para turco](../../../../1-Introduction/3-fairness/images/gender-bias-translate-en-tr.png) -> tradução para turco - -![tradução de volta para inglês](../../../../1-Introduction/3-fairness/images/gender-bias-translate-tr-en.png) -> tradução de volta para inglês - -Ao projetar e testar sistemas de IA, precisamos garantir que a IA seja justa e não programada para tomar decisões tendenciosas ou discriminatórias, que também são proibidas para seres humanos. Garantir equidade em IA e aprendizado de máquina continua sendo um desafio sociotécnico complexo. - -### Confiabilidade e segurança - -Para construir confiança, sistemas de IA precisam ser confiáveis, seguros e consistentes em condições normais e inesperadas. É importante saber como os sistemas de IA se comportarão em uma variedade de situações, especialmente quando são casos extremos. Ao construir soluções de IA, é necessário um foco substancial em como lidar com uma ampla variedade de circunstâncias que as soluções de IA podem encontrar. Por exemplo, um carro autônomo precisa priorizar a segurança das pessoas. Como resultado, a IA que alimenta o carro precisa considerar todos os cenários possíveis que o carro pode enfrentar, como noite, tempestades, nevascas, crianças correndo pela rua, animais de estimação, construções na estrada, etc. Quão bem um sistema de IA pode lidar com uma ampla gama de condições de forma confiável e segura reflete o nível de antecipação que o cientista de dados ou desenvolvedor de IA considerou durante o design ou teste do sistema. - -> [🎥 Clique aqui para assistir ao vídeo: ](https://www.microsoft.com/videoplayer/embed/RE4vvIl) - -### Inclusão - -Sistemas de IA devem ser projetados para engajar e capacitar todos. Ao projetar e implementar sistemas de IA, cientistas de dados e desenvolvedores de IA identificam e abordam possíveis barreiras no sistema que poderiam excluir pessoas de forma não intencional. Por exemplo, existem 1 bilhão de pessoas com deficiência em todo o mundo. Com o avanço da IA, elas podem acessar uma ampla gama de informações e oportunidades mais facilmente em suas vidas diárias. Ao abordar as barreiras, cria-se oportunidades para inovar e desenvolver produtos de IA com melhores experiências que beneficiem todos. - -> [🎥 Clique aqui para assistir ao vídeo: inclusão em IA](https://www.microsoft.com/videoplayer/embed/RE4vl9v) - -### Segurança e privacidade - -Sistemas de IA devem ser seguros e respeitar a privacidade das pessoas. As pessoas têm menos confiança em sistemas que colocam sua privacidade, informações ou vidas em risco. Ao treinar modelos de aprendizado de máquina, dependemos de dados para produzir os melhores resultados. Ao fazer isso, a origem dos dados e sua integridade devem ser consideradas. Por exemplo, os dados foram enviados por usuários ou estão disponíveis publicamente? Além disso, ao trabalhar com os dados, é crucial desenvolver sistemas de IA que possam proteger informações confidenciais e resistir a ataques. À medida que a IA se torna mais prevalente, proteger a privacidade e garantir a segurança de informações pessoais e empresariais importantes está se tornando mais crítico e complexo. Questões de privacidade e segurança de dados exigem atenção especial para IA porque o acesso aos dados é essencial para que os sistemas de IA façam previsões e decisões precisas e informadas sobre as pessoas. - -> [🎥 Clique aqui para assistir ao vídeo: segurança em IA](https://www.microsoft.com/videoplayer/embed/RE4voJF) - -- Como indústria, fizemos avanços significativos em privacidade e segurança, impulsionados significativamente por regulamentações como o GDPR (Regulamento Geral de Proteção de Dados). -- No entanto, com sistemas de IA, devemos reconhecer a tensão entre a necessidade de mais dados pessoais para tornar os sistemas mais personalizados e eficazes – e a privacidade. -- Assim como com o nascimento de computadores conectados à internet, também estamos vendo um grande aumento no número de problemas de segurança relacionados à IA. -- Ao mesmo tempo, vimos a IA sendo usada para melhorar a segurança. Por exemplo, a maioria dos scanners antivírus modernos é alimentada por heurísticas de IA. -- Precisamos garantir que nossos processos de ciência de dados se harmonizem com as práticas mais recentes de privacidade e segurança. - -### Transparência - -Sistemas de IA devem ser compreensíveis. Uma parte crucial da transparência é explicar o comportamento dos sistemas de IA e seus componentes. Melhorar a compreensão dos sistemas de IA exige que as partes interessadas compreendam como e por que eles funcionam, para que possam identificar possíveis problemas de desempenho, preocupações de segurança e privacidade, preconceitos, práticas excludentes ou resultados indesejados. Também acreditamos que aqueles que usam sistemas de IA devem ser honestos e transparentes sobre quando, por que e como escolhem implantá-los, bem como sobre as limitações dos sistemas que utilizam. Por exemplo, se um banco usa um sistema de IA para apoiar suas decisões de empréstimos ao consumidor, é importante examinar os resultados e entender quais dados influenciam as recomendações do sistema. Governos estão começando a regulamentar a IA em diferentes indústrias, então cientistas de dados e organizações devem explicar se um sistema de IA atende aos requisitos regulatórios, especialmente quando há um resultado indesejável. - -> [🎥 Clique aqui para assistir ao vídeo: transparência em IA](https://www.microsoft.com/videoplayer/embed/RE4voJF) - -- Como os sistemas de IA são tão complexos, é difícil entender como eles funcionam e interpretar os resultados. -- Essa falta de compreensão afeta a forma como esses sistemas são gerenciados, operacionalizados e documentados. -- Mais importante ainda, essa falta de compreensão afeta as decisões tomadas com base nos resultados que esses sistemas produzem. - -### Responsabilidade - -As pessoas que projetam e implantam sistemas de IA devem ser responsáveis pelo funcionamento de seus sistemas. A necessidade de responsabilidade é particularmente crucial com tecnologias sensíveis, como reconhecimento facial. Recentemente, houve uma demanda crescente por tecnologia de reconhecimento facial, especialmente de organizações de aplicação da lei que veem o potencial da tecnologia em usos como encontrar crianças desaparecidas. No entanto, essas tecnologias podem ser usadas por um governo para colocar em risco as liberdades fundamentais de seus cidadãos, por exemplo, permitindo vigilância contínua de indivíduos específicos. Portanto, cientistas de dados e organizações precisam ser responsáveis pelo impacto de seus sistemas de IA sobre indivíduos ou a sociedade. - -[![Pesquisador líder em IA alerta sobre vigilância em massa por meio de reconhecimento facial](../../../../1-Introduction/3-fairness/images/accountability.png)](https://www.youtube.com/watch?v=Wldt8P5V6D0 "Abordagem da Microsoft para IA Responsável") - -> 🎥 Clique na imagem acima para assistir ao vídeo: Alertas sobre vigilância em massa por meio de reconhecimento facial - -No final, uma das maiores questões para nossa geração, como a primeira geração que está trazendo IA para a sociedade, é como garantir que os computadores permaneçam responsáveis perante as pessoas e como garantir que as pessoas que projetam computadores permaneçam responsáveis perante todos os outros. - -## Avaliação de impacto - -Antes de treinar um modelo de aprendizado de máquina, é importante realizar uma avaliação de impacto para entender o propósito do sistema de IA; qual é o uso pretendido; onde ele será implantado; e quem interagirá com o sistema. Essas informações são úteis para os revisores ou testadores avaliarem o sistema e saberem quais fatores considerar ao identificar riscos potenciais e consequências esperadas. - -As seguintes áreas devem ser focadas ao realizar uma avaliação de impacto: - -* **Impacto adverso sobre indivíduos**. Estar ciente de quaisquer restrições ou requisitos, uso não suportado ou limitações conhecidas que possam prejudicar o desempenho do sistema é vital para garantir que o sistema não seja usado de forma a causar danos às pessoas. -* **Requisitos de dados**. Compreender como e onde o sistema usará dados permite que os revisores explorem quaisquer requisitos de dados que você precise considerar (por exemplo, regulamentações de dados como GDPR ou HIPAA). Além disso, examine se a origem ou quantidade de dados é substancial para o treinamento. -* **Resumo do impacto**. Reúna uma lista de possíveis danos que podem surgir do uso do sistema. Ao longo do ciclo de vida do aprendizado de máquina, revise se os problemas identificados foram mitigados ou resolvidos. -* **Metas aplicáveis** para cada um dos seis princípios fundamentais. Avalie se as metas de cada princípio foram atendidas e se há lacunas. - -## Depuração com IA responsável - -Semelhante à depuração de uma aplicação de software, depurar um sistema de IA é um processo necessário para identificar e resolver problemas no sistema. Há muitos fatores que podem afetar o desempenho de um modelo ou sua responsabilidade. A maioria das métricas tradicionais de desempenho de modelos são agregados quantitativos do desempenho de um modelo, o que não é suficiente para analisar como um modelo viola os princípios de IA responsável. Além disso, um modelo de aprendizado de máquina é uma "caixa preta", o que dificulta entender o que impulsiona seus resultados ou fornecer explicações quando ele comete erros. Mais adiante neste curso, aprenderemos como usar o painel de IA Responsável para ajudar a depurar sistemas de IA. O painel fornece uma ferramenta holística para cientistas de dados e desenvolvedores de IA realizarem: - -* **Análise de erros**. Para identificar a distribuição de erros do modelo que pode afetar a equidade ou confiabilidade do sistema. -* **Visão geral do modelo**. Para descobrir onde há disparidades no desempenho do modelo entre diferentes grupos de dados. -* **Análise de dados**. Para entender a distribuição dos dados e identificar possíveis preconceitos nos dados que possam levar a problemas de equidade, inclusão e confiabilidade. -* **Interpretabilidade do modelo**. Para entender o que afeta ou influencia as previsões do modelo. Isso ajuda a explicar o comportamento do modelo, o que é importante para transparência e responsabilidade. - -## 🚀 Desafio - -Para evitar que danos sejam introduzidos desde o início, devemos: - -- ter diversidade de origens e perspectivas entre as pessoas que trabalham nos sistemas -- investir em conjuntos de dados que reflitam a diversidade de nossa sociedade -- desenvolver melhores métodos ao longo do ciclo de vida do aprendizado de máquina para detectar e corrigir problemas de IA responsável quando eles ocorrerem - -Pense em cenários da vida real onde a falta de confiabilidade de um modelo é evidente na construção e uso do modelo. O que mais devemos considerar? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Nesta lição, você aprendeu alguns conceitos básicos sobre equidade e injustiça no aprendizado de máquina. -Assista a este workshop para se aprofundar nos tópicos: - -- Em busca de IA responsável: Colocando princípios em prática por Besmira Nushi, Mehrnoosh Sameki e Amit Sharma - -[![Responsible AI Toolbox: Um framework de código aberto para construir IA responsável](https://img.youtube.com/vi/tGgJCrA-MZU/0.jpg)](https://www.youtube.com/watch?v=tGgJCrA-MZU "RAI Toolbox: Um framework de código aberto para construir IA responsável") - -> 🎥 Clique na imagem acima para assistir ao vídeo: RAI Toolbox: Um framework de código aberto para construir IA responsável por Besmira Nushi, Mehrnoosh Sameki e Amit Sharma - -Além disso, leia: - -- Centro de recursos de IA responsável da Microsoft: [Responsible AI Resources – Microsoft AI](https://www.microsoft.com/ai/responsible-ai-resources?activetab=pivot1%3aprimaryr4) - -- Grupo de pesquisa FATE da Microsoft: [FATE: Fairness, Accountability, Transparency, and Ethics in AI - Microsoft Research](https://www.microsoft.com/research/theme/fate/) - -RAI Toolbox: - -- [Repositório GitHub do Responsible AI Toolbox](https://github.com/microsoft/responsible-ai-toolbox) - -Leia sobre as ferramentas do Azure Machine Learning para garantir equidade: - -- [Azure Machine Learning](https://docs.microsoft.com/azure/machine-learning/concept-fairness-ml?WT.mc_id=academic-77952-leestott) - -## Tarefa - -[Explore o RAI Toolbox](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/3-fairness/assignment.md b/translations/br/1-Introduction/3-fairness/assignment.md deleted file mode 100644 index 43d4e6089..000000000 --- a/translations/br/1-Introduction/3-fairness/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Explore o Toolbox de IA Responsável - -## Instruções - -Nesta lição, você aprendeu sobre o Toolbox de IA Responsável, um "projeto de código aberto e orientado pela comunidade para ajudar cientistas de dados a analisar e melhorar sistemas de IA." Para esta tarefa, explore um dos [notebooks](https://github.com/microsoft/responsible-ai-toolbox/blob/main/notebooks/responsibleaidashboard/getting-started.ipynb) do Toolbox de IA Responsável e relate suas descobertas em um artigo ou apresentação. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita Melhorias | -| --------- | -------- | -------- | ------------------- | -| | Um artigo ou apresentação em PowerPoint é apresentado discutindo os sistemas do Fairlearn, o notebook que foi executado e as conclusões obtidas a partir da execução | Um artigo é apresentado sem conclusões | Nenhum artigo é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/4-techniques-of-ML/README.md b/translations/br/1-Introduction/4-techniques-of-ML/README.md deleted file mode 100644 index 88d126b0c..000000000 --- a/translations/br/1-Introduction/4-techniques-of-ML/README.md +++ /dev/null @@ -1,132 +0,0 @@ - -# Técnicas de Aprendizado de Máquina - -O processo de construir, usar e manter modelos de aprendizado de máquina e os dados que eles utilizam é muito diferente de muitos outros fluxos de trabalho de desenvolvimento. Nesta lição, vamos desmistificar o processo e delinear as principais técnicas que você precisa conhecer. Você irá: - -- Compreender os processos que sustentam o aprendizado de máquina em um nível geral. -- Explorar conceitos básicos como 'modelos', 'previsões' e 'dados de treinamento'. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -[![ML para iniciantes - Técnicas de Aprendizado de Máquina](https://img.youtube.com/vi/4NGM0U2ZSHU/0.jpg)](https://youtu.be/4NGM0U2ZSHU "ML para iniciantes - Técnicas de Aprendizado de Máquina") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre esta lição. - -## Introdução - -Em um nível geral, a prática de criar processos de aprendizado de máquina (ML) é composta por várias etapas: - -1. **Definir a pergunta**. A maioria dos processos de ML começa com uma pergunta que não pode ser respondida por um programa condicional simples ou um mecanismo baseado em regras. Essas perguntas geralmente giram em torno de previsões baseadas em um conjunto de dados. -2. **Coletar e preparar os dados**. Para responder à sua pergunta, você precisa de dados. A qualidade e, às vezes, a quantidade dos seus dados determinarão o quão bem você pode responder à pergunta inicial. Visualizar os dados é um aspecto importante desta fase. Esta etapa também inclui dividir os dados em grupos de treinamento e teste para construir um modelo. -3. **Escolher um método de treinamento**. Dependendo da sua pergunta e da natureza dos seus dados, você precisa escolher como deseja treinar um modelo para refletir melhor seus dados e fazer previsões precisas. Esta é a parte do processo de ML que exige expertise específica e, frequentemente, uma quantidade considerável de experimentação. -4. **Treinar o modelo**. Usando seus dados de treinamento, você aplicará vários algoritmos para treinar um modelo que reconheça padrões nos dados. O modelo pode usar pesos internos que podem ser ajustados para privilegiar certas partes dos dados em detrimento de outras, a fim de construir um modelo melhor. -5. **Avaliar o modelo**. Você usa dados nunca antes vistos (seus dados de teste) do conjunto coletado para verificar o desempenho do modelo. -6. **Ajustar parâmetros**. Com base no desempenho do modelo, você pode refazer o processo usando diferentes parâmetros ou variáveis que controlam o comportamento dos algoritmos usados para treinar o modelo. -7. **Prever**. Use novas entradas para testar a precisão do modelo. - -## Qual pergunta fazer - -Os computadores são particularmente habilidosos em descobrir padrões ocultos nos dados. Essa utilidade é muito útil para pesquisadores que têm perguntas sobre um determinado domínio que não podem ser facilmente respondidas criando um mecanismo baseado em regras condicionais. Dado um trabalho atuarial, por exemplo, um cientista de dados pode construir regras personalizadas sobre a mortalidade de fumantes versus não fumantes. - -Quando muitas outras variáveis são incluídas na equação, no entanto, um modelo de ML pode ser mais eficiente para prever taxas de mortalidade futuras com base no histórico de saúde anterior. Um exemplo mais animador pode ser fazer previsões meteorológicas para o mês de abril em um determinado local com base em dados que incluem latitude, longitude, mudanças climáticas, proximidade ao oceano, padrões de correntes de jato e mais. - -✅ Este [slide deck](https://www2.cisl.ucar.edu/sites/default/files/2021-10/0900%20June%2024%20Haupt_0.pdf) sobre modelos meteorológicos oferece uma perspectiva histórica sobre o uso de ML na análise climática. - -## Tarefas pré-construção - -Antes de começar a construir seu modelo, há várias tarefas que você precisa completar. Para testar sua pergunta e formar uma hipótese com base nas previsões de um modelo, você precisa identificar e configurar vários elementos. - -### Dados - -Para responder à sua pergunta com algum grau de certeza, você precisa de uma boa quantidade de dados do tipo certo. Há duas coisas que você precisa fazer neste momento: - -- **Coletar dados**. Lembre-se da lição anterior sobre justiça na análise de dados e colete seus dados com cuidado. Esteja atento às fontes desses dados, quaisquer vieses inerentes que possam ter e documente sua origem. -- **Preparar dados**. Há várias etapas no processo de preparação de dados. Você pode precisar reunir dados e normalizá-los se vierem de fontes diversas. Você pode melhorar a qualidade e a quantidade dos dados por meio de vários métodos, como converter strings em números (como fazemos em [Clustering](../../5-Clustering/1-Visualize/README.md)). Você também pode gerar novos dados com base nos originais (como fazemos em [Classificação](../../4-Classification/1-Introduction/README.md)). Você pode limpar e editar os dados (como faremos antes da lição de [Aplicativo Web](../../3-Web-App/README.md)). Por fim, pode ser necessário randomizar e embaralhar os dados, dependendo das técnicas de treinamento. - -✅ Após coletar e processar seus dados, reserve um momento para verificar se sua estrutura permitirá que você responda à pergunta pretendida. Pode ser que os dados não funcionem bem na tarefa proposta, como descobrimos em nossas lições de [Clustering](../../5-Clustering/1-Visualize/README.md)! - -### Features e Target - -Uma [feature](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) é uma propriedade mensurável dos seus dados. Em muitos conjuntos de dados, ela é expressa como um cabeçalho de coluna, como 'data', 'tamanho' ou 'cor'. Sua variável de feature, geralmente representada como `X` no código, representa a variável de entrada que será usada para treinar o modelo. - -Um target é aquilo que você está tentando prever. O target, geralmente representado como `y` no código, representa a resposta à pergunta que você está tentando fazer com seus dados: em dezembro, qual **cor** de abóbora será mais barata? Em São Francisco, quais bairros terão o melhor **preço** de imóveis? Às vezes, o target também é chamado de atributo de rótulo. - -### Selecionando sua variável de feature - -🎓 **Seleção de Features e Extração de Features** Como saber qual variável escolher ao construir um modelo? Você provavelmente passará por um processo de seleção ou extração de features para escolher as variáveis certas para o modelo mais eficiente. No entanto, elas não são a mesma coisa: "A extração de features cria novas features a partir de funções das features originais, enquanto a seleção de features retorna um subconjunto das features." ([fonte](https://wikipedia.org/wiki/Feature_selection)) - -### Visualizar seus dados - -Um aspecto importante do kit de ferramentas do cientista de dados é o poder de visualizar dados usando várias bibliotecas excelentes, como Seaborn ou MatPlotLib. Representar seus dados visualmente pode permitir que você descubra correlações ocultas que pode aproveitar. Suas visualizações também podem ajudar a identificar vieses ou dados desbalanceados (como descobrimos em [Classificação](../../4-Classification/2-Classifiers-1/README.md)). - -### Dividir seu conjunto de dados - -Antes de treinar, você precisa dividir seu conjunto de dados em duas ou mais partes de tamanhos desiguais que ainda representem bem os dados. - -- **Treinamento**. Esta parte do conjunto de dados é ajustada ao seu modelo para treiná-lo. Este conjunto constitui a maior parte do conjunto de dados original. -- **Teste**. Um conjunto de teste é um grupo independente de dados, frequentemente extraído dos dados originais, que você usa para confirmar o desempenho do modelo construído. -- **Validação**. Um conjunto de validação é um grupo menor e independente de exemplos que você usa para ajustar os hiperparâmetros ou a arquitetura do modelo para melhorá-lo. Dependendo do tamanho dos seus dados e da pergunta que você está fazendo, pode não ser necessário construir este terceiro conjunto (como observamos em [Previsão de Séries Temporais](../../7-TimeSeries/1-Introduction/README.md)). - -## Construindo um modelo - -Usando seus dados de treinamento, seu objetivo é construir um modelo, ou uma representação estatística dos seus dados, usando vários algoritmos para **treiná-lo**. Treinar um modelo o expõe aos dados e permite que ele faça suposições sobre padrões percebidos que descobre, valida e aceita ou rejeita. - -### Decidir sobre um método de treinamento - -Dependendo da sua pergunta e da natureza dos seus dados, você escolherá um método para treiná-lo. Explorando a [documentação do Scikit-learn](https://scikit-learn.org/stable/user_guide.html) - que usamos neste curso - você pode explorar várias maneiras de treinar um modelo. Dependendo da sua experiência, pode ser necessário tentar vários métodos diferentes para construir o melhor modelo. É provável que você passe por um processo em que cientistas de dados avaliam o desempenho de um modelo alimentando-o com dados não vistos, verificando sua precisão, vieses e outros problemas que degradam a qualidade, e selecionando o método de treinamento mais apropriado para a tarefa. - -### Treinar um modelo - -Com seus dados de treinamento em mãos, você está pronto para 'ajustá-los' e criar um modelo. Você notará que em muitas bibliotecas de ML encontrará o código 'model.fit' - é neste momento que você envia sua variável de feature como um array de valores (geralmente 'X') e uma variável de target (geralmente 'y'). - -### Avaliar o modelo - -Uma vez concluído o processo de treinamento (pode levar muitas iterações, ou 'épocas', para treinar um modelo grande), você poderá avaliar a qualidade do modelo usando dados de teste para medir seu desempenho. Esses dados são um subconjunto dos dados originais que o modelo ainda não analisou. Você pode imprimir uma tabela de métricas sobre a qualidade do modelo. - -🎓 **Ajuste do modelo** - -No contexto de aprendizado de máquina, ajuste do modelo refere-se à precisão da função subjacente do modelo ao tentar analisar dados com os quais não está familiarizado. - -🎓 **Subajuste** e **superajuste** são problemas comuns que degradam a qualidade do modelo, pois ele se ajusta de forma insuficiente ou excessiva. Isso faz com que o modelo faça previsões muito alinhadas ou pouco alinhadas com seus dados de treinamento. Um modelo superajustado prevê os dados de treinamento muito bem porque aprendeu os detalhes e ruídos dos dados excessivamente. Um modelo subajustado não é preciso, pois não consegue analisar com precisão nem seus dados de treinamento nem os dados que ainda não 'viu'. - -![modelo superajustado](../../../../1-Introduction/4-techniques-of-ML/images/overfitting.png) -> Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -## Ajuste de parâmetros - -Depois de concluir o treinamento inicial, observe a qualidade do modelo e considere melhorá-lo ajustando seus 'hiperparâmetros'. Leia mais sobre o processo [na documentação](https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters?WT.mc_id=academic-77952-leestott). - -## Previsão - -Este é o momento em que você pode usar dados completamente novos para testar a precisão do modelo. Em um cenário de ML 'aplicado', onde você está construindo ativos web para usar o modelo em produção, este processo pode envolver coletar entrada do usuário (um clique de botão, por exemplo) para definir uma variável e enviá-la ao modelo para inferência ou avaliação. - -Nestes módulos, você descobrirá como usar essas etapas para preparar, construir, testar, avaliar e prever - todos os gestos de um cientista de dados e mais, enquanto avança em sua jornada para se tornar um engenheiro de ML 'full stack'. - ---- - -## 🚀Desafio - -Desenhe um fluxograma refletindo as etapas de um profissional de ML. Onde você se vê agora no processo? Onde você prevê que encontrará dificuldades? O que parece fácil para você? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Pesquise online entrevistas com cientistas de dados que discutem seu trabalho diário. Aqui está [uma](https://www.youtube.com/watch?v=Z3IjgbbCEfs). - -## Tarefa - -[Entrevistar um cientista de dados](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/4-techniques-of-ML/assignment.md b/translations/br/1-Introduction/4-techniques-of-ML/assignment.md deleted file mode 100644 index 633edf524..000000000 --- a/translations/br/1-Introduction/4-techniques-of-ML/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Entrevista com um cientista de dados - -## Instruções - -Na sua empresa, em um grupo de usuários, ou entre seus amigos ou colegas de estudo, converse com alguém que trabalha profissionalmente como cientista de dados. Escreva um pequeno artigo (500 palavras) sobre as ocupações diárias dessa pessoa. Eles são especialistas ou trabalham de forma 'full stack'? - -## Rubrica - -| Critérios | Exemplar | Adequado | Precisa Melhorar | -| --------- | ----------------------------------------------------------------------------------- | ------------------------------------------------------------------ | --------------------- | -| | Um artigo com o comprimento correto, com fontes atribuídas, apresentado como um arquivo .doc | O artigo tem atribuições inadequadas ou é mais curto que o comprimento exigido | Nenhum artigo é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/1-Introduction/README.md b/translations/br/1-Introduction/README.md deleted file mode 100644 index d7adbb714..000000000 --- a/translations/br/1-Introduction/README.md +++ /dev/null @@ -1,37 +0,0 @@ - -# Introdução ao aprendizado de máquina - -Nesta seção do currículo, você será apresentado aos conceitos básicos que fundamentam o campo do aprendizado de máquina, o que ele é, e aprenderá sobre sua história e as técnicas que os pesquisadores utilizam para trabalhar com ele. Vamos explorar juntos este novo mundo do aprendizado de máquina! - -![globo](../../../translated_images/pt-BR/globe.59f26379ceb40428.webp) -> Foto por Bill Oxford no Unsplash - -### Aulas - -1. [Introdução ao aprendizado de máquina](1-intro-to-ML/README.md) -1. [A história do aprendizado de máquina e da IA](2-history-of-ML/README.md) -1. [Equidade e aprendizado de máquina](3-fairness/README.md) -1. [Técnicas de aprendizado de máquina](4-techniques-of-ML/README.md) - -### Créditos - -"Introdução ao Aprendizado de Máquina" foi escrito com ♥️ por uma equipe de pessoas incluindo [Muhammad Sakib Khan Inan](https://twitter.com/Sakibinan), [Ornella Altunyan](https://twitter.com/ornelladotcom) e [Jen Looper](https://twitter.com/jenlooper) - -"A História do Aprendizado de Máquina" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper) e [Amy Boyd](https://twitter.com/AmyKateNicho) - -"Equidade e Aprendizado de Máquina" foi escrito com ♥️ por [Tomomi Imura](https://twitter.com/girliemac) - -"Técnicas de Aprendizado de Máquina" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper) e [Chris Noring](https://twitter.com/softchris) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/1-Tools/README.md b/translations/br/2-Regression/1-Tools/README.md deleted file mode 100644 index be4c81b76..000000000 --- a/translations/br/2-Regression/1-Tools/README.md +++ /dev/null @@ -1,239 +0,0 @@ - -# Introdução ao Python e Scikit-learn para modelos de regressão - -![Resumo de regressões em um sketchnote](../../../../sketchnotes/ml-regression.png) - -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/1-Tools/solution/R/lesson_1.html) - -## Introdução - -Nestas quatro lições, você descobrirá como construir modelos de regressão. Vamos discutir para que eles servem em breve. Mas antes de começar, certifique-se de ter as ferramentas certas para iniciar o processo! - -Nesta lição, você aprenderá a: - -- Configurar seu computador para tarefas locais de aprendizado de máquina. -- Trabalhar com notebooks Jupyter. -- Utilizar Scikit-learn, incluindo sua instalação. -- Explorar regressão linear com um exercício prático. - -## Instalações e configurações - -[![ML para iniciantes - Configure suas ferramentas para criar modelos de aprendizado de máquina](https://img.youtube.com/vi/-DfeD2k2Kj0/0.jpg)](https://youtu.be/-DfeD2k2Kj0 "ML para iniciantes - Configure suas ferramentas para criar modelos de aprendizado de máquina") - -> 🎥 Clique na imagem acima para um vídeo curto sobre como configurar seu computador para ML. - -1. **Instale o Python**. Certifique-se de que o [Python](https://www.python.org/downloads/) está instalado em seu computador. Você usará Python para muitas tarefas de ciência de dados e aprendizado de máquina. A maioria dos sistemas de computador já inclui uma instalação do Python. Há também [Pacotes de Codificação Python](https://code.visualstudio.com/learn/educators/installers?WT.mc_id=academic-77952-leestott) úteis disponíveis para facilitar a configuração para alguns usuários. - - Algumas utilizações do Python, no entanto, exigem uma versão específica do software, enquanto outras requerem uma versão diferente. Por essa razão, é útil trabalhar dentro de um [ambiente virtual](https://docs.python.org/3/library/venv.html). - -2. **Instale o Visual Studio Code**. Certifique-se de que o Visual Studio Code está instalado em seu computador. Siga estas instruções para [instalar o Visual Studio Code](https://code.visualstudio.com/) para a instalação básica. Você usará Python no Visual Studio Code neste curso, então pode ser útil revisar como [configurar o Visual Studio Code](https://docs.microsoft.com/learn/modules/python-install-vscode?WT.mc_id=academic-77952-leestott) para desenvolvimento em Python. - - > Familiarize-se com Python trabalhando nesta coleção de [módulos de aprendizado](https://docs.microsoft.com/users/jenlooper-2911/collections/mp1pagggd5qrq7?WT.mc_id=academic-77952-leestott) - > - > [![Configurar Python com Visual Studio Code](https://img.youtube.com/vi/yyQM70vi7V8/0.jpg)](https://youtu.be/yyQM70vi7V8 "Configurar Python com Visual Studio Code") - > - > 🎥 Clique na imagem acima para um vídeo: usando Python no VS Code. - -3. **Instale o Scikit-learn**, seguindo [estas instruções](https://scikit-learn.org/stable/install.html). Como você precisa garantir que está usando Python 3, é recomendado que utilize um ambiente virtual. Note que, se estiver instalando esta biblioteca em um Mac M1, há instruções especiais na página vinculada acima. - -4. **Instale o Jupyter Notebook**. Você precisará [instalar o pacote Jupyter](https://pypi.org/project/jupyter/). - -## Seu ambiente de autoria de ML - -Você usará **notebooks** para desenvolver seu código Python e criar modelos de aprendizado de máquina. Este tipo de arquivo é uma ferramenta comum para cientistas de dados e pode ser identificado por seu sufixo ou extensão `.ipynb`. - -Notebooks são um ambiente interativo que permite ao desenvolvedor tanto codificar quanto adicionar notas e escrever documentação em torno do código, o que é bastante útil para projetos experimentais ou orientados à pesquisa. - -[![ML para iniciantes - Configure Jupyter Notebooks para começar a construir modelos de regressão](https://img.youtube.com/vi/7E-jC8FLA2E/0.jpg)](https://youtu.be/7E-jC8FLA2E "ML para iniciantes - Configure Jupyter Notebooks para começar a construir modelos de regressão") - -> 🎥 Clique na imagem acima para um vídeo curto sobre este exercício. - -### Exercício - Trabalhando com um notebook - -Nesta pasta, você encontrará o arquivo _notebook.ipynb_. - -1. Abra _notebook.ipynb_ no Visual Studio Code. - - Um servidor Jupyter será iniciado com Python 3+. Você encontrará áreas do notebook que podem ser `executadas`, pedaços de código. Você pode executar um bloco de código selecionando o ícone que parece um botão de reprodução. - -2. Selecione o ícone `md` e adicione um pouco de markdown, com o seguinte texto **# Bem-vindo ao seu notebook**. - - Em seguida, adicione algum código Python. - -3. Digite **print('hello notebook')** no bloco de código. -4. Selecione a seta para executar o código. - - Você deverá ver a declaração impressa: - - ```output - hello notebook - ``` - -![VS Code com um notebook aberto](../../../../2-Regression/1-Tools/images/notebook.jpg) - -Você pode intercalar seu código com comentários para auto-documentar o notebook. - -✅ Pense por um momento como o ambiente de trabalho de um desenvolvedor web é diferente do de um cientista de dados. - -## Começando com Scikit-learn - -Agora que o Python está configurado em seu ambiente local e você está confortável com notebooks Jupyter, vamos nos familiarizar com o Scikit-learn (pronuncia-se `sci` como em `science`). O Scikit-learn fornece uma [API extensa](https://scikit-learn.org/stable/modules/classes.html#api-ref) para ajudá-lo a realizar tarefas de ML. - -De acordo com seu [site](https://scikit-learn.org/stable/getting_started.html), "Scikit-learn é uma biblioteca de aprendizado de máquina de código aberto que suporta aprendizado supervisionado e não supervisionado. Também fornece várias ferramentas para ajuste de modelos, pré-processamento de dados, seleção e avaliação de modelos, e muitas outras utilidades." - -Neste curso, você usará Scikit-learn e outras ferramentas para construir modelos de aprendizado de máquina para realizar o que chamamos de tarefas de 'aprendizado de máquina tradicional'. Evitamos deliberadamente redes neurais e aprendizado profundo, pois eles são melhor abordados em nosso futuro currículo 'AI para Iniciantes'. - -O Scikit-learn torna simples construir modelos e avaliá-los para uso. Ele é focado principalmente em usar dados numéricos e contém vários conjuntos de dados prontos para uso como ferramentas de aprendizado. Também inclui modelos pré-construídos para os alunos experimentarem. Vamos explorar o processo de carregar dados pré-empacotados e usar um estimador para criar o primeiro modelo de ML com Scikit-learn usando alguns dados básicos. - -## Exercício - Seu primeiro notebook com Scikit-learn - -> Este tutorial foi inspirado pelo [exemplo de regressão linear](https://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html#sphx-glr-auto-examples-linear-model-plot-ols-py) no site do Scikit-learn. - -[![ML para iniciantes - Seu primeiro projeto de regressão linear em Python](https://img.youtube.com/vi/2xkXL5EUpS0/0.jpg)](https://youtu.be/2xkXL5EUpS0 "ML para iniciantes - Seu primeiro projeto de regressão linear em Python") - -> 🎥 Clique na imagem acima para um vídeo curto sobre este exercício. - -No arquivo _notebook.ipynb_ associado a esta lição, limpe todas as células pressionando o ícone de 'lixeira'. - -Nesta seção, você trabalhará com um pequeno conjunto de dados sobre diabetes que está embutido no Scikit-learn para fins de aprendizado. Imagine que você deseja testar um tratamento para pacientes diabéticos. Modelos de aprendizado de máquina podem ajudá-lo a determinar quais pacientes responderiam melhor ao tratamento, com base em combinações de variáveis. Mesmo um modelo de regressão muito básico, quando visualizado, pode mostrar informações sobre variáveis que ajudariam a organizar seus ensaios clínicos teóricos. - -✅ Existem muitos tipos de métodos de regressão, e qual você escolhe depende da resposta que está procurando. Se você quiser prever a altura provável de uma pessoa de uma determinada idade, usaria regressão linear, pois está buscando um **valor numérico**. Se estiver interessado em descobrir se um tipo de culinária deve ser considerado vegano ou não, estará buscando uma **atribuição de categoria**, então usaria regressão logística. Você aprenderá mais sobre regressão logística mais tarde. Pense um pouco sobre algumas perguntas que você pode fazer aos dados e qual desses métodos seria mais apropriado. - -Vamos começar esta tarefa. - -### Importar bibliotecas - -Para esta tarefa, importaremos algumas bibliotecas: - -- **matplotlib**. É uma ferramenta útil para [criação de gráficos](https://matplotlib.org/) e a usaremos para criar um gráfico de linha. -- **numpy**. [numpy](https://numpy.org/doc/stable/user/whatisnumpy.html) é uma biblioteca útil para lidar com dados numéricos em Python. -- **sklearn**. Esta é a biblioteca [Scikit-learn](https://scikit-learn.org/stable/user_guide.html). - -Importe algumas bibliotecas para ajudar em suas tarefas. - -1. Adicione as importações digitando o seguinte código: - - ```python - import matplotlib.pyplot as plt - import numpy as np - from sklearn import datasets, linear_model, model_selection - ``` - - Acima, você está importando `matplotlib`, `numpy` e está importando `datasets`, `linear_model` e `model_selection` de `sklearn`. `model_selection` é usado para dividir dados em conjuntos de treinamento e teste. - -### O conjunto de dados de diabetes - -O [conjunto de dados de diabetes](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) embutido inclui 442 amostras de dados sobre diabetes, com 10 variáveis de características, algumas das quais incluem: - -- age: idade em anos -- bmi: índice de massa corporal -- bp: pressão arterial média -- s1 tc: células T (um tipo de glóbulo branco) - -✅ Este conjunto de dados inclui o conceito de 'sexo' como uma variável de característica importante para pesquisas sobre diabetes. Muitos conjuntos de dados médicos incluem este tipo de classificação binária. Pense um pouco sobre como categorizações como esta podem excluir certas partes da população de tratamentos. - -Agora, carregue os dados X e y. - -> 🎓 Lembre-se, este é aprendizado supervisionado, e precisamos de um 'y' alvo nomeado. - -Em uma nova célula de código, carregue o conjunto de dados de diabetes chamando `load_diabetes()`. O parâmetro `return_X_y=True` indica que `X` será uma matriz de dados e `y` será o alvo da regressão. - -1. Adicione alguns comandos de impressão para mostrar a forma da matriz de dados e seu primeiro elemento: - - ```python - X, y = datasets.load_diabetes(return_X_y=True) - print(X.shape) - print(X[0]) - ``` - - O que você está recebendo como resposta é uma tupla. O que você está fazendo é atribuir os dois primeiros valores da tupla a `X` e `y`, respectivamente. Saiba mais [sobre tuplas](https://wikipedia.org/wiki/Tuple). - - Você pode ver que esses dados têm 442 itens organizados em arrays de 10 elementos: - - ```text - (442, 10) - [ 0.03807591 0.05068012 0.06169621 0.02187235 -0.0442235 -0.03482076 - -0.04340085 -0.00259226 0.01990842 -0.01764613] - ``` - - ✅ Pense um pouco sobre a relação entre os dados e o alvo da regressão. A regressão linear prevê relações entre a característica X e a variável alvo y. Você consegue encontrar o [alvo](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) para o conjunto de dados de diabetes na documentação? O que este conjunto de dados está demonstrando, dado o alvo? - -2. Em seguida, selecione uma parte deste conjunto de dados para plotar, escolhendo a 3ª coluna do conjunto de dados. Você pode fazer isso usando o operador `:` para selecionar todas as linhas e, em seguida, selecionando a 3ª coluna usando o índice (2). Você também pode remodelar os dados para serem um array 2D - conforme necessário para plotagem - usando `reshape(n_rows, n_columns)`. Se um dos parâmetros for -1, a dimensão correspondente será calculada automaticamente. - - ```python - X = X[:, 2] - X = X.reshape((-1,1)) - ``` - - ✅ A qualquer momento, imprima os dados para verificar sua forma. - -3. Agora que você tem os dados prontos para serem plotados, pode verificar se uma máquina pode ajudar a determinar uma divisão lógica entre os números neste conjunto de dados. Para fazer isso, você precisa dividir tanto os dados (X) quanto o alvo (y) em conjuntos de teste e treinamento. O Scikit-learn tem uma maneira simples de fazer isso; você pode dividir seus dados de teste em um ponto específico. - - ```python - X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.33) - ``` - -4. Agora você está pronto para treinar seu modelo! Carregue o modelo de regressão linear e treine-o com seus conjuntos de treinamento X e y usando `model.fit()`: - - ```python - model = linear_model.LinearRegression() - model.fit(X_train, y_train) - ``` - - ✅ `model.fit()` é uma função que você verá em muitas bibliotecas de ML, como TensorFlow. - -5. Em seguida, crie uma previsão usando os dados de teste, utilizando a função `predict()`. Isso será usado para desenhar a linha entre os grupos de dados. - - ```python - y_pred = model.predict(X_test) - ``` - -6. Agora é hora de mostrar os dados em um gráfico. O Matplotlib é uma ferramenta muito útil para esta tarefa. Crie um gráfico de dispersão de todos os dados de teste X e y e use a previsão para desenhar uma linha no lugar mais apropriado, entre os agrupamentos de dados do modelo. - - ```python - plt.scatter(X_test, y_test, color='black') - plt.plot(X_test, y_pred, color='blue', linewidth=3) - plt.xlabel('Scaled BMIs') - plt.ylabel('Disease Progression') - plt.title('A Graph Plot Showing Diabetes Progression Against BMI') - plt.show() - ``` - - ![um gráfico de dispersão mostrando pontos de dados sobre diabetes](../../../../2-Regression/1-Tools/images/scatterplot.png) -✅ Pense um pouco sobre o que está acontecendo aqui. Uma linha reta está passando por muitos pequenos pontos de dados, mas o que exatamente ela está fazendo? Você consegue perceber como essa linha pode ser usada para prever onde um novo ponto de dados, ainda não visto, deve se encaixar em relação ao eixo y do gráfico? Tente colocar em palavras a utilidade prática desse modelo. - -Parabéns, você construiu seu primeiro modelo de regressão linear, criou uma previsão com ele e a exibiu em um gráfico! - ---- -## 🚀Desafio - -Plote uma variável diferente deste conjunto de dados. Dica: edite esta linha: `X = X[:,2]`. Dado o alvo deste conjunto de dados, o que você consegue descobrir sobre a progressão do diabetes como uma doença? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Neste tutorial, você trabalhou com regressão linear simples, em vez de regressão univariada ou múltipla. Leia um pouco sobre as diferenças entre esses métodos ou assista a [este vídeo](https://www.coursera.org/lecture/quantifying-relationships-regression-models/linear-vs-nonlinear-categorical-variables-ai2Ef). - -Leia mais sobre o conceito de regressão e pense sobre quais tipos de perguntas podem ser respondidas por essa técnica. Faça este [tutorial](https://docs.microsoft.com/learn/modules/train-evaluate-regression-models?WT.mc_id=academic-77952-leestott) para aprofundar seu entendimento. - -## Tarefa - -[Um conjunto de dados diferente](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/1-Tools/assignment.md b/translations/br/2-Regression/1-Tools/assignment.md deleted file mode 100644 index d1451d1eb..000000000 --- a/translations/br/2-Regression/1-Tools/assignment.md +++ /dev/null @@ -1,27 +0,0 @@ - -# Regressão com Scikit-learn - -## Instruções - -Dê uma olhada no [conjunto de dados Linnerud](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_linnerud.html#sklearn.datasets.load_linnerud) no Scikit-learn. Este conjunto de dados possui múltiplos [alvos](https://scikit-learn.org/stable/datasets/toy_dataset.html#linnerrud-dataset): 'Ele consiste em três variáveis de exercício (dados) e três variáveis fisiológicas (alvo) coletadas de vinte homens de meia-idade em um clube de fitness'. - -Com suas próprias palavras, descreva como criar um modelo de Regressão que plote a relação entre a circunferência da cintura e a quantidade de abdominais realizados. Faça o mesmo para os outros pontos de dados deste conjunto de dados. - -## Rubrica - -| Critério | Exemplary | Adequado | Precisa de Melhorias | -| ------------------------------ | ----------------------------------- | ----------------------------- | -------------------------- | -| Enviar um parágrafo descritivo | Um parágrafo bem escrito é enviado | Algumas frases são enviadas | Nenhuma descrição é fornecida | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/1-Tools/notebook.ipynb b/translations/br/2-Regression/1-Tools/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/br/2-Regression/1-Tools/solution/Julia/README.md b/translations/br/2-Regression/1-Tools/solution/Julia/README.md deleted file mode 100644 index f3ab05bf8..000000000 --- a/translations/br/2-Regression/1-Tools/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/1-Tools/solution/R/lesson_1-R.ipynb b/translations/br/2-Regression/1-Tools/solution/R/lesson_1-R.ipynb deleted file mode 100644 index b26aecbdf..000000000 --- a/translations/br/2-Regression/1-Tools/solution/R/lesson_1-R.ipynb +++ /dev/null @@ -1,447 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_1-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "c18d3bd0bd8ae3878597e89dcd1fa5c1", - "translation_date": "2025-08-29T23:09:43+00:00", - "source_file": "2-Regression/1-Tools/solution/R/lesson_1-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "YJUHCXqK57yz" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Introdução à Regressão - Aula 1\n", - "\n", - "#### Colocando em perspectiva\n", - "\n", - "✅ Existem muitos tipos de métodos de regressão, e qual você escolhe depende da resposta que está buscando. Se você quiser prever a altura provável de uma pessoa com uma determinada idade, usaria `regressão linear`, pois está procurando um **valor numérico**. Se estiver interessado em descobrir se um tipo de culinária deve ser considerado vegano ou não, estará buscando uma **atribuição de categoria**, então usaria `regressão logística`. Você aprenderá mais sobre regressão logística mais adiante. Pense um pouco sobre algumas perguntas que você pode fazer aos dados e quais desses métodos seriam mais apropriados.\n", - "\n", - "Nesta seção, você trabalhará com um [pequeno conjunto de dados sobre diabetes](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html). Imagine que você queira testar um tratamento para pacientes diabéticos. Modelos de aprendizado de máquina podem ajudar a determinar quais pacientes responderiam melhor ao tratamento, com base em combinações de variáveis. Mesmo um modelo de regressão muito básico, quando visualizado, pode mostrar informações sobre variáveis que ajudariam você a organizar seus ensaios clínicos teóricos.\n", - "\n", - "Dito isso, vamos começar esta tarefa!\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "\n" - ], - "metadata": { - "id": "LWNNzfqd6feZ" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 1. Carregando nosso conjunto de ferramentas\n", - "\n", - "Para esta tarefa, vamos precisar dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizado de máquina.\n", - "\n", - "Você pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\"))`\n", - "\n", - "O script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala para você caso algum esteja faltando.\n" - ], - "metadata": { - "id": "FIo2YhO26wI9" - } - }, - { - "cell_type": "code", - "execution_count": 2, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\n", - "pacman::p_load(tidyverse, tidymodels)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "Loading required package: pacman\n", - "\n" - ] - } - ], - "metadata": { - "id": "cIA9fz9v7Dss", - "colab": { - "base_uri": "https://localhost:8080/" - }, - "outputId": "2df7073b-86b2-4b32-cb86-0da605a0dc11" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, vamos carregar esses pacotes incríveis e torná-los disponíveis na nossa sessão atual do R. (Isso é apenas para ilustração, `pacman::p_load()` já fez isso por você)\n" - ], - "metadata": { - "id": "gpO_P_6f9WUG" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# load the core Tidyverse packages\r\n", - "library(tidyverse)\r\n", - "\r\n", - "# load the core Tidymodels packages\r\n", - "library(tidymodels)\r\n" - ], - "outputs": [], - "metadata": { - "id": "NLMycgG-9ezO" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 2. O conjunto de dados de diabetes\n", - "\n", - "Neste exercício, vamos demonstrar nossas habilidades de regressão fazendo previsões em um conjunto de dados de diabetes. O [conjunto de dados de diabetes](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt) inclui `442 amostras` de dados relacionados ao diabetes, com 10 variáveis preditoras, `idade`, `sexo`, `índice de massa corporal`, `pressão arterial média` e `seis medições de soro sanguíneo`, além de uma variável de resultado `y`: uma medida quantitativa da progressão da doença um ano após a linha de base.\n", - "\n", - "|Número de observações|442|\n", - "|----------------------|:---|\n", - "|Número de preditores|As primeiras 10 colunas são preditivas numéricas|\n", - "|Resultado/Alvo|A coluna 11 é uma medida quantitativa da progressão da doença um ano após a linha de base|\n", - "|Informações dos preditores|- idade em anos\n", - "||- sexo\n", - "||- bmi índice de massa corporal\n", - "||- bp pressão arterial média\n", - "||- s1 tc, colesterol total no soro\n", - "||- s2 ldl, lipoproteínas de baixa densidade\n", - "||- s3 hdl, lipoproteínas de alta densidade\n", - "||- s4 tch, colesterol total / HDL\n", - "||- s5 ltg, possivelmente logaritmo do nível de triglicerídeos no soro\n", - "||- s6 glu, nível de açúcar no sangue|\n", - "\n", - "> 🎓 Lembre-se, isso é aprendizado supervisionado, e precisamos de um alvo chamado 'y'.\n", - "\n", - "Antes de manipular os dados com R, você precisa importar os dados para a memória do R ou estabelecer uma conexão com os dados que o R possa usar para acessá-los remotamente.\n", - "\n", - "> O pacote [readr](https://readr.tidyverse.org/), que faz parte do Tidyverse, oferece uma maneira rápida e amigável de ler dados retangulares no R.\n", - "\n", - "Agora, vamos carregar o conjunto de dados de diabetes fornecido neste URL de origem: \n", - "\n", - "Além disso, faremos uma verificação básica nos dados usando `glimpse()` e exibiremos as primeiras 5 linhas usando `slice()`.\n", - "\n", - "Antes de prosseguir, vamos também introduzir algo que você encontrará frequentemente no código R 🥁🥁: o operador pipe `%>%`\n", - "\n", - "O operador pipe (`%>%`) realiza operações em sequência lógica, passando um objeto para frente em uma função ou expressão de chamada. Você pode pensar no operador pipe como dizendo \"e então\" no seu código.\n" - ], - "metadata": { - "id": "KM6iXLH996Cl" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Import the data set\r\n", - "diabetes <- read_table2(file = \"https://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt\")\r\n", - "\r\n", - "\r\n", - "# Get a glimpse and dimensions of the data\r\n", - "glimpse(diabetes)\r\n", - "\r\n", - "\r\n", - "# Select the first 5 rows of the data\r\n", - "diabetes %>% \r\n", - " slice(1:5)" - ], - "outputs": [], - "metadata": { - "id": "Z1geAMhM-bSP" - } - }, - { - "cell_type": "markdown", - "source": [ - "`glimpse()` nos mostra que esses dados possuem 442 linhas e 11 colunas, com todas as colunas sendo do tipo de dado `double`.\n", - "\n", - "
\n", - "\n", - "> glimpse() e slice() são funções do [`dplyr`](https://dplyr.tidyverse.org/). Dplyr, parte do Tidyverse, é uma gramática de manipulação de dados que fornece um conjunto consistente de verbos para ajudar a resolver os desafios mais comuns de manipulação de dados.\n", - "\n", - "
\n", - "\n", - "Agora que temos os dados, vamos focar em uma única característica (`bmi`) como alvo para este exercício. Isso exigirá que selecionemos as colunas desejadas. Então, como fazemos isso?\n", - "\n", - "[`dplyr::select()`](https://dplyr.tidyverse.org/reference/select.html) nos permite *selecionar* (e opcionalmente renomear) colunas em um data frame.\n" - ], - "metadata": { - "id": "UwjVT1Hz-c3Z" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Select predictor feature `bmi` and outcome `y`\r\n", - "diabetes_select <- diabetes %>% \r\n", - " select(c(bmi, y))\r\n", - "\r\n", - "# Print the first 5 rows\r\n", - "diabetes_select %>% \r\n", - " slice(1:10)" - ], - "outputs": [], - "metadata": { - "id": "RDY1oAKI-m80" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 3. Dados de Treinamento e Teste\n", - "\n", - "É uma prática comum em aprendizado supervisionado *dividir* os dados em dois subconjuntos: um conjunto (geralmente maior) para treinar o modelo e um conjunto menor \"reservado\" para verificar como o modelo se saiu.\n", - "\n", - "Agora que temos os dados prontos, podemos verificar se uma máquina pode ajudar a determinar uma divisão lógica entre os números neste conjunto de dados. Podemos usar o pacote [rsample](https://tidymodels.github.io/rsample/), que faz parte do framework Tidymodels, para criar um objeto que contém as informações sobre *como* dividir os dados, e então usar mais duas funções do rsample para extrair os conjuntos de treinamento e teste criados:\n" - ], - "metadata": { - "id": "SDk668xK-tc3" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "set.seed(2056)\r\n", - "# Split 67% of the data for training and the rest for tesing\r\n", - "diabetes_split <- diabetes_select %>% \r\n", - " initial_split(prop = 0.67)\r\n", - "\r\n", - "# Extract the resulting train and test sets\r\n", - "diabetes_train <- training(diabetes_split)\r\n", - "diabetes_test <- testing(diabetes_split)\r\n", - "\r\n", - "# Print the first 3 rows of the training set\r\n", - "diabetes_train %>% \r\n", - " slice(1:10)" - ], - "outputs": [], - "metadata": { - "id": "EqtHx129-1h-" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 4. Treinar um modelo de regressão linear com Tidymodels\n", - "\n", - "Agora estamos prontos para treinar nosso modelo!\n", - "\n", - "No Tidymodels, você especifica modelos usando `parsnip()` ao definir três conceitos:\n", - "\n", - "- O **tipo** do modelo diferencia modelos como regressão linear, regressão logística, modelos de árvore de decisão, entre outros.\n", - "\n", - "- O **modo** do modelo inclui opções comuns como regressão e classificação; alguns tipos de modelo suportam ambos, enquanto outros possuem apenas um modo.\n", - "\n", - "- O **motor** do modelo é a ferramenta computacional que será usada para ajustar o modelo. Frequentemente, são pacotes do R, como **`\"lm\"`** ou **`\"ranger\"`**.\n", - "\n", - "Essas informações de modelagem são capturadas em uma especificação de modelo, então vamos criar uma!\n" - ], - "metadata": { - "id": "sBOS-XhB-6v7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Build a linear model specification\r\n", - "lm_spec <- \r\n", - " # Type\r\n", - " linear_reg() %>% \r\n", - " # Engine\r\n", - " set_engine(\"lm\") %>% \r\n", - " # Mode\r\n", - " set_mode(\"regression\")\r\n", - "\r\n", - "\r\n", - "# Print the model specification\r\n", - "lm_spec" - ], - "outputs": [], - "metadata": { - "id": "20OwEw20--t3" - } - }, - { - "cell_type": "markdown", - "source": [ - "Depois que um modelo foi *especificado*, ele pode ser `estimado` ou `treinado` usando a função [`fit()`](https://parsnip.tidymodels.org/reference/fit.html), geralmente utilizando uma fórmula e alguns dados.\n", - "\n", - "`y ~ .` significa que ajustaremos `y` como a quantidade/objetivo previsto, explicado por todos os preditores/características, ou seja, `.` (neste caso, temos apenas um preditor: `bmi`).\n" - ], - "metadata": { - "id": "_oDHs89k_CJj" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Build a linear model specification\r\n", - "lm_spec <- linear_reg() %>% \r\n", - " set_engine(\"lm\") %>%\r\n", - " set_mode(\"regression\")\r\n", - "\r\n", - "\r\n", - "# Train a linear regression model\r\n", - "lm_mod <- lm_spec %>% \r\n", - " fit(y ~ ., data = diabetes_train)\r\n", - "\r\n", - "# Print the model\r\n", - "lm_mod" - ], - "outputs": [], - "metadata": { - "id": "YlsHqd-q_GJQ" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir do resultado do modelo, podemos observar os coeficientes aprendidos durante o treinamento. Eles representam os coeficientes da linha de melhor ajuste que nos dá o menor erro geral entre a variável real e a prevista. \n", - "
\n", - "\n", - "## 5. Fazer previsões no conjunto de teste\n", - "\n", - "Agora que treinamos um modelo, podemos usá-lo para prever a progressão da doença y para o conjunto de dados de teste usando [parsnip::predict()](https://parsnip.tidymodels.org/reference/predict.model_fit.html). Isso será usado para traçar a linha entre os grupos de dados.\n" - ], - "metadata": { - "id": "kGZ22RQj_Olu" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make predictions for the test set\r\n", - "predictions <- lm_mod %>% \r\n", - " predict(new_data = diabetes_test)\r\n", - "\r\n", - "# Print out some of the predictions\r\n", - "predictions %>% \r\n", - " slice(1:5)" - ], - "outputs": [], - "metadata": { - "id": "nXHbY7M2_aao" - } - }, - { - "cell_type": "markdown", - "source": [ - "Uhuu! 💃🕺 Acabamos de treinar um modelo e usá-lo para fazer previsões!\n", - "\n", - "Ao fazer previsões, a convenção do tidymodels é sempre produzir um tibble/data frame de resultados com nomes de colunas padronizados. Isso facilita a combinação dos dados originais com as previsões em um formato utilizável para operações subsequentes, como criação de gráficos.\n", - "\n", - "`dplyr::bind_cols()` une de forma eficiente várias data frames por coluna.\n" - ], - "metadata": { - "id": "R_JstwUY_bIs" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Combine the predictions and the original test set\r\n", - "results <- diabetes_test %>% \r\n", - " bind_cols(predictions)\r\n", - "\r\n", - "\r\n", - "results %>% \r\n", - " slice(1:5)" - ], - "outputs": [], - "metadata": { - "id": "RybsMJR7_iI8" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 6. Plotar resultados do modelo\n", - "\n", - "Agora é hora de visualizar isso 📈. Vamos criar um gráfico de dispersão com todos os valores de `y` e `bmi` do conjunto de teste e, em seguida, usar as previsões para desenhar uma linha no lugar mais apropriado, entre os agrupamentos de dados do modelo.\n", - "\n", - "O R possui vários sistemas para criar gráficos, mas o `ggplot2` é um dos mais elegantes e versáteis. Ele permite que você componha gráficos **combinando componentes independentes**.\n" - ], - "metadata": { - "id": "XJbYbMZW_n_s" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Set a theme for the plot\r\n", - "theme_set(theme_light())\r\n", - "# Create a scatter plot\r\n", - "results %>% \r\n", - " ggplot(aes(x = bmi)) +\r\n", - " # Add a scatter plot\r\n", - " geom_point(aes(y = y), size = 1.6) +\r\n", - " # Add a line plot\r\n", - " geom_line(aes(y = .pred), color = \"blue\", size = 1.5)" - ], - "outputs": [], - "metadata": { - "id": "R9tYp3VW_sTn" - } - }, - { - "cell_type": "markdown", - "source": [ - "✅ Pense um pouco sobre o que está acontecendo aqui. Uma linha reta está passando por vários pequenos pontos de dados, mas o que exatamente ela está fazendo? Você consegue perceber como deveria ser possível usar essa linha para prever onde um novo ponto de dados, ainda não visto, deveria se encaixar em relação ao eixo y do gráfico? Tente colocar em palavras o uso prático desse modelo.\n", - "\n", - "Parabéns, você construiu seu primeiro modelo de regressão linear, fez uma previsão com ele e a exibiu em um gráfico!\n" - ], - "metadata": { - "id": "zrPtHIxx_tNI" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/2-Regression/1-Tools/solution/notebook.ipynb b/translations/br/2-Regression/1-Tools/solution/notebook.ipynb deleted file mode 100644 index 8753e05b0..000000000 --- a/translations/br/2-Regression/1-Tools/solution/notebook.ipynb +++ /dev/null @@ -1,675 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Importar bibliotecas necessárias\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "from sklearn import datasets, linear_model, model_selection\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Carregue o conjunto de dados de diabetes, dividido em dados `X` e características `y`\n" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(442, 10)\n", - "[ 0.03807591 0.05068012 0.06169621 0.02187239 -0.0442235 -0.03482076\n", - " -0.04340085 -0.00259226 0.01990749 -0.01764613]\n" - ] - } - ], - "source": [ - "X, y = datasets.load_diabetes(return_X_y=True)\n", - "print(X.shape)\n", - "print(X[0])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Selecione apenas uma funcionalidade para focar neste exercício\n" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(442,)\n" - ] - } - ], - "source": [ - "# Selecting the 3rd feature\n", - "X = X[:, 2]\n", - "print(X.shape)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(442, 1)\n", - "[[ 0.06169621]\n", - " [-0.05147406]\n", - " [ 0.04445121]\n", - " [-0.01159501]\n", - " [-0.03638469]\n", - " [-0.04069594]\n", - " [-0.04716281]\n", - " [-0.00189471]\n", - " [ 0.06169621]\n", - " [ 0.03906215]\n", - " [-0.08380842]\n", - " [ 0.01750591]\n", - " [-0.02884001]\n", - " [-0.00189471]\n", - " [-0.02560657]\n", - " [-0.01806189]\n", - " [ 0.04229559]\n", - " [ 0.01211685]\n", - " [-0.0105172 ]\n", - " [-0.01806189]\n", - " [-0.05686312]\n", - " [-0.02237314]\n", - " [-0.00405033]\n", - " [ 0.06061839]\n", - " [ 0.03582872]\n", - " [-0.01267283]\n", - " [-0.07734155]\n", - " [ 0.05954058]\n", - " [-0.02129532]\n", - " [-0.00620595]\n", - " [ 0.04445121]\n", - " [-0.06548562]\n", - " [ 0.12528712]\n", - " [-0.05039625]\n", - " [-0.06332999]\n", - " [-0.03099563]\n", - " [ 0.02289497]\n", - " [ 0.01103904]\n", - " [ 0.07139652]\n", - " [ 0.01427248]\n", - " [-0.00836158]\n", - " [-0.06764124]\n", - " [-0.0105172 ]\n", - " [-0.02345095]\n", - " [ 0.06816308]\n", - " [-0.03530688]\n", - " [-0.01159501]\n", - " [-0.0730303 ]\n", - " [-0.04177375]\n", - " [ 0.01427248]\n", - " [-0.00728377]\n", - " [ 0.0164281 ]\n", - " [-0.00943939]\n", - " [-0.01590626]\n", - " [ 0.0250506 ]\n", - " [-0.04931844]\n", - " [ 0.04121778]\n", - " [-0.06332999]\n", - " [-0.06440781]\n", - " [-0.02560657]\n", - " [-0.00405033]\n", - " [ 0.00457217]\n", - " [-0.00728377]\n", - " [-0.0374625 ]\n", - " [-0.02560657]\n", - " [-0.02452876]\n", - " [-0.01806189]\n", - " [-0.01482845]\n", - " [-0.02991782]\n", - " [-0.046085 ]\n", - " [-0.06979687]\n", - " [ 0.03367309]\n", - " [-0.00405033]\n", - " [-0.02021751]\n", - " [ 0.00241654]\n", - " [-0.03099563]\n", - " [ 0.02828403]\n", - " [-0.03638469]\n", - " [-0.05794093]\n", - " [-0.0374625 ]\n", - " [ 0.01211685]\n", - " [-0.02237314]\n", - " [-0.03530688]\n", - " [ 0.00996123]\n", - " [-0.03961813]\n", - " [ 0.07139652]\n", - " [-0.07518593]\n", - " [-0.00620595]\n", - " [-0.04069594]\n", - " [-0.04824063]\n", - " [-0.02560657]\n", - " [ 0.0519959 ]\n", - " [ 0.00457217]\n", - " [-0.06440781]\n", - " [-0.01698407]\n", - " [-0.05794093]\n", - " [ 0.00996123]\n", - " [ 0.08864151]\n", - " [-0.00512814]\n", - " [-0.06440781]\n", - " [ 0.01750591]\n", - " [-0.04500719]\n", - " [ 0.02828403]\n", - " [ 0.04121778]\n", - " [ 0.06492964]\n", - " [-0.03207344]\n", - " [-0.07626374]\n", - " [ 0.04984027]\n", - " [ 0.04552903]\n", - " [-0.00943939]\n", - " [-0.03207344]\n", - " [ 0.00457217]\n", - " [ 0.02073935]\n", - " [ 0.01427248]\n", - " [ 0.11019775]\n", - " [ 0.00133873]\n", - " [ 0.05846277]\n", - " [-0.02129532]\n", - " [-0.0105172 ]\n", - " [-0.04716281]\n", - " [ 0.00457217]\n", - " [ 0.01750591]\n", - " [ 0.08109682]\n", - " [ 0.0347509 ]\n", - " [ 0.02397278]\n", - " [-0.00836158]\n", - " [-0.06117437]\n", - " [-0.00189471]\n", - " [-0.06225218]\n", - " [ 0.0164281 ]\n", - " [ 0.09618619]\n", - " [-0.06979687]\n", - " [-0.02129532]\n", - " [-0.05362969]\n", - " [ 0.0433734 ]\n", - " [ 0.05630715]\n", - " [-0.0816528 ]\n", - " [ 0.04984027]\n", - " [ 0.11127556]\n", - " [ 0.06169621]\n", - " [ 0.01427248]\n", - " [ 0.04768465]\n", - " [ 0.01211685]\n", - " [ 0.00564998]\n", - " [ 0.04660684]\n", - " [ 0.12852056]\n", - " [ 0.05954058]\n", - " [ 0.09295276]\n", - " [ 0.01535029]\n", - " [-0.00512814]\n", - " [ 0.0703187 ]\n", - " [-0.00405033]\n", - " [-0.00081689]\n", - " [-0.04392938]\n", - " [ 0.02073935]\n", - " [ 0.06061839]\n", - " [-0.0105172 ]\n", - " [-0.03315126]\n", - " [-0.06548562]\n", - " [ 0.0433734 ]\n", - " [-0.06225218]\n", - " [ 0.06385183]\n", - " [ 0.03043966]\n", - " [ 0.07247433]\n", - " [-0.0191397 ]\n", - " [-0.06656343]\n", - " [-0.06009656]\n", - " [ 0.06924089]\n", - " [ 0.05954058]\n", - " [-0.02668438]\n", - " [-0.02021751]\n", - " [-0.046085 ]\n", - " [ 0.07139652]\n", - " [-0.07949718]\n", - " [ 0.00996123]\n", - " [-0.03854032]\n", - " [ 0.01966154]\n", - " [ 0.02720622]\n", - " [-0.00836158]\n", - " [-0.01590626]\n", - " [ 0.00457217]\n", - " [-0.04285156]\n", - " [ 0.00564998]\n", - " [-0.03530688]\n", - " [ 0.02397278]\n", - " [-0.01806189]\n", - " [ 0.04229559]\n", - " [-0.0547075 ]\n", - " [-0.00297252]\n", - " [-0.06656343]\n", - " [-0.01267283]\n", - " [-0.04177375]\n", - " [-0.03099563]\n", - " [-0.00512814]\n", - " [-0.05901875]\n", - " [ 0.0250506 ]\n", - " [-0.046085 ]\n", - " [ 0.00349435]\n", - " [ 0.05415152]\n", - " [-0.04500719]\n", - " [-0.05794093]\n", - " [-0.05578531]\n", - " [ 0.00133873]\n", - " [ 0.03043966]\n", - " [ 0.00672779]\n", - " [ 0.04660684]\n", - " [ 0.02612841]\n", - " [ 0.04552903]\n", - " [ 0.04013997]\n", - " [-0.01806189]\n", - " [ 0.01427248]\n", - " [ 0.03690653]\n", - " [ 0.00349435]\n", - " [-0.07087468]\n", - " [-0.03315126]\n", - " [ 0.09403057]\n", - " [ 0.03582872]\n", - " [ 0.03151747]\n", - " [-0.06548562]\n", - " [-0.04177375]\n", - " [-0.03961813]\n", - " [-0.03854032]\n", - " [-0.02560657]\n", - " [-0.02345095]\n", - " [-0.06656343]\n", - " [ 0.03259528]\n", - " [-0.046085 ]\n", - " [-0.02991782]\n", - " [-0.01267283]\n", - " [-0.01590626]\n", - " [ 0.07139652]\n", - " [-0.03099563]\n", - " [ 0.00026092]\n", - " [ 0.03690653]\n", - " [ 0.03906215]\n", - " [-0.01482845]\n", - " [ 0.00672779]\n", - " [-0.06871905]\n", - " [-0.00943939]\n", - " [ 0.01966154]\n", - " [ 0.07462995]\n", - " [-0.00836158]\n", - " [-0.02345095]\n", - " [-0.046085 ]\n", - " [ 0.05415152]\n", - " [-0.03530688]\n", - " [-0.03207344]\n", - " [-0.0816528 ]\n", - " [ 0.04768465]\n", - " [ 0.06061839]\n", - " [ 0.05630715]\n", - " [ 0.09834182]\n", - " [ 0.05954058]\n", - " [ 0.03367309]\n", - " [ 0.05630715]\n", - " [-0.06548562]\n", - " [ 0.16085492]\n", - " [-0.05578531]\n", - " [-0.02452876]\n", - " [-0.03638469]\n", - " [-0.00836158]\n", - " [-0.04177375]\n", - " [ 0.12744274]\n", - " [-0.07734155]\n", - " [ 0.02828403]\n", - " [-0.02560657]\n", - " [-0.06225218]\n", - " [-0.00081689]\n", - " [ 0.08864151]\n", - " [-0.03207344]\n", - " [ 0.03043966]\n", - " [ 0.00888341]\n", - " [ 0.00672779]\n", - " [-0.02021751]\n", - " [-0.02452876]\n", - " [-0.01159501]\n", - " [ 0.02612841]\n", - " [-0.05901875]\n", - " [-0.03638469]\n", - " [-0.02452876]\n", - " [ 0.01858372]\n", - " [-0.0902753 ]\n", - " [-0.00512814]\n", - " [-0.05255187]\n", - " [-0.02237314]\n", - " [-0.02021751]\n", - " [-0.0547075 ]\n", - " [-0.00620595]\n", - " [-0.01698407]\n", - " [ 0.05522933]\n", - " [ 0.07678558]\n", - " [ 0.01858372]\n", - " [-0.02237314]\n", - " [ 0.09295276]\n", - " [-0.03099563]\n", - " [ 0.03906215]\n", - " [-0.06117437]\n", - " [-0.00836158]\n", - " [-0.0374625 ]\n", - " [-0.01375064]\n", - " [ 0.07355214]\n", - " [-0.02452876]\n", - " [ 0.03367309]\n", - " [ 0.0347509 ]\n", - " [-0.03854032]\n", - " [-0.03961813]\n", - " [-0.00189471]\n", - " [-0.03099563]\n", - " [-0.046085 ]\n", - " [ 0.00133873]\n", - " [ 0.06492964]\n", - " [ 0.04013997]\n", - " [-0.02345095]\n", - " [ 0.05307371]\n", - " [ 0.04013997]\n", - " [-0.02021751]\n", - " [ 0.01427248]\n", - " [-0.03422907]\n", - " [ 0.00672779]\n", - " [ 0.00457217]\n", - " [ 0.03043966]\n", - " [ 0.0519959 ]\n", - " [ 0.06169621]\n", - " [-0.00728377]\n", - " [ 0.00564998]\n", - " [ 0.05415152]\n", - " [-0.00836158]\n", - " [ 0.114509 ]\n", - " [ 0.06708527]\n", - " [-0.05578531]\n", - " [ 0.03043966]\n", - " [-0.02560657]\n", - " [ 0.10480869]\n", - " [-0.00620595]\n", - " [-0.04716281]\n", - " [-0.04824063]\n", - " [ 0.08540807]\n", - " [-0.01267283]\n", - " [-0.03315126]\n", - " [-0.00728377]\n", - " [-0.01375064]\n", - " [ 0.05954058]\n", - " [ 0.02181716]\n", - " [ 0.01858372]\n", - " [-0.01159501]\n", - " [-0.00297252]\n", - " [ 0.01750591]\n", - " [-0.02991782]\n", - " [-0.02021751]\n", - " [-0.05794093]\n", - " [ 0.06061839]\n", - " [-0.04069594]\n", - " [-0.07195249]\n", - " [-0.05578531]\n", - " [ 0.04552903]\n", - " [-0.00943939]\n", - " [-0.03315126]\n", - " [ 0.04984027]\n", - " [-0.08488624]\n", - " [ 0.00564998]\n", - " [ 0.02073935]\n", - " [-0.00728377]\n", - " [ 0.10480869]\n", - " [-0.02452876]\n", - " [-0.00620595]\n", - " [-0.03854032]\n", - " [ 0.13714305]\n", - " [ 0.17055523]\n", - " [ 0.00241654]\n", - " [ 0.03798434]\n", - " [-0.05794093]\n", - " [-0.00943939]\n", - " [-0.02345095]\n", - " [-0.0105172 ]\n", - " [-0.03422907]\n", - " [-0.00297252]\n", - " [ 0.06816308]\n", - " [ 0.00996123]\n", - " [ 0.00241654]\n", - " [-0.03854032]\n", - " [ 0.02612841]\n", - " [-0.08919748]\n", - " [ 0.06061839]\n", - " [-0.02884001]\n", - " [-0.02991782]\n", - " [-0.0191397 ]\n", - " [-0.04069594]\n", - " [ 0.01535029]\n", - " [-0.02452876]\n", - " [ 0.00133873]\n", - " [ 0.06924089]\n", - " [-0.06979687]\n", - " [-0.02991782]\n", - " [-0.046085 ]\n", - " [ 0.01858372]\n", - " [ 0.00133873]\n", - " [-0.03099563]\n", - " [-0.00405033]\n", - " [ 0.01535029]\n", - " [ 0.02289497]\n", - " [ 0.04552903]\n", - " [-0.04500719]\n", - " [-0.03315126]\n", - " [ 0.097264 ]\n", - " [ 0.05415152]\n", - " [ 0.12313149]\n", - " [-0.08057499]\n", - " [ 0.09295276]\n", - " [-0.05039625]\n", - " [-0.01159501]\n", - " [-0.0277622 ]\n", - " [ 0.05846277]\n", - " [ 0.08540807]\n", - " [-0.00081689]\n", - " [ 0.00672779]\n", - " [ 0.00888341]\n", - " [ 0.08001901]\n", - " [ 0.07139652]\n", - " [-0.02452876]\n", - " [-0.0547075 ]\n", - " [-0.03638469]\n", - " [ 0.0164281 ]\n", - " [ 0.07786339]\n", - " [-0.03961813]\n", - " [ 0.01103904]\n", - " [-0.04069594]\n", - " [-0.03422907]\n", - " [ 0.00564998]\n", - " [ 0.08864151]\n", - " [-0.03315126]\n", - " [-0.05686312]\n", - " [-0.03099563]\n", - " [ 0.05522933]\n", - " [-0.06009656]\n", - " [ 0.00133873]\n", - " [-0.02345095]\n", - " [-0.07410811]\n", - " [ 0.01966154]\n", - " [-0.01590626]\n", - " [-0.01590626]\n", - " [ 0.03906215]\n", - " [-0.0730303 ]]\n" - ] - } - ], - "source": [ - "#Reshaping to get a 2D array\n", - "X = X.reshape(-1, 1)\n", - "print(X.shape)\n", - "print(X)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Divida os dados de treinamento e teste tanto para `X` quanto para `y`\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.33)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Selecione o modelo e ajuste-o com os dados de treinamento\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
LinearRegression()
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" - ], - "text/plain": [ - "LinearRegression()" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "model = linear_model.LinearRegression()\n", - "model.fit(X_train, y_train)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Use dados de teste para prever uma linha\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "y_pred = model.predict(X_test)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Exiba os resultados em um gráfico\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAigAAAGdCAYAAAA44ojeAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy88F64QAAAACXBIWXMAAA9hAAAPYQGoP6dpAABbmUlEQVR4nO3de3wU1f0//tcQIHIxiQmBALsQUdSigNYLxn6iSaECaj/5NKTawAfRWi2IbUBRS71gtIrKp5rUj5dqK7ZfXfwAWcVS8ALuYtCIQEERvAC/cAtJoCBJQAhkc35/rLtmk92dmd2Z2ZnZ1/Px2Edl92Tm7CTd894z7/M+khBCgIiIiMhEuiW6A0RERESdMUAhIiIi02GAQkRERKbDAIWIiIhMhwEKERERmQ4DFCIiIjIdBihERERkOgxQiIiIyHS6J7oDsWhvb8f+/ftx+umnQ5KkRHeHiIiIFBBCoKWlBYMGDUK3btHnSCwZoOzfvx9OpzPR3SAiIqIY7N27Fw6HI2obSwYop59+OgD/G0xLS0twb4iIiEiJ5uZmOJ3O4DgejSUDlMBtnbS0NAYoREREFqMkPYNJskRERGQ6DFCIiIjIdBigEBERkekwQCEiIiLTYYBCREREpqMqQHn++ecxatSo4OqZvLw8rFy5Mvh6QUEBJEkKeUyfPj3kGHv27MG1116L3r17o3///rj77rvR1tamzbshIiIiW1C1zNjhcODxxx/H8OHDIYTA3/72NxQVFWHTpk04//zzAQC33norHn744eDP9O7dO/jfPp8P1157LXJycvDRRx+hvr4eN954I3r06IHHHntMo7dEREREVicJIUQ8B8jMzMSCBQtwyy23oKCgABdeeCEqKirCtl25ciWuu+467N+/HwMGDAAAvPDCC7j33ntx8OBB9OzZU9E5m5ubkZ6ejqamJtZBISIisgg143fMOSg+nw+vv/46jh07hry8vODzr732Gvr164cLLrgAc+fOxbfffht8raamBiNHjgwGJwAwfvx4NDc3Y+vWrRHP1draiubm5pAHERERac/n88Hr9WLRokXwer3w+XwJ6YfqSrJbtmxBXl4eTpw4gb59++KNN97AiBEjAACTJ0/G0KFDMWjQIHz22We499578dVXX8HtdgMAGhoaQoITAMF/NzQ0RDzn/PnzUV5errarREREpILb7UZZWRn27dsXfM7hcKCyshLFxcWG9kX1LZ6TJ09iz549aGpqwtKlS/GXv/wFa9asCQYpHb3//vsYO3YsduzYgbPOOgu33XYbdu/ejXfeeSfY5ttvv0WfPn2wYsUKTJw4Mew5W1tb0draGvx3oJY/b/EQERFpw+12o6SkBJ3DgkBZ+qVLl8YdpOh6i6dnz544++yzcfHFF2P+/PkYPXo0Kisrw7YdM2YMAGDHjh0AgJycHDQ2Noa0Cfw7Jycn4jlTU1ODK4e4/w4REZG2fD4fysrKugQnAILPzZo1y9DbPXHXQWlvbw+Z3eho8+bNAICBAwcCAPLy8rBlyxYcOHAg2Oa9995DWlpa2BkYIiIi0l91dXXIbZ3OhBDYu3cvqqurDeuTqhyUuXPnYuLEiRgyZAhaWlrgcrng9XrxzjvvYOfOnXC5XLjmmmuQlZWFzz77DLNnz8aVV16JUaNGAQCuvvpqjBgxAlOnTsWTTz6JhoYG3H///Zg5cyZSU1N1eYNEREQUXX19vabttKAqQDlw4ABuvPFG1NfXIz09HaNGjcI777yDn/zkJ9i7dy9WrVqFiooKHDt2DE6nE5MmTcL9998f/PmUlBQsX74cM2bMQF5eHvr06YNp06aF1E0hIiIiYwXudGjVTgtx10FJBNZBISIi0o7P50Nubi7q6urC5qFIkgSHw4Ha2lqkpKTEfB5D6qAQERGRPaSkpAQXvARW7QQE/l1RURFXcKIWAxQiIiJCcXExli5disGDB4c873A4NFlirBZv8RAREVGQz+dDdXU16uvrMXDgQOTn52s2c6Jm/FZdSZaIiIjsKyUlBQUFBYnuBm/xEBERkfkwQCEiIiLTYYBCREREpsMAhYiIiEyHAQoRERGZDgMUIiIiMh0GKERERGQ6DFCIiIjIdBigEBERkekwQCEiIiLTYYBCREREpsMAhYiIiEyHAQoRERGZDgMUIiIiMh0GKERERGQ6DFCIiIjIdBigEBERkekwQCEiIiLTYYBCREREpsMAhYiIiEyHAQoRERGZDgMUIiIiMh0GKERERGQ6DFCIiIjIdBigEBERkekwQCEiIiLTYYBCREREptM90R0gIjIzn8+H6upq1NfXY+DAgcjPz0dKSkqiu6W5ZHmfZB0MUIiIInC73SgrK8O+ffuCzzkcDlRWVqK4uDiBPdNWsrxPshbe4iEiCsPtdqOkpCRk0AaAuro6lJSUwO12J6hn2kqW90nWIwkhRKI7oVZzczPS09PR1NSEtLS0RHeHiGzG5/MhNze3y6AdIEkSHA4HamtrLX0bJFneJ5mHmvGbMyhERJ1UV1dHHLQBQAiBvXv3orq62sBeaS9Z3idZEwMUIqJO6uvrNW1nVsnyPsmaGKAQEXUycOBATduZVbK8T7ImBihERJ3k5+fD4XBAkqSwr0uSBKfTifz8fIN7pq1keZ+kzokTwMaNwPHjie0HAxQiok5SUlJQWVkJAF0G78C/KyoqLJ84mizvk5Q5dgzIzQV69QIuucT/37t2Ja4/DFCIiMIoLi7G0qVLMXjw4JDnHQ4Hli5dapv6IMnyPikyIYCbbgL69gV27/7++QMHgBdeSFi3uMyYiCiaZKmwmizvk0L95S/ArbdGfv2ZZ4A77tDufLotM37++ecxatQopKWlIS0tDXl5eVi5cmXw9RMnTmDmzJnIyspC3759MWnSJDQ2NoYcY8+ePbj22mvRu3dv9O/fH3fffTfa2trUdIOIyDApKSkoKChAaWkpCgoKbDtoJ8v7JL9PPgEkKXpw0rcvMGOGcX3qTFWA4nA48Pjjj2Pjxo3YsGEDfvzjH6OoqAhbt24FAMyePRv/+Mc/sGTJEqxZswb79+8PmR70+Xy49tprcfLkSXz00Uf429/+hldeeQUPPvigtu+KiIiIujh40B+YjBkTvd0f/wi0tACJjFPjvsWTmZmJBQsWoKSkBNnZ2XC5XCgpKQEAfPnll/jBD36AmpoaXH755Vi5ciWuu+467N+/HwMGDAAAvPDCC7j33ntx8OBB9OzZU9E5eYuHiIhIubY24OqrAY8neruiIsDtBrrplKFqSCVZn8+H119/HceOHUNeXh42btyIU6dOYdy4ccE25513HoYMGYKamhoAQE1NDUaOHBkMTgBg/PjxaG5uDs7CEBERkXbKy4EePaIHJ+npwOHDwJtv6hecqKV6N+MtW7YgLy8PJ06cQN++ffHGG29gxIgR2Lx5M3r27ImMjIyQ9gMGDEBDQwMAoKGhISQ4CbweeC2S1tZWtLa2Bv/d3NystttEZAJMxCQyzooVwLXXyrf79FNg1Cj9+6OW6gDl3HPPxebNm9HU1ISlS5di2rRpWLNmjR59C5o/fz7Ky8t1PQcR6cvtdqOsrCxk7xeHw4HKykouZf0OAzjSwv/3/wFnnSXfzuUCSkv170+sVE/k9OzZE2effTYuvvhizJ8/H6NHj0ZlZSVycnJw8uRJHDlyJKR9Y2MjcnJyAAA5OTldVvUE/h1oE87cuXPR1NQUfOzdu1dtt4kogdxuN0pKSrpsTFdXV4eSkhK43e4E9cw83G43cnNzUVhYiMmTJ6OwsBC5ubm8NqTYt98CZ58tH5z85jdAe7u5gxNAg0Jt7e3taG1txcUXX4wePXpg9erVwde++uor7NmzB3l5eQCAvLw8bNmyBQcOHAi2ee+995CWloYRI0ZEPEdqampwaXPgQUTW4PP5UFZWhnD5+IHnZs2aBZ/PZ3TXTIMBHMVDCOBXvwL69AF27ozcbuRIf/n6P/3Jv5LH7FSt4pk7dy4mTpyIIUOGoKWlBS6XC0888QTeeecd/OQnP8GMGTOwYsUKvPLKK0hLS8NvfvMbAMBHH30EwP9BdeGFF2LQoEF48skn0dDQgKlTp+JXv/oVHnvsMcWd5ioeSiROw6vj9XpRWFgo287j8aCgoED/DpmMz+dDbm5ul+AkQJIkOBwO1NbW8u+Muli4EPjlL+Xb7d4NDBmif3/kqBm/VeWgHDhwADfeeCPq6+uRnp6OUaNGBYMTAHj66afRrVs3TJo0Ca2trRg/fjyee+654M+npKRg+fLlmDFjBvLy8tCnTx9MmzYNDz/8cAxvk8h4zKNQr76+XtN2dlNdXR0xOAH8s0x79+5FdXV1UgZwFN7Gjf79cuSsWgWMHat/f/SgKkD561//GvX10047Dc8++yyeffbZiG2GDh2KFStWqDktkSkEpuE7TzoGpuG5b0l4AwcO1LSd3TCAIzX+/W9g4EB/XZNonngCuOceY/qkF5OsdiYyN+ZRxC4/Px8Oh6PLbrkBkiTB6XQiPz/f4J6ZAwM4UiJQaC07O3pwcu21/tetHpwADFCIFFEzDU+hUlJSUFlZCQBdgpTAvysqKpI2vyI/P7/LTsIdJXsAR8Cjj/oLrb33XuQ2ffoAhw4By5cntjy9lhigECnAafj4FBcXY+nSpV0GYofDkfS3xpYtW4YTJ06EfY0BXHJ75x3/apv774/ebtMm4OhRIDPTmH4ZRXWhNqJkxGn4+BUXF6OoqIgroDqIlNcUkJmZiRdffDGpA7hkVFsLDBsm3+7//T/gv/9b//4kStybBSYClxmT0QJLQevq6sIOJlwKSmrJLS8G/DNMu3bt4t9Ukvj2W+DCC4Ht26O3mzEDePZZa9Qy6cyQzQKJkgnzKEhrcnlNALBv3z7mNSUBIYDp0/15JNGCkx/8wB/EPPecNYMTtRigECnEPArSEvOaCAD+/nf/7sF//nP0drW1wLZtQK9exvTLDJiDQqSC2jwKVp2lSJjXlNw2bQJ++EP5du++C3xXCzXpMAeFSCesOkvRMK8pOR06BAweDLS2Rm/36KPA739vTJ+MxBwUogSz0+ZvPp8PXq8XixYtgtfrZTE6jTCvKbn4fMCECUC/ftGDk/Hj/YXW7BicqMUAhUhjdqo663a7kZubi8LCQkyePBmFhYXIzc21VIBlZsxrSg7z5wPdu/vrmkSSmuovY//22/YptBYv3uIh0phddu+NVKMj8O2eA6h2zJCrZIY+2M2qVcryRzZuVJaPYge67WZMRPLssDpDbhZIkiTMmjULRUVFHMQ0kJKSktBglflS2tq9G8jNlW+3cCFw001698a6eIuHSGNGrs7QKz+Eew8lDzvlSyXa8ePAiBHywcmttwLt7QxO5DBAIdKYUbv36pkfYodZIJJnp3ypRBICuP12oHdv4IsvIrcbPhw4dgx48cXkKLQWLwYoRBozYnWG3t96WaMjMjutauJMWfxcLn+hteefj95u507g66/9QQwpwwCFSAd6rs4w4luvUbNAVmO3VU1azJTZKWBT49NP/bMgU6ZEb7dypX+GRcnmfxSKAQqRToqLi7Fr1y54PB64XC54PB7U1tbGnXSo97fewGqOwAoe1ujws2OuRrwzZXYL2JQ4fBjo29e/qV80jzziD0wmTDCkW/YkLKipqUkAEE1NTYnuCpHhXC6XACD7cLlcqo9dVVUlHA5HyHFSUlJC/u10OkVVVZUO78y82traulyXjg9JkoTT6RRtbW2J7qoqgfclSZLq91VVVRX25yRJEpIk2e5vpK1NiGuvFcIfdkR+/OQnQpw6lejempea8ZszKEQWo1d+SKQZgsCU/axZszSbBbIau+ZqxJovlWzJtQsW+Aut/fOfkdukpAAHDvj3zunOAh6aYIBCZDF65IdEG3ACx6yqqkra4l12XtUUS76UXQO2zt5/359ncs890dutX+8vT5+dbUy/kgXjPCKLCXzrLSkpgSRJIUFFrPkhagYcM1e/1YvdVzWp3aVbq4DNrNVr9+wBhg6Vb/fXvwK//KX+/UlWnEEhsiCtVwnZeYZAC8mwqilQzba0tBQFBQVRAwUtAjYzJtieOAGMGiUfnNxyi7/QGoMTfTFAIbIoLVcJ2X2GIF7RcjUA/wzTH//4R1N8+zdCvAGb2VZECQH89rdAr17Ali2R2511FnD0KPCXv7DQmhG4WSARwefzITc3F3V1dWHzUCRJgsPhQG1tbdIMwuGE27MmINn2rgkEGQDC3maMNJMX+FuLdEvR6L+1118HSkvl2+3Y4Q9QKD5qxm/OoBCRIdVv7aC4uBhPP/102NesXA8lFrHeZjRLgu2WLf5ZELngZPly/wwLgxPjMUAhIgDfDziDBg0KeX7w4MEhA06yVg4F/O999uzZYV+z4/JaObHcZkx0vtORI0BGhj/XJJp58/yBybXX6tINUoCreIgoRKS8AiD8LY5kurXB1U5dBZJrlUpUvlN7O1BcDCxbFr1dYSFrmZgFZ1CICIB84uI999xjqsTGREj0t38ziHcGLRErop5+2l9ITS44aWz01z5hcGIODFCISLYyqBACTz31VNJUDo0k2Vc7abE02Mh8J6/Xn2dy553R261b57+d079/3KckDTFAISLZWxcAogYfdqkcKicZ6qFEouXSYD13+waAffv8gUlhYfR2L77oD0wuuyyu05FOGKAQkWa3JOx8awNI3tVOeuy9o8du362twA9/CDid0dtNm+bPSbn11phPRQbgnTYiE0lU6W+tbknY9dZGR4Fv/+GShSsqKmyZLKxXcrDaBNto7rzTn2sSzdChwOefA337qj++Wcvy2xkDFCKTCLdCJjMzE2VlZbjvvvt0/TAM3LqQu80TSaC4lh1vbYSjdu8aqzNzcvCSJcD118u3+/prYPjw2M6R7KvXEkZYUFNTkwAgmpqaEt0VIiGEEG1tbcLj8QiXyyU8Ho9oa2tT9fNVVVVCkiQBIOwjKytLVFVV6dT77/sQ6fzRHpIkCUmSdO8fyYv37zASj8ej6G/B4/Focj4lPv9cCH8GSfTHW2/Fd55I/9/k331s1IzfDFCI4lRVVSUcDkfIh5fD4VD8wdXW1tbl5yM99P4wLC8vVx2gOJ1OfkibQLx/h9EE/kYjBdGSJAmn06lZQBTNN98IccYZ8oHJ/ffHfy65/28a+b7tggEKkUG0+Hal9NtpIBjQ88NQyQeyw+EQq1at0vxbOsXOiG/5gXN0Po9RMwk+nxCTJskHJvn5Qpw8qc05zThzZHVqxm+u4iGKkVYrG9Tct9d7KW9glYokSRFXqVRWVmLs2LEoLS1FQUGBbfMurEKPFTbh6L00OJo//clfaK2qKnq7hgbggw+AHj20Oa+Zc2+SAQMUohhptemZ2pUven8YJnIgIvWM3HxPj6XB0VRX++uZlJVFb/fRR/75kwEDtD1/shfmSzSu4iGKkVbfrtSuoDHiwzDZVqlYmdHf8rVcGhxJXR3gcMi3e/55YPp0/foR+P9mXV1d2BmqZFu9ZjTOoBDFSKtvVx1vq0RjdJXSwEDEWznmZqdv+SdPApdeKh+cTJniL7SmZ3ACJG9hPrNggEIUIy3Lngduq2RlZUU8FsAPQ+rKLuX3Z80CUlOBDRsitxk8GGhuBl591X/rxwi85Zk4DFCIYqT1t6vi4mI0NjaivLwcmZmZIa/xw5Aisfq3/D/8wR9sfPcWIvryS/8eO6efbky/OjI694a+o2Z50GOPPSYuueQS0bdvX5GdnS2KiorEl19+GdLmqquu6rIE69e//nVIm927d4trrrlG9OrVS2RnZ4s5c+aIU6dOKe4HlxmTmYSrPxFvbRC9Cm6Rfenxd6inNWuUFVp7881E95S0pGb8loQIk/kTwYQJE/CLX/wCl156Kdra2vD73/8en3/+ObZt24Y+ffoAAAoKCnDOOefg4YcfDv5c7969kZaWBsC/JO7CCy9ETk4OFixYgPr6etx444249dZb8dhjjynqR3NzM9LT09HU1BQ8LlEicZ8OMgMr/B0ePAj07y/fbu5cQOGQQBaiZvxWFaB0dvDgQfTv3x9r1qzBlVdeCcAfoFx44YWoqKgI+zMrV67Eddddh/3792PAd2vCXnjhBdx77704ePAgevbsKXteBihERNbS3u6vT9LeHr3doEFAbS2gYCggC1IzfseVg9LU1AQAXe6Xv/baa+jXrx8uuOACzJ07F99++23wtZqaGowcOTIYnADA+PHj0dzcjK1bt4Y9T2trK5qbm0MeRERkDTfd5C+0JhecfP21f4kxgxMC4qiD0t7ejlmzZuFHP/oRLrjgguDzkydPxtChQzFo0CB89tlnuPfee/HVV1/B7XYDABoaGkKCEwDBfzc0NIQ91/z581FeXh5rV4mIKAFefx0oLVXW7oYb9O8PWUvMAcrMmTPx+eefY+3atSHP33bbbcH/HjlyJAYOHIixY8di586dOOuss2I619y5c3HnnXcG/93c3Ayn0xlbx4mISFdffw2ce658u5tuAhYu1L07ZFExBSh33HEHli9fjg8++AAOmYo6Y8aMAQDs2LEDZ511FnJycvDJJ5+EtGlsbAQA5OTkhD1GamoqUlNTY+kqEZGurJCYapQTJ4BeveTb9ejhb9uNhS4oClV/HkII3HHHHXjjjTfw/vvv48wzz5T9mc2bNwP4vophXl4etmzZggMHDgTbvPfee0hLS8OIESPUdIeIKKHcbjdyc3NRWFiIyZMno7CwEP3798fDDz8c9+Z8VnPZZcqCk4MH/RVjGZyQHFV/IjNnzsSrr74Kl8uF008/HQ0NDWhoaMDx48cBADt37sQjjzyCjRs3YteuXXjrrbdw44034sorr8SoUaMAAFdffTVGjBiBqVOn4tNPP8U777yD+++/HzNnzuQsCRFZhtvtRklJSZc9lA4fPox58+ZhwIABwdw7O3v8cX+htfXro7d75JE1EALo18+YfpENqCmwgk4F2AKPhQsXCiGE2LNnj7jyyitFZmamSE1NFWeffba4++67uxRk2bVrl5g4caLo1auX6Nevn7jrrrtYqI2ILKOtra1LUbRwD0mSTFsoLV5r1yortAb8XkiSJJxOJwsOkn6F2syCdVCIKJG8Xi8KCwsVtXU6naitrbVNXsqhQ0pnQf4F4OKQZzwej+47IZO5GVYHhYgoGdXX1ytuu3fvXlRXV+vYG2O0t/s381MWnPRC5+AEUHfdiBigEBGpFEj6V8rqA/Mtt/gLrZ08KdfyXAASgBNhX1V73Si5MUAhIlIpPz9ftsRCR1YdmBcv9ifAvvxy9HZ//3s7HA4nJGl72NclSYLT6UR+fr4OvSS7YoBCRKRSSkoKKisrZdtZdWDeudMfmMhVd50yxZ8GO3Vqt+D1kCQppE3g3xUVFbbJwyFjMEAhshmfzwev14tFixbB6/UmXT0OoxQXF6OqqgpZWVlhX7fiwNza6g9Mzj5bvq3PB7z66vf/Li4uxtKlSzF48OCQdg6HA0uXLkVxcbHGvSW74yoeIhtxu90oKysLqc3hcDhQWVnJAUInPp8Pjz76KCorK3H48OHg806nExUVFZa57ldcAdTUyLdrbAT694/8OivrUjRqxm8GKEQ2ESgc1vn/0oFv8vwWqy+rDswLFgD33CPfzuMBuEI4dlb9+9AaAxSiJOPz+ZCbm9ulqmmAJElwOBy2qscRDQcDeR9/DOTlybd76CFg3jzdu2NrnNn8HuugECWZ6urqiMEJ4N9Hyy71OOSE2x8nNzc3KcrOK3H4sD/PRC44ueACfwIsg5P4RNoSoa6uDiUlJfy7jIIBCpENKK2zYfV6HHJiGQySJalYCOD004EIOb0hjh0DtmzRv0925/P5UFZW1uW2K4Dgc7NmzbLt31y8GKAQmZDaQVNpnQ2r1uNQIpbBIFlmW6ZP9+8efPRo9HZbt/oDmd69jemX3XFmMz4MUIhMJpZBM1A4rHMNigCr1uNQQ+1gkAxT7263/3bOn/8cvd0rr/gDkxEjDOlW0uDMZnwYoBCZSKyDZsfCYclaKEvNYGD3qffaWn9gMmlS9HbXX+8PTKZNM6ZfyYYzm/FhgEJkEvEOmsleKEvNYGDXqfeTJ/2BybBh8m3b2oD/+z/9+5TMOLMZHwYoRCahxaBZXFyMXbt2wePxwOVywePxoLa21vbBCaBuMLDj1PtVV/l3G5ZTX++fNbHxZJppcGYzPgxQiExCq0EzJSUFBQUFKC0tRUFBQdJ8+KkZDOw09V5R4Z81+eCD6O1Wr/YHJjk5hnSLvpPsM5vxYIBCZBJ2GjQTRelgYIep9/Xr/YHJ7NnR2z3wgD8w+fGPjekXdZXMM5vxYCVZIpMIVIOtq6sLm4eSbNVg46GkkmwgIRlAyPU2+9YAR44AZ5wh3+7cc4Evv9S9O0SqsJIskQXxfrV2lNzmstrUuxD+ImtKgpOjRxmckPVxBoXIZMLt22G1nXGtxAr79vzmN8D//q98uy1b/CXqicyKmwUSWZwVBk0jJev1eOstoKhIvt3LLwM336x/f4jipWb87m5Qn4hIhcAtCkrOnWB37wZyc+XbFRcDVVW6d4coIRigEJFpBRJZO0/0BirrmjFXJB4nTyqrZQL4C60lwSQSJTEmyRKRKdm9HH1nP/mJsuCkro6F1ig5MEAhIlOyazn6zv73f/31TFatit7u3Xf9gcmgQcb0iyjReIuHiEzJKuXoY03g3bgRuOQS+ePPnQs89pgGHSWyGAYoFpSsKxoouVihsm4sCbxNTUBGhvyxhw0Dduzwz64QJSMuM7aYZFzRQMnJ7JV1IyXwRqpEG9gH58AB+WO3tAB9+2raXSJTYCVZmwp8IHa+Lx9Y0eB2uxPUM7Iyn88Hr9eLRYsWwev1mibp1MyVddUm8N55J9Ctm3xw8umn/kCGwQkRAxTLSLYVDWQMt9uN3NxcFBYWYvLkySgsLERubq5pgl2zlqNXmsD75JNbIUnA009HP96LL/oDk1GjNO4okYXxFo9FeL1eFBYWyrbzeDws8EWKqL1FkUhmy7tatGgRJk+eHKWFA8Be2eP89Kf+arFEyYKVZG3IKisaKPGUDOZyM3KSJGHWrFkoKioyRQK22SrrRk7M7Q7glKJjnDoFdOcnMFFEvMVjEVZY0UCJp/SWTbLUGNFLfn4+HA5Hp9yYf0JJcLJ3r/92DoMTougYoFhE+A/E70mSBKfTifz8fIN7RmahJok60TNyZk3MVapjAi8wHYAAcE3Un1m50h+YOBx6947IHhigWISZVzRQ4qlNok7kjJzZE3OVGjasGEK0A3g+ars5c/yByYQJxvSLyC6YJGsx4eqgOJ1OVFRUmCahUQmzJT3GwkzvQW0SdaJqjFgpMTeS5mYgPV2+3ZAhwK5dLLRG1JGq8VtYUFNTkwAgmpqaEt2VhGhraxMej0e4XC7h8XhEW1tborukSlVVlXA4HAL+eXEBQDgcDlFVVZXorilmtvfgcrlC+hLp4XK5Qt6DJElCkqSQNoHntH4vbW1tXa5Z5/M6nU7T/j23twsxeLAQ/vmQ6I8k/WgikqVm/GaAQoYKDIrhBic9BkU9mPE9eDweRQGKx+Pp8l46Bw1Op1OX9xBrH81gzhxlgcm//pXonhKZm5rxm7d4yDCB2wqRVo8kunS5EmZ9D/HcsjHqVpV87RA/l8uF0tJSzc8fi7ffBiZOlG/33HPAjBn694fI6ljqnkzJDktbzfoe4kmiDtQYKS0tRUFBgS7Bic/nQ2Njo6K2ZlgqX1fnzx2RC04mTPDPnTA4IdIeAxQyTKKXtmph2bJlitol4j2YtSx8YNXO7Nmzo7Yzw1L5tjZ/YKJkKfDJk/6lw0SkD5YKIsMYvbRV61sXbrcbFRUVitomahaguLgYRUVFplldFGnVTmdmWCpfVKSs7PyePYDTqX9/zMZMq9YoSahJbnnsscfEJZdcIvr27Suys7NFUVGR+PLLL0PaHD9+XNx+++0iMzNT9OnTRxQXF4uGhoaQNrt37xbXXHON6NWrl8jOzhZz5swRp06dUtwPJslaU2AVR7gEU2i4iqOtrU2Ul5eLzMxMzVbZyK1A0fo92IHSawYdE3OVeOklZQmwy5cnpHumYLZVa2Rduq3iGT9+vFi4cKH4/PPPxebNm8U111wjhgwZIo4ePRpsM336dOF0OsXq1avFhg0bxOWXXy6uuOKK4OttbW3iggsuEOPGjRObNm0SK1asEP369RNz587V5Q2Suei9tLWqqkpkZWVFDB5iPYfSFSgA+KH9HaXX7Omnn1Yd0Gmx1P7TT5UFJrNmqT60rZhx1RpZl2HLjA8cOCAAiDVr1gghhDhy5Ijo0aOHWLJkSbDNF198IQCImpoaIYQQK1asEN26dQuZVXn++edFWlqaaG1tVXReBijWptfS1qqqKt1mOJTWGZmV7KNZB7HUZlEi3m/zLS3KApOcHH/tk2Rm9do1ZD5qxu+4kmSbmpoAAJmZmQCAjRs34tSpUxg3blywzXnnnYchQ4agpqYGAFBTU4ORI0diwIABwTbjx49Hc3Mztm7dGvY8ra2taG5uDnmQdRUXF2PXrl3weDxwuVzweDyora2NK4kzUOpdjohxlY3SnJKioiJVx7UzPXKO1Ow31JkQwLBhwOmny5/nyBGgvp5VYM26ao2SQ8wBSnt7O2bNmoUf/ehHuOCCCwAADQ0N6NmzJzIyMkLaDhgwAA0NDcE2HYOTwOuB18KZP38+0tPTgw9nMmao2YzWS1vlPkg7U7vKhps1qqf1NVO731BHc+cC3boBtbXRz7Fhgz+QUVLKPhnYYeUdWVfMAcrMmTPx+eef4/XXX9eyP2HNnTsXTU1NwcfevXt1PydZi9oPSLWrbLhZo3paXzOl3+afeeaZYJDy7rv+WZDHH49+7Gee8QcmF1+sqCtJI5GbShLFFKDccccdWL58OTweDxwdCgbk5OTg5MmTOHLkSEj7xsZG5OTkBNt0LtgU+HegTWepqalIS0sLeRB1pOYDMtaZDrPWGTEzLa+Z0iB09uzZcDovgyQB48dHbzt2rD8wueMOxd1IKpw5pIRSk9zS3t4uZs6cKQYNGiS+/vrrLq8HkmSXLl0afO7LL78MmyTb2NgYbPPnP/9ZpKWliRMnTijqB5NkqTO5JczokNQXbzKu1TdrTAQtrpmyVUHdFCXAAkIozMlPekZvKkn2ptsqnhkzZoj09HTh9XpFfX198PHtt98G20yfPl0MGTJEvP/++2LDhg0iLy9P5OXlBV8PLDO++uqrxebNm8Xbb78tsrOzucyY4hbpgzTwyMrK4oephckHoUsVBSa7diX6nViPkZtKkr3pFqBE+taycOHCYJtAobYzzjhD9O7dW/zsZz8T9fX1IcfZtWuXmDhxoujVq5fo16+fuOuuu1iojTQR7oM0MzNTlJeX22KmI9lnb8IHoTcrCkyWLUt0760t2f/2SBvczZiSml1LcrvdbpSVlYUkijocDlRWViZV/sv31wEA5BPmf/KTr/Huu+fo3i8ikqdm/GaAQmQBkfa0CSQvJlOSbmsrMGaMwKefyhUpOQSgHzweDwoKCgzoGRHJUTN+czdjIpOLp/6H3cyaBZx2GhQEJxmQpGyuMCGyMAYoRCbHap7A//2fv57Jd2VVorgUgARJ8lebZm0aIutigEJkcslczXPLFn9g8otfRG+XlTUNgARgAwDWpiGyg+6J7gBRR3ZNcI1HMlbzPHIEyM0FvtvuK6J584CHHgJ8vpdRXX0z/26IbIRJsmQaXKUSns/nQ25uLurq6sLmoUiSBIfDgdraWssPyu3twKRJwJtvRm931VXAe+8BPXoY0i0i0giTZMly4tml1u6SZR+gigogJUU+OGlsBLxeBidEdscAhRKOq1TkmXkfIJ/PB6/Xi0WLFsHr9ar+Pa1Z488zmT07ert16/wl1/r3j6OzRGQZvMVDCef1elFYWCjbjvUszJejE89tuX37AKdT/hwvvgjcemu8PSUiM1AzfjNJlhIumVepqJWSkmKaIC1S8bjAbblIMzutrcAVVwD/+lf040+dCvztb/7ZFSJKPrzFQwmXjKtUrC7W23Jz5vgLrUULTpxOoKUF+PvfGZwQJTPOoFDC5efnw+FwyK5S6VwR1Cy3O8zSDyOpKR5XUFCApUuBn/9c/rhffQWcw21ziAicQSETiGWVitvtRm5uLgoLCzF58mQUFhYiNzfX8NU+ZumH0ZTeblu//hgkST44eestfwKslYKTeJODiUiGxjspG0LNds1kHVVVVcLhcAgAwYfT6RRVVVVd2kmSFNIOgJAkSUiS1KW9nv01Qz8SwePxdHnfoY80ARwU/rAj8uO++xL9TmIT7m/V4XDY+ndOpAU14zdX8ZCpyN0uCRQti3R7waiiZWbpR6JELh4nAXgdwPVRfz4/H1i92pq1TLizNFHs1IzfDFDIUsyyJNks/UikwEANBBJj7wDwjOzPNTQAAwbo2ze98oKSPTAlihcryZJtmWVJsln6kUiB4nH9+v0X/Hc5ogcnH33kv7Gjd3CiZ14Qd5YmMg4DFLIUsyxJNks/Emn/fmDSpGIcPBh94H/+eX9gkpenf5/03jKBgSmRcRigkKVcccUV6NevX8TXJUmC0+nssiRZa4Gl0Z1XHRndj0Q4eRK47DKgU9X9LqZM8W/+N326MStejNgygYEpkXEYoJBluN1unHXWWfj3v/8d9vV4N85TM4gmywZ+nd1zD5CaCqxfH7nN4MFAczPw6qv+QmtGLcU24vZLMgemRIbTaymRnrjM2K+trU14PB7hcrmEx+MRbW1tie6SbiIt6e34CCxJjuW6xLpsVOnSaKurqoq+XDjw+PLLzj9n3FJsl8sls/TZ/3C5XHGdJ/CeOr+vZFheThQvNeM3AxSLSqY6DG1tbV3ea+dHdna2aG1tjem6xDuI2jlQ/OILZYHJG290/Vm535skScLpdGp2veRrs/gfHo8n7nMlS2BKpDUGKDaXbAXClA485eXlqq+LFoOoHQOUpiYhBgyQD0x+97vIxzAyYBDi+99lpJk2rQMiO/7eifTGAMXGjP5WagZKp+4zMzNVX5d4B1G7zWS1twtxww3ygUlenhCtrdGPZdQtl454+4XI3NSM30yStZhkrMOgdEXE4cOHI74W6brEs2xU7yWtRnv2WaBbN+D//i96u/37/TVNevaM3i4RK14CtVkGd1pi5HA4WOGVyGIYoFhMMtZhULJyIisrS9GxOl+X/v37K/q5zu2MWNJqlA8/9K+2ueOO6O3WrvXPnyiNJxK14qW4uBi7du2Cx+OBy+WCx+NBbW0tgxMii2GAYjHJWIdByZLe3/72t4qOpdV1scNMVkODPzD5j/+I3u6ZZ/yByY9+pO74iVyKnZKSgoKCApSWlqKgoMB2y72JkgEDFItJ1joMclP39913X0zX5cCBA4rO37mdlWeyTp0CrrhCfibkhhsAn09+ZiUa3nIholh1T3QHSJ3At9KSkhJIkhRyi8HOBcIA/2BXVFQUcRO4WK5LrDNSVp3J+v3vgfnzo7cZMAD4+mtAq3045X5vZqHXBoNEFCM9s3X1ksyreAJiqcOQDMsi1V6XWJemGr2kNV5vvqmsnsm2bYnuaWLYbTUWkVlxmXGSUBNwJNMHsNpALNalqVZY0vrVV8oCk6VLE93TxEm2ukJEicQAhULwA1herJVBzVpRtLlZiMGD5QOTOXMS2s2ES8a6QkSJpGb8loQIs07S5Jqbm5Geno6mpiakaXWj3KZ8Ph9yc3MjrjiRJAkOhwO1tbVJf7891hwEM+UuCAFMnQq89lr0dpde6l82LFfLxO68Xi8KCwtl23k8HhQUFOjfISKbUzN+M0nWpLQa9NQsh032D+DA0lSjfk5rf/4zMH26fLu6OmDQIP37YwVWXo1FZHcMUEzI7XajrKwsJLBwOByorKxUvSyTH8D29/HHQF6efLsPPgBstvo8blZdjUWUDFgHxWS0Lp/OD2D7amz0F1qTC04qKvy3fhicdJWsdYWIrIABionoUT6dH8D2c+oUcOWVQE5O9HaTJvkLrZWVGdMvK0pktVsiio4BionoUT6dH8D28sAD/sTWaH8CWVnAkSPA0qX+zf8oOla7JTIn5qCYiNI8kLq6Oni9XsUJtIEP4HB5LRUVFfwAtoDly4Gf/lS+3eefA+efr39/7MYq1W6JkgmXGZuI0iWP2dnZOHjwYPDfShNozbQcVg92fH/btwPnnCPfbvFi4Oc/178/RETxUDN+M0AxkUDNkrq6urB5KJEEbtUk83S0liufzODoUeCCC4Ddu6O3u/NO4I9/DH3OjoGaFfC6E8lTNX7rVS1OT3auJBupfLrcI5krXtqpUm57uxDTpslXgL34YiFOnOj688m0pYGZ8LoTKaNrqfs1a9aI6667TgwcOFAAEG+88UbI69OmTesyUIwfPz6kzaFDh8TkyZPF6aefLtLT08Uvf/lL0dLSorgPdg5QhAj/YZedna0oUPF4PInuvqGUlCp3OBxi1apVsnvzJHozxZdeUrZvzt694X/eioFaoq+5Fqx43YkSRdcAZcWKFeK+++4Tbrc7YoAyYcIEUV9fH3wcPnw4pM2ECRPE6NGjxccffyyqq6vF2WefLUpLSxX3we4BihBdP7hfffVVRQGKy+VKdNcN5fF4VM00Rfpmm8hvwOvWKQtMvN7Ix7DinjJ2mHWw4nUnSiTDNguMFKAUFRVF/Jlt27YJAGL9+vXB51auXCkkSRJ1dXWKzpsMAUpnSgfiZJtBcblcqgOUzt9sE/UNuLFRWWDy1FPyx7La34ddZh2sdt2JEk3N+K1LlQSv14v+/fvj3HPPxYwZM3Do0KHgazU1NcjIyMAll1wSfG7cuHHo1q0b1q1bp0d3bIEF18KLpQKu6FD07uTJk5oXx5PT1gYUFAADBkRv97Of+QutzZ4tf0wrbWmgR0HCRLHSdSeyGs0DlAkTJuDvf/87Vq9ejSeeeAJr1qzBxIkTgx82DQ0N6N+/f8jPdO/eHZmZmWhoaAh7zNbWVjQ3N4c8kg0LroUnF7hFIr4revfcc89pXhwvmoceAnr0ANasidwmIwP45hvA7VZeaM1KWxroUZAwUax03YmsRvMA5Re/+AX+8z//EyNHjsR//dd/Yfny5Vi/fj28Xm/Mx5w/fz7S09ODD6fTqV2HLYQVL7uKFrgpsXPnTkXt4v0GvGKFf9+c8vLo7T77zB+cZGSoO76VZtjsNOtgpetOZDW6F8IeNmwY+vXrhx07dgAAcnJycODAgZA2bW1tOHz4MHIibC4yd+5cNDU1BR979+7Vu9umVVxcjF27dsHj8cDlcsHj8aC2tjYpg5OASIGbEmeddZaidrF+A9650x+YXHtt9HaLFvkzTkaOjOk0lpphs9Osg5WuO5HlxJPsgjBJsp3t3btXSJIkli1bJoT4Pkl2w4YNwTbvvPMOk2Qpbh1XPq1atSrq6goAwul0itbWVuFwOCLWnYl1FcbRo0KceaZ8AmxZmbbXINLKmPLyctMs5Q2sfNH6midSuOvudDotk+xLZBRdV/G0tLSITZs2iU2bNgkA4qmnnhKbNm0Su3fvFi0tLWLOnDmipqZG1NbWilWrVokf/vCHYvjw4eJEh6pSEyZMEBdddJFYt26dWLt2rRg+fDiXGZPm7r777qgByt133y2EiFwcL5YVJe3tQtx8s3xgMnq0EMeP6/O+OwZq5eXlYvDgwSHva/DgwQkPWLS85mZhh5ouRHrTNUCJtKxu2rRp4ttvvxVXX321yM7OFj169BBDhw4Vt956q2hoaAg5xqFDh0Rpaano27evSEtLEzfffDMLtZGm5OpTBL7hBgYRLb4Bv/yysmXDe/bo9a5DRVrK2/mRqNojesw6MEggMjc14zf34iFTindfE6UbL3o8HhQUFMR1zg0bgEsvle/T6tXAj38s304LgX2doq2WCUjkXk5a7l9jt/2YiOyIe/GQpWlRYVRpAbd4Ku8eOCBESor8jMmCBTGfImZqK+xaMe+jI7sUfiOyu4QXaiP78/l88Hq9WLRoEbxer2ZFtdxuN0pKSrp886+rq0NJSQncbrei4+i5UqStDRg3Dujf319ILZKf/tTfds4c1aeQJXf91S7RFRaqPdKZnQq/EVEHekdLeuAMSmLptYeKlvua6LVS5JFH5GdMTj9diE7bT2lKyfWPZY8ixDmjlCgsN09kHZxBId1oNcMRjpYVRrWuT/HOO/56Jg88EL3d5s1AczNwxhmKDqua0usfa4VdK9Qe6czowm96zR4SUSgGKKSY3lPpWg80WlTera31ByYTJkRv9+qr/vmT0aMVdS0maq6/2gq7Vq54amThN7fbjdzcXBQWFmLy5MkoLCxEbm5uXIE5EUWg72SOPniLRxtql2TqPZWu1/FjWXp67JgQw4fL386ZOdNf+8QIsVyfcLeDOj+snkhqVOE3JuISxU/XOihmwAAlfrHkkei9MsYMFUbb24W47Tb5wOT884X49lvduhFWrNe/c+E2O1Y81bvwm5b5UUTJjAEKRRXrN0EjkhETWWH0b39TVmht1y7duhCVVtffrsXM9Cw3z0RcIm0wQKGI4vkmaORUupHf8v/1L2WBybvv6nJ6xcwww2R2egVfRtTVIUoGasbv7qCkomalTKDCakAg8bKkpASSJIUka2q5c2txcTGKioo0qzDaWaB66ddfH8Idd/wMp05FzxWfPx/43e80OXVcjLr+VpaSktLl71YLRu/ArGWFXSLL0jta0gNnUGKnxTdBK+/cWlVVJQYPHiKAlbIzJhMnCmHGyQgrX3+rMnL2Sq86Q0RmwL14KKJY9qgJx4rf8NxuNyZN2gDgsajtevUC9u4FsrKM6VcsrHj9jaDndQnUoAEQdvZKi72MAufo/LGcyP2SiLTEvXgoomTNY1i5sk1Rnsn69fZ638nEiJkHPWevuFKIkgEryVJEWldYNbtdu/yF1iZOlHs/UwFIOHrUenvRdJSsVU71rHDcUXFxMXbt2gWPxwOXywWPx4Pa2lpNZjW0rKRMZAcMUJKQFhVWze74cWDECODMM+VaPgdAAvAqAO3KoSdCslY5NXqzwEAibmlpKQoKCjQL5o0u2U9kdgxQkpSe3wQTSQjg9tuB3r2BL76I1vJLAL0AzAx51op70QDGzSCYkV1mHoxeKURkdlxmnMT0WpKZKK++CkydqqTlmQB2hTwjSRIcDocl96KRm0GQJAmzZs1CUVGRbW7ddWSXmYfABo91dXVhf5dW/hsligVnUMjyNm/255nIBScPPLAWktQNkrQ75Hmr597YZQYhVnaZeUi2/DAiOQxQyLIOH/bfyrnooujtHn3Uf+vn4Yf/w5a5N4meQUh0Ym5g5iHSrs1W2qk5GfLDiJTiLR6yHJ8PKCoC/vnP6O2uvhpYsQLo+IVT7yq1iZDIGQS3242ysrKQGRyHw4HKykrDBlO7Vdi1498oUSxYqI0sZcEC4J57orfp0QPYvx/o18+YPiWaz+dDbm6ubO5CbW2tpoOc2YqKhQuWnE4nKioqOPNAZBJqxm8GKGQJq1cD48bJt9uwAbj4Yv37YzZGVDntKBAURcp90SsoUtIvzjwQmZea8Zs5KGRqe/b4E2DlgpOFC/15JskYnADG5y6YNTFXrxolRGQ85qCQKZ04AVx6KfD559HbFRbuwAMP7MOVV+YDSO7ByMjchUQn5hKR/TFAIVMRAigrA555Jnq77t1r0dZ2Pjye4/B4jE/MNCujatvYZWkvEZkXc1DINBYtAiZPVtLybAA7Q54x+26vdsuNSFRiLhFZG3NQyFI++8yfZyIXnPzjHz44HE50Dk4AffZc0Yod98hhUTEi0hsDFEqYI0eA9HRg9Ojo7crL/bd++vY1Z2JmNHbeI4dFxYhIT8xBIcO1twPFxcCyZdHbjR0LvP020P27v1KrJWaq2SMHgCVvAbGoGBHphQEKGeqpp4C77oreRpKAhgagf//Q562WmKl0Ke6jjz6Kl156KaHVWONht00nicgceIuHDOH1+gMPueDkk0/8MyydgxPAenuuKJ3JmTdvni1vARERxYMBCulq3z5/YFJYGL3dX/7izzO59NLIbayWmBnPTI6Zk34pvERvmkhkNwxQSBetrcAPfwg4ndHb3Xyzf8bklluUHddKiZlyMz5yzJj0S+HZcaUWUaIxQCHN3XkncNppwKZNkduceSZw9Cjw8sv+GRY1iouLsWvXLng8HrhcLng8HtTW1poqOAGUzfgoYZakXwrPziu1iBKJhdpIM4sXAzfcIN9u+3bg7LP1749ZhNtlNysrC4cOHVL08x6PJ5iEareCb1Zn1k0TicyKhdrIUFu3+mdB5IKTf/zDn2eSTMEJ0HXGZ9WqVejVq5fsz3VO+uVtBPMx66aJRHbAAIViduQIkJkJXHBB9HYPPugPTK67zpBumVLHXXZTUlKiDmoBQohg0i9vI5iT1WrzEFkJAxRSLVBo7YwzgG++idzuqquAkyf9lWDpe0oHq1mzZqG4uFi24FugLVeNGM9qtXmIrISF2jrg/X15FRXA7Nny7RoagAEDdO+OrvT6e1A6WHWsMKv0NgILphkrsFJLbtNEs9TmIbISzqB8h/f3o/vgA3+eiVxw8vHH/ts5geDEqrUh9Px7UFtwjrcRzMtqtXmILEVYUFNTkwAgmpqaNDleVVWVkCRJAAh5SJIkJEkSVVVVmpzHivbtE8IfckR/vPhi15+tqqoSDocj5Jo6HI6w17OtrU14PB7hcrmEx+MRbW1tBry78Iz4ewico/N5wp3D4/F06Uu4h8fjibtfFJtwf+tOpzOpPzuIwlEzfid9gNLW1tblg6XzgOF0OoMDppkGUj2dOCHExRfLByZTpwrR3t7159UM8moCGb2p/XuIh9JBLdCncNdT6z5R7JLls4EoHgxQVFDz7dRMA6me7rpLPjBxOoVoaQn/82oGebPNXhk9W6F0UFMz40JEZFZqxm/VOSgffPABfvrTn2LQoEGQJAlvvvlmyOtCCDz44IMYOHAgevXqhXHjxmH79u0hbQ4fPowpU6YgLS0NGRkZuOWWW3D06FG1XdGE0vv2y5Yts/0yz6VL/Xkmf/xj9HZffQXs2QP07Rv+daVJnV6v13SrU4zO9+i4/LigoCBiroKVSvybiVVzoIgohiTZY8eOYfTo0Xj22WfDvv7kk0/iT3/6E1544QWsW7cOffr0wfjx43HixIlgmylTpmDr1q147733sHz5cnzwwQe47bbbYn8XcVC6ouLVV1811UCqpS++8AcmP/959HbLlvnnT845J3o7pYO31+s1XZErMy8btUqJf7Ng4juRxcUzVQNAvPHGG8F/t7e3i5ycHLFgwYLgc0eOHBGpqali0aJFQgghtm3bJgCI9evXB9usXLlSSJIk6urqFJ1XjxyUaPf3s7OzbZmk2NQkRHa2/O2c++5Td1ylt0nuv/9+Re1cLpc+FyAMub8HfHdbr+OtGOYemI/Zbh0SkZ+ut3iiqa2tRUNDA8aNGxd8Lj09HWPGjEFNTQ0AoKamBhkZGbjkkkuCbcaNG4du3bph3bp1YY/b2tqK5ubmkIdWlCwTnDJliqJjGbXMMzBt/dprr6GiogKvvfaaqunr9nbg+uuB9HTg4MHI7X70I3+htT/8QV3/lC6jVVqzw8jZimh/DwHHjx/HsmXLAFj7W7pdb3+wsB2RTcQTCaHTDMqHH34oAIj9+/eHtPv5z38urr/+eiGEEI8++qg455xzuhwrOztbPPfcc2HPM2/evLDfZLVaZixE9BUVZlrmGa6f6PDNXu6b4TPPKFs2XF8ffz/lkjrNvDqlqqpKZGVlReyXJEni7rvvtuy3dDsnfJvp/69EFMqwVTxGBSgnTpwQTU1NwcfevXs1D1CEiDxVb5aBNNK0dee+hBtk1q5VFph89JG2/ZVbRmvW1SlKViKlpKREfd2sS3/tfvvD5XIpClCMvHVIRH4Ju8WTk5MDAGhsbAx5vrGxMfhaTk4ODhw4EPJ6W1sbDh8+HGzTWWpqKtLS0kIeeoi0osIM1SKjTVt31nH6ur7enwD7H/8R/Weef94fouTladFbv2hJnYHbC62trXjooYdMtzpFyUqkaLcIhEl3sU2G2x9mTnQmIhXiiYSA8Emy//M//xMSLYVLkt2wYUOwzTvvvJOwJFk1ElktUum0deDx7rteMWaM/IzJ5MnhC63pKdx1HDx4sCgvL9cl0TSWJFal38LlHoFv6WZJpE2G2x9mmfEkoq50vcXT0tIiNm3aJDZt2iQAiKeeekps2rRJ7N69WwghxOOPPy4yMjLEsmXLxGeffSaKiorEmWeeKY4fPx48xoQJE8RFF10k1q1bJ9auXSuGDx8uSktLdXmDWkvUQKNuwJwvG5gMHChEc7MhXQ9h9O2FWHMt1AaE0QZ6M+V7JMvtDyNuHZol6CSyEl0DlEgf3NOmTRNC+GdRHnjgATFgwACRmpoqxo4dK7766quQYxw6dEiUlpaKvn37irS0NHHzzTeLlkhlScNIZICSKMoGzP+SDUwAIb74IjHvwcgy8kLEFwwp+RauJAdlyZIlpsr3SIYZlAA9ZzzNFHQSWQlL3dtQ9MH9HEWBSYe7cbr0T+7bpJGDoxbBkNy38MAqnkivL1682NCATM11SZbbH3rMctg9yZhITwxQbKrrB2NfAdTJBia/+53+/VLybdLI2wtaBUNy38Ktsjy983sy48opKzB6FpDIbhig2FhVVZUYPNghgNdkA5MxY4Robf3+ZxP9bVLrATva+9EyGJK7bpFeN3O+RyITvq3MrEEnkVWoGb+7gyylsbEYdXXyS2/r6oBBg77/t9vtRllZWcjSWYfDgcrKypiX8sotWZUkCbNmzUJRURFSUlKCFWbr6urC/owkSXA4HMjPzw97rurqatTX12PgwIE4ePAg7rzzzojvR8ulpoHl52pfV9qHzptpGqG4uBhFRUUh1zQ/P1/XpfJ2YPRmkkRJTe9oSQ/JOIPy0UfKCq2tXdv1ZxcvXhxxOjqeKf1Yvk3GcnshWvXcSMcwQ66Fkn19Ag/OXFgDZ1CI4sNbPDZSX68sMHnmmfA/v2TJEt0qnsZ6C0PN7QUl1XMjvR8z5Foorf7LvAVrMEPgS2RlDFBs4ORJIX70I/nA5IYbhPD5wh+jqqpK8cAeyze+eL5NKsmHkUtIlDtnW1ubKC8vF5mZmYqCIb2Ul5fzW7eNmCHwJbIq5qBY3H33AY89Fr1Ndjawfbt/R+JwAvkhSsVyzzyenBK5vA5Avtx8NMuWLcPUqVNDfj4zMxNlZWW47777DM21GD58uKJ2zFuwhuLiYixdujRsTldFRUXCtmcgshsGKCby1ltAUZF8u61bgREjordRO7jHsi9JYI+ikpISSJIUEqRosUdRPAN2RUVFl+e++eYbPPTQQ7jgggsMHUS4N4z9MMmYSH+abhZIsfn6a/+GfnLBydKl/hs7csEJoG5wdzqdYWc5lAh8m9Rjs79YBmxJkiIOEoEAyujN8AIzTZ03mgyQJCmu3wElRqTNRYlIGwxQEujoUcDhAM49N3q7OXP8gcmkScqPrWZwj3cn5mi7FsdDbmDvLDCLY7Zdhs2wGzYRkdUwQEkAIYD//m/g9NP99UoiufRS4MQJYMEC9edQMrinpKRg8eLFmtzu0OPbZLSBPRyHw4FZs2YpOrbR+R56zjQREdmRJMJlN5pcc3Mz0tPT0dTUhLS0tER3R5UXXwR+/Wv5dvv2AZ3GMtXcbjdKSkoAIGwS65IlS4Kvm1mkInNPP/00+vXrF5IDUF1djcLCQtljejwe2SRdPXQuOMe8BSJKJmrGbybJGmTdOuDyy+XbffABoFUqQqTVBk6n03KrDToHWEIIdOvWrUuQEc/KIiMoWb1EREScQdFdYyOQkyPfrqICULEqWBUrf2sPzAJ1/jMN3PIJd3sk0sxRtJ8hIiL9qRm/GaDo5NQpYOxYQC4Xc9IkYPFioBuzgbrw+XzIzc2NuFw6MBtSW1vbJeAKd1vIijNHRER2wgAlwebNAx5+OHqbrCxg587IhdbsIp7ZG6/XG1c+iZVnjoiI7Ig5KAnyz38C110n3+7zz4Hzz9e/P0aIFgTEu4NyrDvHdu7T9ddfz8CEiMhiGKBoYMcOQEk188WLgZ//XP/+GCVaAAIgbO5IXV0dSkpKFOWBxFKBNd6giIiIzIG3eOJw7Jh/JmT37ujtZs8GnnrKmD51pOctjmjJq0IIZGVl4dChQ2F/NlruSOf+5+bmyq7ICRwnloRaIiIyjprxm6mZMRACuPlmoG/f6MHJRRf5C60lIjhxu93Izc1FYWEhJk+ejMLCQuTm5sLtdsd97MBGhOGChsBzkYKTQBsl1VzVVGCV65MQArfddhtWr15taJl7IiKKDQMUlf76V/+Km1deid5u717gX/8CUlMN6VaIwExC59Uvgdsr8QYp8ewy3JGSHBOlFViV9OnQoUMYN26cZoEa6cfn88Hr9WLRokXwer0MKomSEAMUhdav92/o96tfRW/n8fhnWBwOY/rVmZLZjXg3y9OqTLzSHBMle/2o6ZNWgRrpQ8/ZPyKyDibJyjh4EBgwwB90RPPHPwJ33mlMn6KRm0noeHsl1oqmsewy3FEs1VzlKrCq6ZMQApIkYdasWSgqKjJ0hQ+XPkcXKY9ITXK1Vvi7IkowYUFNTU0CgGhqatLtHKdOCfHjHwvhD00iP4qKhPD5dOuGai6XSwCQfbhcrpjP0dbWJhwOh5AkKeyxJUkSWVlZQpKkLm0Cz1VVVWn4ruX7FOnh8Xg07Uc0VVVVwuFwhJzf4XBofi2sKvA7jPS7kiRJOJ1O0dbWpntf+Lsi0oea8Zu3eMJ45BGgRw/g/fcjt0lPBw4fBt5801xVYGNZmquWkuTVF1980dDde9XufBxg1K7GeucF2YGa2T898XdFZBL6x0va02sGZe1a+RkTQIjPPtP0tJpSMruh1bfQcN8ynU5nyLfMtrY24fF4hMvlEh6PR7S2tob8W+tvw+H6FO1hxAyKmWYGzMyI2T85/F0R6UvN+M0A5Tv79wvRq1f0wGTRIs1Op6uqqqqwt1cCjyVLlmh2rs4BSOCDO9zzRk2bt7W1iVWrVonMzExTDDQej8c0wZKZmeE6maEPRHbGACUGr78eOTD5zW+EaG/X7FSKRBr4lYo2k5CZmSnKy8t1G5zDnTsrKytioKBHTkqgH0bmwURihpkBKzBy9i8S/q6I9MUAJQbbtgmRkhIamIwcKcTx45qdQjGtZhoWL14c9UM2KytL80E6EBQovcWi98Cj5DaU3vitXLlEB5X8XRHpiwFKjN59V4gbbxRi6lQhdu/W9NCKRRrg1X5Ay91L7/jQ6kNfzTmN/NCPdzZKi/MnembAShIZVPJ3RaQvNeM39+IxkcDeM5FWMijdwwYAvF4vCgsLFZ3X6XQqOqYcNecMx+VyobS0NK4+mFVgZQiAkBof3CcovETWIOHvikg/3IvHorRcZqlm+axWSzfjXbIbbwG4RJIrza60ZL9W57O6QGG+0tJSFBQUGFogTevfFRHFhpVkTUTpAF9XVwev1xv126XawV6LeiCxBhixVJY1E7fbjbKyspDg0uFwoLKyMmQwKy4uRlFRUVwzAz6fD48++igqKytx+PDhqOej2GnxuyKiOOl7t0kfRlSSTQSlCXr9+vWTTaBVmw+iRf5HLNVcjV5Ro7WqqipD8nsC50rEaigiIq0wB8WiAjkodXV1YTf7iyTSvfFI+5p0/lmleS1KRLt/L4RAVlYWDh06FHze6XSioqLCkt/8fT4fBgwYEPJ+OsvKykJjY2Pc19btdmPSpElR22j9uyQi0hpzUCxKSQn5cAKBQOddigP30rOyssL+XOCYFRUVmg1o0e7fV1VVobGxMequxFbi9XqjBicAcOjQIXi93rjOE9ihWo4wqBQ8EZERGKCYTKQBPlKQERBpcCouLkZjYyPKy8uRmZkZ8ppeSX/FxcXYtWtX2EAkkcmPWlMaeMQboMglT3dm1P5CRER6YpKsCXVO0Nu+fXtwZkVOuMEpJSUFDz74IO677z7Dkv4CgUi8uOW9+oDDyquhiIgCGKCYVGCAd7vdeOihhxTnpEQbnLQKGowSbnVMZmYmysrKcN999+keqMgFRwUFBfjDH/4ge5x4r7magMPpdFp2NRQRUUdMkjUxucJtHdklQTIQFCxbtgwVFRUR22VlZeHFF1/ULX9FydJho5JklSZPS5KU0DodnO0iIjmqxm99FhLpy0zLjPUso6502TG+W2Zq9SWm0TY4jPTQc5PBcNe483U2apmx3A7VeuyrpLZ/RuxUTUTWxr14DKL3h7LSnVUzMzMtPxDEsskgAM33RZGrHxNuL5aqqioxePBg3QfncH9veu9MrbRfWuwfRUT2l9AAZd68eV0+qM4999zg68ePHxe33367yMzMFH369BHFxcWioaFB1TnMEKAY8aGsdAZl1apVGryjxDHTJoOx7mZr1IaEid74MFx/1AZ0RJS81IzfuiwzPv/881FfXx98rF27Nvja7Nmz8Y9//ANLlizBmjVrsH//fsvVwQjUpRBh8gFEhJokscjPz4fD4YhYA0WSJDidTkslvoajdhltZ1ouq1V6rM7t7LR8Wg0t948iIupIl1U83bt3R05OTpfnm5qa8Ne//hUulws//vGPAQALFy7ED37wA3z88ce4/PLL9eiO5tR8KMcTPAQKt5WUlAQrsQboUWQtFlokRpppk0Glx0rEUl6le/4YKdaAjohIji4zKNu3b8egQYMwbNgwTJkyBXv27AEAbNy4EadOncK4ceOCbc877zwMGTIENTU1EY/X2tqK5ubmkEciGfmhbOadVd1uN3Jzc1FYWIjJkyejsLAQubm5cLvdqo4TzyaDWi+rVTprZfRS3sAWAp0D47q6OpSUlKi+5loxc0BHRBan9f2lFStWiMWLF4tPP/1UvP322yIvL08MGTJENDc3i9dee0307Nmzy89ceuml4p577ol4zHB5LUhgDkqseQrxMFvugZY5OGbbZDDSiplEJX2aOc9D7nfHHBQi6shUq3i++eYbkZaWJv7yl7/EHKCcOHFCNDU1BR979+5NaIBi1g9lIxM1tR4w5ZbR9u3bN+TfTqdT10Ah3IoZvc8ZSSICYjXMFtARkXklPEm2o4yMDJxzzjnYsWMHcnJycPLkSRw5ciSkTWNjY9iclYDU1FSkpaWFPBJJyaZ+RueGaHW7RQk9EiMj3cpyOp2oqqrCkSNHDN1kMNp+QkYze56HmW9DEpGF6R0ttbS0iDPOOENUVlaKI0eOiB49eoilS5cGX//yyy8FAFFTU6P4mGZYZiyEeb5lG12HQml9FpfLpfrYZruVZQZmn0EJ4O+OiOSoGb81L3U/Z84c/PSnP8XQoUOxf/9+zJs3D5s3b8a2bduQnZ2NGTNmYMWKFXjllVeQlpaG3/zmNwCAjz76SPE5zFTqPtHlveXK4Sspga/2PXi9XhQWFsr2zePxBFcxJfo6WZlcqXu7bHNARPaX0FL3N9xwgxg4cKDo2bOnGDx4sLjhhhvEjh07gq8HCrWdccYZonfv3uJnP/uZqK+vV3UOs8ygmEG8365jqYarNgeHZdDjxzwPIrIDUyXJ6oEByvfiud0Sz60hpQMmy6Brxyy3FImIYpXQWzxGMNMtnkSL5XYLoM2toXCFw5xOJyoqKlBcXKzJOSgUb5URkZWpGb8ZoFhcrPkJsQY24c4facDU6hxERGQPasZvXUrdk3FiLYev1dLVwB40sfys2nZERJQ8dK+DQvqLpQ6FESXKWQadiIhixVs8NqImP8GIpatcHktERB2pGb85g2IjgdstpaWlKCgoiDroG1EN14wVd4mIyBoYoCQxI0qUsww6ERHFgrd4yJClq1weS0REXGZMlCAMxIiIIuMyY6IECFe4zuFwoLKykreyiIhUYg4KkQbcbjdKSkq6VM2tq6tDSUkJ3G53gnpGRGRNDFCI4uTz+VBWVhZ2KXXguVmzZsHn8xndNSIiy2KAQhSn6urqiPsNAf4gZe/evaiurjawV0RE1sYAhShOLOlPRKQ9BihEcWJJfyIi7TFAIYpTfn4+HA5Hl2q5AZIkwel0Ij8/3+CeERFZFwMUojixpD8RkfYYoBBpgCX9iYi0xUqyRBpiJVkioshYSZYoQQI7ShMRUXx4i4eIiIhMhwEKERERmQ4DFCIiIjIdBihERERkOgxQiIiIyHQYoBAREZHpMEAhIiIi02GAQkRERKbDAIWIiIhMx5KVZAPV+ZubmxPcEyIiIlIqMG4r2WXHkgFKS0sLAMDpdCa4J0RERKRWS0sL0tPTo7ax5GaB7e3t2L9/P04//XS0tLTA6XRi79693DhQR83NzbzOBuB1Ng6vtTF4nY1hlesshEBLSwsGDRqEbt2iZ5lYcgalW7ducDgcAABJkgAAaWlppv6l2AWvszF4nY3Da20MXmdjWOE6y82cBDBJloiIiEyHAQoRERGZjuUDlNTUVMybNw+pqamJ7oqt8Tobg9fZOLzWxuB1NoYdr7Mlk2SJiIjI3iw/g0JERET2wwCFiIiITIcBChEREZkOAxQiIiIyHdMHKIcPH8aUKVOQlpaGjIwM3HLLLTh69GjUn3nxxRdRUFCAtLQ0SJKEI0eOaHJcu4vlmpw4cQIzZ85EVlYW+vbti0mTJqGxsTGkjSRJXR6vv/66nm/FVJ599lnk5ubitNNOw5gxY/DJJ59Ebb9kyRKcd955OO200zBy5EisWLEi5HUhBB588EEMHDgQvXr1wrhx47B9+3Y934IlaH2db7rppi5/txMmTNDzLViCmuu8detWTJo0Cbm5uZAkCRUVFXEfM1lofZ0feuihLn/P5513no7vQAPC5CZMmCBGjx4tPv74Y1FdXS3OPvtsUVpaGvVnnn76aTF//nwxf/58AUB88803mhzX7mK5JtOnTxdOp1OsXr1abNiwQVx++eXiiiuuCGkDQCxcuFDU19cHH8ePH9fzrZjG66+/Lnr27ClefvllsXXrVnHrrbeKjIwM0djYGLb9hx9+KFJSUsSTTz4ptm3bJu6//37Ro0cPsWXLlmCbxx9/XKSnp4s333xTfPrpp+I///M/xZlnnpk01zQcPa7ztGnTxIQJE0L+bg8fPmzUWzIltdf5k08+EXPmzBGLFi0SOTk54umnn477mMlAj+s8b948cf7554f8PR88eFDndxIfUwco27ZtEwDE+vXrg8+tXLlSSJIk6urqZH/e4/GEDVDiPa4dxXJNjhw5Inr06CGWLFkSfO6LL74QAERNTU3wOQDijTfe0K3vZnbZZZeJmTNnBv/t8/nEoEGDxPz588O2v/7668W1114b8tyYMWPEr3/9ayGEEO3t7SInJ0csWLAg+PqRI0dEamqqWLRokQ7vwBq0vs5C+AOUoqIiXfprVWqvc0dDhw4NO3DGc0y70uM6z5s3T4wePVrDXurP1Ld4ampqkJGRgUsuuST43Lhx49CtWzesW7fOdMe1sliuycaNG3Hq1CmMGzcu+Nx5552HIUOGoKamJqTtzJkz0a9fP1x22WV4+eWXFW21bXUnT57Exo0bQ65Pt27dMG7cuC7XJ6CmpiakPQCMHz8+2L62thYNDQ0hbdLT0zFmzJiIx7Q7Pa5zgNfrRf/+/XHuuedixowZOHTokPZvwCJiuc6JOKbV6XlNtm/fjkGDBmHYsGGYMmUK9uzZE293dWXqAKWhoQH9+/cPea579+7IzMxEQ0OD6Y5rZbFck4aGBvTs2RMZGRkhzw8YMCDkZx5++GEsXrwY7733HiZNmoTbb78dzzzzjObvwWz+/e9/w+fzYcCAASHPd74+HTU0NERtH/hfNce0Oz2uMwBMmDABf//737F69Wo88cQTWLNmDSZOnAifz6f9m7CAWK5zIo5pdXpdkzFjxuCVV17B22+/jeeffx61tbXIz89HS0tLvF3WTUJ2M/7d736HJ554ImqbL774wqDe2JsZrvUDDzwQ/O+LLroIx44dw4IFC/Db3/5W1/MSxeMXv/hF8L9HjhyJUaNG4ayzzoLX68XYsWMT2DMi9SZOnBj871GjRmHMmDEYOnQoFi9ejFtuuSWBPYssIQHKXXfdhZtuuilqm2HDhiEnJwcHDhwIeb6trQ2HDx9GTk5OzOfX67hmpOe1zsnJwcmTJ3HkyJGQWZTGxsao13HMmDF45JFH0Nraaqt9Izrr168fUlJSuqxqinZ9cnJyorYP/G9jYyMGDhwY0ubCCy/UsPfWocd1DmfYsGHo168fduzYkZQBSizXORHHtDqjrklGRgbOOecc7NixQ7Njai0ht3iys7Nx3nnnRX307NkTeXl5OHLkCDZu3Bj82ffffx/t7e0YM2ZMzOfX67hmpOe1vvjii9GjRw+sXr06+NxXX32FPXv2IC8vL2KfNm/ejDPOOMPWwQkA9OzZExdffHHI9Wlvb8fq1asjXp+8vLyQ9gDw3nvvBdufeeaZyMnJCWnT3NyMdevWRb3mdqbHdQ5n3759OHToUEhgmExiuc6JOKbVGXVNjh49ip07d5r77znRWbpyJkyYIC666CKxbt06sXbtWjF8+PCQpa/79u0T5557rli3bl3wufr6erFp0ybx0ksvCQDigw8+EJs2bRKHDh1SfNxkFMu1nj59uhgyZIh4//33xYYNG0ReXp7Iy8sLvv7WW2+Jl156SWzZskVs375dPPfcc6J3797iwQcfNPS9Jcrrr78uUlNTxSuvvCK2bdsmbrvtNpGRkSEaGhqEEEJMnTpV/O53vwu2//DDD0X37t3F//zP/4gvvvhCzJs3L+wy44yMDLFs2TLx2WefiaKiIi4z1vg6t7S0iDlz5oiamhpRW1srVq1aJX74wx+K4cOHixMnTiTkPZqB2uvc2toqNm3aJDZt2iQGDhwo5syZIzZt2iS2b9+u+JjJSI/rfNdddwmv1ytqa2vFhx9+KMaNGyf69esnDhw4YPj7U8r0AcqhQ4dEaWmp6Nu3r0hLSxM333yzaGlpCb5eW1srAAiPxxN8bt68eQJAl8fChQsVHzcZxXKtjx8/Lm6//XZxxhlniN69e4uf/exnor6+Pvj6ypUrxYUXXij69u0r+vTpI0aPHi1eeOEF4fP5jHxrCfXMM8+IIUOGiJ49e4rLLrtMfPzxx8HXrrrqKjFt2rSQ9osXLxbnnHOO6Nmzpzj//PPFP//5z5DX29vbxQMPPCAGDBggUlNTxdixY8VXX31lxFsxNS2v87fffiuuvvpqkZ2dLXr06CGGDh0qbr311qQeNAPUXOfAZ0bnx1VXXaX4mMlK6+t8ww03iIEDB4qePXuKwYMHixtuuEHs2LHDwHekniREEqz3JCIiIksx9TJjIiIiSk4MUIiIiMh0GKAQERGR6TBAISIiItNhgEJERESmwwCFiIiITIcBChEREZkOAxQiIiIyHQYoREREZDoMUIiIiMh0GKAQERGR6TBAISIiItP5/wEp1b8yUKjSwAAAAABJRU5ErkJggg==", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "plt.scatter(X_test, y_test, color='black')\n", - "plt.plot(X_test, y_pred, color='blue', linewidth=3)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.1" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "16ff1a974f6e4348e869e4a7d366b86a", - "translation_date": "2025-08-29T23:06:23+00:00", - "source_file": "2-Regression/1-Tools/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/2-Regression/2-Data/README.md b/translations/br/2-Regression/2-Data/README.md deleted file mode 100644 index dd9601ba9..000000000 --- a/translations/br/2-Regression/2-Data/README.md +++ /dev/null @@ -1,226 +0,0 @@ - -# Construir um modelo de regressão usando Scikit-learn: preparar e visualizar dados - -![Infográfico de visualização de dados](../../../../2-Regression/2-Data/images/data-visualization.png) - -Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/2-Data/solution/R/lesson_2.html) - -## Introdução - -Agora que você está equipado com as ferramentas necessárias para começar a construir modelos de aprendizado de máquina com Scikit-learn, está pronto para começar a fazer perguntas sobre seus dados. Ao trabalhar com dados e aplicar soluções de aprendizado de máquina, é muito importante saber como fazer as perguntas certas para desbloquear adequadamente o potencial do seu conjunto de dados. - -Nesta lição, você aprenderá: - -- Como preparar seus dados para a construção de modelos. -- Como usar o Matplotlib para visualização de dados. - -## Fazendo as perguntas certas sobre seus dados - -A pergunta que você precisa responder determinará o tipo de algoritmos de aprendizado de máquina que você usará. E a qualidade da resposta que você obtém dependerá muito da natureza dos seus dados. - -Dê uma olhada nos [dados](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/data/US-pumpkins.csv) fornecidos para esta lição. Você pode abrir este arquivo .csv no VS Code. Uma rápida olhada mostra imediatamente que há lacunas e uma mistura de dados em formato de texto e numérico. Há também uma coluna estranha chamada 'Package', onde os dados são uma mistura de 'sacks', 'bins' e outros valores. Os dados, na verdade, estão um pouco bagunçados. - -[![ML para iniciantes - Como analisar e limpar um conjunto de dados](https://img.youtube.com/vi/5qGjczWTrDQ/0.jpg)](https://youtu.be/5qGjczWTrDQ "ML para iniciantes - Como analisar e limpar um conjunto de dados") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre como preparar os dados para esta lição. - -Na verdade, não é muito comum receber um conjunto de dados completamente pronto para criar um modelo de aprendizado de máquina. Nesta lição, você aprenderá como preparar um conjunto de dados bruto usando bibliotecas padrão do Python. Você também aprenderá várias técnicas para visualizar os dados. - -## Estudo de caso: 'o mercado de abóboras' - -Nesta pasta, você encontrará um arquivo .csv na pasta raiz `data` chamado [US-pumpkins.csv](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/data/US-pumpkins.csv), que inclui 1757 linhas de dados sobre o mercado de abóboras, organizados em agrupamentos por cidade. Estes são dados brutos extraídos dos [Relatórios Padrão dos Mercados de Produtos Especiais](https://www.marketnews.usda.gov/mnp/fv-report-config-step1?type=termPrice) distribuídos pelo Departamento de Agricultura dos Estados Unidos. - -### Preparando os dados - -Esses dados estão em domínio público. Eles podem ser baixados em vários arquivos separados, por cidade, no site do USDA. Para evitar muitos arquivos separados, concatenamos todos os dados das cidades em uma única planilha, ou seja, já _preparamos_ um pouco os dados. Agora, vamos dar uma olhada mais de perto nos dados. - -### Os dados das abóboras - primeiras conclusões - -O que você percebe sobre esses dados? Você já viu que há uma mistura de textos, números, lacunas e valores estranhos que você precisa interpretar. - -Que pergunta você pode fazer sobre esses dados, usando uma técnica de regressão? Que tal "Prever o preço de uma abóbora à venda durante um determinado mês"? Olhando novamente para os dados, há algumas mudanças que você precisa fazer para criar a estrutura de dados necessária para essa tarefa. - -## Exercício - analisar os dados das abóboras - -Vamos usar o [Pandas](https://pandas.pydata.org/) (o nome significa `Python Data Analysis`), uma ferramenta muito útil para modelar dados, para analisar e preparar esses dados de abóboras. - -### Primeiro, verifique se há datas ausentes - -Você precisará primeiro tomar medidas para verificar se há datas ausentes: - -1. Converta as datas para o formato de mês (estas são datas dos EUA, então o formato é `MM/DD/YYYY`). -2. Extraia o mês para uma nova coluna. - -Abra o arquivo _notebook.ipynb_ no Visual Studio Code e importe a planilha para um novo dataframe do Pandas. - -1. Use a função `head()` para visualizar as cinco primeiras linhas. - - ```python - import pandas as pd - pumpkins = pd.read_csv('../data/US-pumpkins.csv') - pumpkins.head() - ``` - - ✅ Qual função você usaria para visualizar as últimas cinco linhas? - -1. Verifique se há dados ausentes no dataframe atual: - - ```python - pumpkins.isnull().sum() - ``` - - Há dados ausentes, mas talvez isso não importe para a tarefa em questão. - -1. Para tornar seu dataframe mais fácil de trabalhar, selecione apenas as colunas necessárias, usando a função `loc`, que extrai do dataframe original um grupo de linhas (passado como primeiro parâmetro) e colunas (passado como segundo parâmetro). A expressão `:` no caso abaixo significa "todas as linhas". - - ```python - columns_to_select = ['Package', 'Low Price', 'High Price', 'Date'] - pumpkins = pumpkins.loc[:, columns_to_select] - ``` - -### Segundo, determine o preço médio da abóbora - -Pense em como determinar o preço médio de uma abóbora em um determinado mês. Quais colunas você escolheria para essa tarefa? Dica: você precisará de 3 colunas. - -Solução: calcule a média das colunas `Low Price` e `High Price` para preencher a nova coluna Price e converta a coluna Date para mostrar apenas o mês. Felizmente, de acordo com a verificação acima, não há dados ausentes para datas ou preços. - -1. Para calcular a média, adicione o seguinte código: - - ```python - price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2 - - month = pd.DatetimeIndex(pumpkins['Date']).month - - ``` - - ✅ Sinta-se à vontade para imprimir qualquer dado que desejar verificar usando `print(month)`. - -2. Agora, copie seus dados convertidos para um novo dataframe do Pandas: - - ```python - new_pumpkins = pd.DataFrame({'Month': month, 'Package': pumpkins['Package'], 'Low Price': pumpkins['Low Price'],'High Price': pumpkins['High Price'], 'Price': price}) - ``` - - Imprimir seu dataframe mostrará um conjunto de dados limpo e organizado, no qual você pode construir seu novo modelo de regressão. - -### Mas espere! Há algo estranho aqui - -Se você olhar para a coluna `Package`, verá que as abóboras são vendidas em muitas configurações diferentes. Algumas são vendidas em medidas de '1 1/9 bushel', outras em '1/2 bushel', algumas por unidade, algumas por peso e outras em grandes caixas com larguras variadas. - -> Parece que é muito difícil pesar abóboras de forma consistente - -Ao investigar os dados originais, é interessante notar que qualquer coisa com `Unit of Sale` igual a 'EACH' ou 'PER BIN' também tem o tipo `Package` por polegada, por bin ou 'each'. Parece que é muito difícil pesar abóboras de forma consistente, então vamos filtrá-las selecionando apenas abóboras com a string 'bushel' na coluna `Package`. - -1. Adicione um filtro no início do arquivo, sob a importação inicial do .csv: - - ```python - pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)] - ``` - - Se você imprimir os dados agora, verá que está obtendo apenas cerca de 415 linhas de dados contendo abóboras por bushel. - -### Mas espere! Há mais uma coisa a fazer - -Você percebeu que a quantidade de bushel varia por linha? Você precisa normalizar os preços para mostrar o preço por bushel, então faça alguns cálculos para padronizá-los. - -1. Adicione estas linhas após o bloco que cria o dataframe new_pumpkins: - - ```python - new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/(1 + 1/9) - - new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price/(1/2) - ``` - -✅ De acordo com [The Spruce Eats](https://www.thespruceeats.com/how-much-is-a-bushel-1389308), o peso de um bushel depende do tipo de produto, pois é uma medida de volume. "Um bushel de tomates, por exemplo, deve pesar 56 libras... Folhas e verduras ocupam mais espaço com menos peso, então um bushel de espinafre pesa apenas 20 libras." É tudo muito complicado! Vamos evitar fazer uma conversão de bushel para libra e, em vez disso, precificar por bushel. Todo esse estudo sobre bushels de abóboras, no entanto, mostra como é muito importante entender a natureza dos seus dados! - -Agora, você pode analisar os preços por unidade com base na medida de bushel. Se você imprimir os dados mais uma vez, verá como eles estão padronizados. - -✅ Você percebeu que abóboras vendidas por meio bushel são muito caras? Consegue descobrir por quê? Dica: abóboras pequenas são muito mais caras do que grandes, provavelmente porque há muito mais delas por bushel, dado o espaço não utilizado ocupado por uma grande abóbora oca para torta. - -## Estratégias de visualização - -Parte do papel do cientista de dados é demonstrar a qualidade e a natureza dos dados com os quais está trabalhando. Para isso, eles frequentemente criam visualizações interessantes, como gráficos, diagramas e tabelas, mostrando diferentes aspectos dos dados. Dessa forma, eles conseguem mostrar visualmente relações e lacunas que, de outra forma, seriam difíceis de identificar. - -[![ML para iniciantes - Como visualizar dados com Matplotlib](https://img.youtube.com/vi/SbUkxH6IJo0/0.jpg)](https://youtu.be/SbUkxH6IJo0 "ML para iniciantes - Como visualizar dados com Matplotlib") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre como visualizar os dados para esta lição. - -As visualizações também podem ajudar a determinar a técnica de aprendizado de máquina mais apropriada para os dados. Um gráfico de dispersão que parece seguir uma linha, por exemplo, indica que os dados são bons candidatos para um exercício de regressão linear. - -Uma biblioteca de visualização de dados que funciona bem em notebooks Jupyter é o [Matplotlib](https://matplotlib.org/) (que você também viu na lição anterior). - -> Obtenha mais experiência com visualização de dados nestes [tutoriais](https://docs.microsoft.com/learn/modules/explore-analyze-data-with-python?WT.mc_id=academic-77952-leestott). - -## Exercício - experimente o Matplotlib - -Tente criar alguns gráficos básicos para exibir o novo dataframe que você acabou de criar. O que um gráfico de linha básico mostraria? - -1. Importe o Matplotlib no início do arquivo, sob a importação do Pandas: - - ```python - import matplotlib.pyplot as plt - ``` - -1. Execute novamente todo o notebook para atualizar. -1. No final do notebook, adicione uma célula para plotar os dados como um boxplot: - - ```python - price = new_pumpkins.Price - month = new_pumpkins.Month - plt.scatter(price, month) - plt.show() - ``` - - ![Um gráfico de dispersão mostrando a relação entre preço e mês](../../../../2-Regression/2-Data/images/scatterplot.png) - - Este gráfico é útil? Algo nele te surpreende? - - Não é particularmente útil, pois tudo o que faz é exibir seus dados como uma distribuição de pontos em um determinado mês. - -### Torne-o útil - -Para que os gráficos exibam dados úteis, geralmente é necessário agrupar os dados de alguma forma. Vamos tentar criar um gráfico onde o eixo y mostra os meses e os dados demonstram a distribuição. - -1. Adicione uma célula para criar um gráfico de barras agrupado: - - ```python - new_pumpkins.groupby(['Month'])['Price'].mean().plot(kind='bar') - plt.ylabel("Pumpkin Price") - ``` - - ![Um gráfico de barras mostrando a relação entre preço e mês](../../../../2-Regression/2-Data/images/barchart.png) - - Este é um gráfico de visualização de dados mais útil! Parece indicar que o preço mais alto das abóboras ocorre em setembro e outubro. Isso corresponde à sua expectativa? Por quê? - ---- - -## 🚀Desafio - -Explore os diferentes tipos de visualização que o Matplotlib oferece. Quais tipos são mais apropriados para problemas de regressão? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Dê uma olhada nas várias maneiras de visualizar dados. Faça uma lista das diferentes bibliotecas disponíveis e anote quais são melhores para determinados tipos de tarefas, por exemplo, visualizações 2D versus visualizações 3D. O que você descobre? - -## Tarefa - -[Explorando visualização](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/2-Data/assignment.md b/translations/br/2-Regression/2-Data/assignment.md deleted file mode 100644 index 7f45f5496..000000000 --- a/translations/br/2-Regression/2-Data/assignment.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Explorando Visualizações - -Existem várias bibliotecas disponíveis para visualização de dados. Crie algumas visualizações usando os dados de Pumpkin nesta lição com matplotlib e seaborn em um notebook de exemplo. Quais bibliotecas são mais fáceis de usar? - -## Rubrica - -| Critério | Exemplary | Adequado | Precisa de Melhorias | -| -------- | --------- | -------- | -------------------- | -| | Um notebook é enviado com duas explorações/visualizações | Um notebook é enviado com uma exploração/visualização | Um notebook não é enviado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/2-Data/notebook.ipynb b/translations/br/2-Regression/2-Data/notebook.ipynb deleted file mode 100644 index de04b8988..000000000 --- a/translations/br/2-Regression/2-Data/notebook.ipynb +++ /dev/null @@ -1,46 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.3-final" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3", - "language": "python" - }, - "coopTranslator": { - "original_hash": "1b2ab303ac6c604a34c6ca7a49077fc7", - "translation_date": "2025-08-29T23:10:40+00:00", - "source_file": "2-Regression/2-Data/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/2-Regression/2-Data/solution/Julia/README.md b/translations/br/2-Regression/2-Data/solution/Julia/README.md deleted file mode 100644 index f57a43f69..000000000 --- a/translations/br/2-Regression/2-Data/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/2-Data/solution/R/lesson_2-R.ipynb b/translations/br/2-Regression/2-Data/solution/R/lesson_2-R.ipynb deleted file mode 100644 index a91027f55..000000000 --- a/translations/br/2-Regression/2-Data/solution/R/lesson_2-R.ipynb +++ /dev/null @@ -1,668 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_2-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "f3c335f9940cfd76528b3ef918b9b342", - "translation_date": "2025-08-29T23:16:14+00:00", - "source_file": "2-Regression/2-Data/solution/R/lesson_2-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Construir um modelo de regressão: preparar e visualizar dados\n", - "\n", - "## **Regressão Linear para Abóboras - Aula 2**\n", - "#### Introdução\n", - "\n", - "Agora que você já está equipado com as ferramentas necessárias para começar a construir modelos de aprendizado de máquina com Tidymodels e o Tidyverse, está pronto para começar a fazer perguntas sobre seus dados. Ao trabalhar com dados e aplicar soluções de aprendizado de máquina, é muito importante entender como formular a pergunta certa para desbloquear adequadamente o potencial do seu conjunto de dados.\n", - "\n", - "Nesta aula, você aprenderá:\n", - "\n", - "- Como preparar seus dados para a construção de modelos.\n", - "\n", - "- Como usar `ggplot2` para visualização de dados.\n", - "\n", - "A pergunta que você precisa responder determinará o tipo de algoritmos de aprendizado de máquina que você utilizará. E a qualidade da resposta que você obtiver dependerá fortemente da natureza dos seus dados.\n", - "\n", - "Vamos ver isso na prática por meio de um exercício.\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "Pg5aexcOPqAZ" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 1. Importando dados de abóboras e invocando o Tidyverse\n", - "\n", - "Vamos precisar dos seguintes pacotes para explorar e manipular esta lição:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "Você pode instalá-los assim:\n", - "\n", - "`install.packages(c(\"tidyverse\"))`\n", - "\n", - "O script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala para você caso algum esteja faltando.\n" - ], - "metadata": { - "id": "dc5WhyVdXAjR" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\n", - "pacman::p_load(tidyverse)" - ], - "outputs": [], - "metadata": { - "id": "GqPYUZgfXOBt" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, vamos iniciar alguns pacotes e carregar os [dados](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/data/US-pumpkins.csv) fornecidos para esta lição!\n" - ], - "metadata": { - "id": "kvjDTPDSXRr2" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the core Tidyverse packages\n", - "library(tidyverse)\n", - "\n", - "# Import the pumpkins data\n", - "pumpkins <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/2-Regression/data/US-pumpkins.csv\")\n", - "\n", - "\n", - "# Get a glimpse and dimensions of the data\n", - "glimpse(pumpkins)\n", - "\n", - "\n", - "# Print the first 50 rows of the data set\n", - "pumpkins %>% \n", - " slice_head(n =50)" - ], - "outputs": [], - "metadata": { - "id": "VMri-t2zXqgD" - } - }, - { - "cell_type": "markdown", - "source": [ - "Um rápido `glimpse()` mostra imediatamente que há valores em branco e uma mistura de strings (`chr`) e dados numéricos (`dbl`). A coluna `Date` está no formato de texto e há também uma coluna estranha chamada `Package`, onde os dados são uma mistura de `sacks`, `bins` e outros valores. Na verdade, os dados estão um pouco bagunçados 😤.\n", - "\n", - "De fato, não é muito comum receber um conjunto de dados completamente pronto para ser usado na criação de um modelo de ML diretamente. Mas não se preocupe, nesta lição, você aprenderá como preparar um conjunto de dados bruto usando bibliotecas padrão do R 🧑‍🔧. Você também aprenderá várias técnicas para visualizar os dados. 📈📊\n", - "
\n", - "\n", - "> Um lembrete: O operador pipe (`%>%`) realiza operações em sequência lógica, passando um objeto adiante para uma função ou expressão. Você pode pensar no operador pipe como se estivesse dizendo \"e então\" no seu código.\n" - ], - "metadata": { - "id": "REWcIv9yX29v" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 2. Verificar dados ausentes\n", - "\n", - "Um dos problemas mais comuns que os cientistas de dados precisam lidar é com dados incompletos ou ausentes. O R representa valores ausentes ou desconhecidos com um valor especial chamado sentinela: `NA` (Not Available).\n", - "\n", - "Então, como saberíamos que o data frame contém valores ausentes? \n", - "
\n", - "- Uma maneira direta seria usar a função base do R `anyNA`, que retorna os objetos lógicos `TRUE` ou `FALSE`.\n" - ], - "metadata": { - "id": "Zxfb3AM5YbUe" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "pumpkins %>% \n", - " anyNA()" - ], - "outputs": [], - "metadata": { - "id": "G--DQutAYltj" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ótimo, parece que há alguns dados faltando! Esse é um bom ponto de partida.\n", - "\n", - "- Outra maneira seria usar a função `is.na()`, que indica quais elementos individuais da coluna estão ausentes com um valor lógico `TRUE`.\n" - ], - "metadata": { - "id": "mU-7-SB6YokF" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "pumpkins %>% \n", - " is.na() %>% \n", - " head(n = 7)" - ], - "outputs": [], - "metadata": { - "id": "W-DxDOR4YxSW" - } - }, - { - "cell_type": "markdown", - "source": [ - "Certo, trabalho concluído, mas com um dataframe tão grande como este, seria ineficiente e praticamente impossível revisar todas as linhas e colunas individualmente😴.\n", - "\n", - "- Uma maneira mais intuitiva seria calcular a soma dos valores ausentes para cada coluna:\n" - ], - "metadata": { - "id": "xUWxipKYY0o7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "pumpkins %>% \n", - " is.na() %>% \n", - " colSums()" - ], - "outputs": [], - "metadata": { - "id": "ZRBWV6P9ZArL" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito melhor! Há dados faltando, mas talvez isso não importe para a tarefa em questão. Vamos ver o que uma análise mais aprofundada revela.\n", - "\n", - "> Junto com os incríveis conjuntos de pacotes e funções, o R possui uma documentação muito boa. Por exemplo, use `help(colSums)` ou `?colSums` para saber mais sobre a função.\n" - ], - "metadata": { - "id": "9gv-crB6ZD1Y" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 3. Dplyr: Uma Gramática para Manipulação de Dados\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "o4jLY5-VZO2C" - } - }, - { - "cell_type": "markdown", - "source": [ - "[`dplyr`](https://dplyr.tidyverse.org/), um pacote do Tidyverse, é uma gramática de manipulação de dados que oferece um conjunto consistente de verbos para ajudar a resolver os desafios mais comuns de manipulação de dados. Nesta seção, vamos explorar alguns dos verbos do dplyr! \n", - "
\n" - ], - "metadata": { - "id": "i5o33MQBZWWw" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::select()\n", - "\n", - "`select()` é uma função do pacote `dplyr` que ajuda você a escolher colunas para manter ou excluir.\n", - "\n", - "Para tornar seu data frame mais fácil de trabalhar, remova várias de suas colunas usando `select()`, mantendo apenas as colunas que você precisa.\n", - "\n", - "Por exemplo, neste exercício, nossa análise envolverá as colunas `Package`, `Low Price`, `High Price` e `Date`. Vamos selecionar essas colunas.\n" - ], - "metadata": { - "id": "x3VGMAGBZiUr" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Select desired columns\n", - "pumpkins <- pumpkins %>% \n", - " select(Package, `Low Price`, `High Price`, Date)\n", - "\n", - "\n", - "# Print data set\n", - "pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "F_FgxQnVZnM0" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::mutate()\n", - "\n", - "`mutate()` é uma função do pacote `dplyr` que ajuda a criar ou modificar colunas, mantendo as colunas existentes.\n", - "\n", - "A estrutura geral do `mutate` é:\n", - "\n", - "`data %>% mutate(nome_da_nova_coluna = o_que_ela_contem)`\n", - "\n", - "Vamos experimentar o `mutate` usando a coluna `Date` e realizando as seguintes operações:\n", - "\n", - "1. Converter as datas (atualmente do tipo caractere) para um formato de mês (essas são datas no formato dos EUA, ou seja, `MM/DD/YYYY`).\n", - "\n", - "2. Extrair o mês das datas para uma nova coluna.\n", - "\n", - "No R, o pacote [lubridate](https://lubridate.tidyverse.org/) facilita o trabalho com dados de data e hora. Então, vamos usar `dplyr::mutate()`, `lubridate::mdy()`, `lubridate::month()` e ver como alcançar os objetivos acima. Podemos descartar a coluna `Date`, já que não precisaremos mais dela nas operações subsequentes.\n" - ], - "metadata": { - "id": "2KKo0Ed9Z1VB" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load lubridate\n", - "library(lubridate)\n", - "\n", - "pumpkins <- pumpkins %>% \n", - " # Convert the Date column to a date object\n", - " mutate(Date = mdy(Date)) %>% \n", - " # Extract month from Date\n", - " mutate(Month = month(Date)) %>% \n", - " # Drop Date column\n", - " select(-Date)\n", - "\n", - "# View the first few rows\n", - "pumpkins %>% \n", - " slice_head(n = 7)" - ], - "outputs": [], - "metadata": { - "id": "5joszIVSZ6xe" - } - }, - { - "cell_type": "markdown", - "source": [ - "Uhuu! 🤩\n", - "\n", - "Agora, vamos criar uma nova coluna chamada `Price`, que representa o preço médio de uma abóbora. Para isso, vamos calcular a média das colunas `Low Price` e `High Price` para preencher a nova coluna Price. \n", - "
\n" - ], - "metadata": { - "id": "nIgLjNMCZ-6Y" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Create a new column Price\n", - "pumpkins <- pumpkins %>% \n", - " mutate(Price = (`Low Price` + `High Price`)/2)\n", - "\n", - "# View the first few rows of the data\n", - "pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "Zo0BsqqtaJw2" - } - }, - { - "cell_type": "markdown", - "source": [ - "Yeees!💪\n", - "\n", - "\"Mas espere!\", você dirá depois de dar uma olhada rápida no conjunto de dados com `View(pumpkins)`, \"Tem algo estranho aqui!\"🤔\n", - "\n", - "Se você observar a coluna `Package`, verá que as abóboras são vendidas em várias configurações diferentes. Algumas são vendidas em medidas de `1 1/9 bushel`, outras em medidas de `1/2 bushel`, algumas por abóbora, outras por libra, e algumas em grandes caixas com larguras variadas.\n", - "\n", - "Vamos verificar isso:\n" - ], - "metadata": { - "id": "p77WZr-9aQAR" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Verify the distinct observations in Package column\n", - "pumpkins %>% \n", - " distinct(Package)" - ], - "outputs": [], - "metadata": { - "id": "XISGfh0IaUy6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Incrível!👏\n", - "\n", - "Parece que abóboras são muito difíceis de pesar de forma consistente, então vamos filtrá-las selecionando apenas as abóboras que contêm a string *bushel* na coluna `Package` e colocar isso em um novo data frame `new_pumpkins`.\n" - ], - "metadata": { - "id": "7sMjiVujaZxY" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::filter() e stringr::str_detect()\n", - "\n", - "[`dplyr::filter()`](https://dplyr.tidyverse.org/reference/filter.html): cria um subconjunto dos dados contendo apenas as **linhas** que atendem às suas condições, neste caso, abóboras com a string *bushel* na coluna `Package`.\n", - "\n", - "[stringr::str_detect()](https://stringr.tidyverse.org/reference/str_detect.html): detecta a presença ou ausência de um padrão em uma string.\n", - "\n", - "O pacote [`stringr`](https://github.com/tidyverse/stringr) fornece funções simples para operações comuns com strings.\n" - ], - "metadata": { - "id": "L8Qfcs92ageF" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Retain only pumpkins with \"bushel\"\n", - "new_pumpkins <- pumpkins %>% \n", - " filter(str_detect(Package, \"bushel\"))\n", - "\n", - "# Get the dimensions of the new data\n", - "dim(new_pumpkins)\n", - "\n", - "# View a few rows of the new data\n", - "new_pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "hy_SGYREampd" - } - }, - { - "cell_type": "markdown", - "source": [ - "Você pode ver que reduzimos para cerca de 415 linhas de dados contendo abóboras por alqueire. 🤩\n" - ], - "metadata": { - "id": "VrDwF031avlR" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::case_when()\n", - "\n", - "**Mas espere! Ainda há mais uma coisa a fazer**\n", - "\n", - "Você percebeu que a quantidade de alqueires varia por linha? É necessário normalizar os preços para que sejam exibidos por alqueire, e não por 1 1/9 ou 1/2 alqueire. Hora de fazer alguns cálculos para padronizar isso.\n", - "\n", - "Usaremos a função [`case_when()`](https://dplyr.tidyverse.org/reference/case_when.html) para *modificar* a coluna Price dependendo de algumas condições. `case_when` permite que você vetorize múltiplas declarações `if_else()`.\n" - ], - "metadata": { - "id": "mLpw2jH4a0tx" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Convert the price if the Package contains fractional bushel values\n", - "new_pumpkins <- new_pumpkins %>% \n", - " mutate(Price = case_when(\n", - " str_detect(Package, \"1 1/9\") ~ Price/(1 + 1/9),\n", - " str_detect(Package, \"1/2\") ~ Price/(1/2),\n", - " TRUE ~ Price))\n", - "\n", - "# View the first few rows of the data\n", - "new_pumpkins %>% \n", - " slice_head(n = 30)" - ], - "outputs": [], - "metadata": { - "id": "P68kLVQmbM6I" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, podemos analisar o preço por unidade com base na medida de alqueire. Todo esse estudo sobre alqueires de abóboras, no entanto, mostra como é `importante` `entender a natureza dos seus dados`!\n", - "\n", - "> ✅ De acordo com [The Spruce Eats](https://www.thespruceeats.com/how-much-is-a-bushel-1389308), o peso de um alqueire depende do tipo de produto, já que é uma medida de volume. \"Um alqueire de tomates, por exemplo, deve pesar 56 libras... Folhas e verduras ocupam mais espaço com menos peso, então um alqueire de espinafre pesa apenas 20 libras.\" É tudo bem complicado! Vamos evitar fazer uma conversão de alqueire para libra e, em vez disso, precificar pelo alqueire. Todo esse estudo sobre alqueires de abóboras, no entanto, mostra como é muito importante entender a natureza dos seus dados!\n", - ">\n", - "> ✅ Você percebeu que as abóboras vendidas por meio alqueire são muito caras? Consegue descobrir o motivo? Dica: abóboras pequenas são muito mais caras do que as grandes, provavelmente porque há muito mais delas por alqueire, considerando o espaço não utilizado ocupado por uma grande abóbora oca de torta.\n" - ], - "metadata": { - "id": "pS2GNPagbSdb" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, por pura diversão 💁‍♀️, vamos também mover a coluna Mês para a primeira posição, ou seja, `antes` da coluna `Pacote`.\n", - "\n", - "`dplyr::relocate()` é usado para alterar as posições das colunas.\n" - ], - "metadata": { - "id": "qql1SowfbdnP" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Create a new data frame new_pumpkins\n", - "new_pumpkins <- new_pumpkins %>% \n", - " relocate(Month, .before = Package)\n", - "\n", - "new_pumpkins %>% \n", - " slice_head(n = 7)" - ], - "outputs": [], - "metadata": { - "id": "JJ1x6kw8bixF" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho!👌 Agora você tem um conjunto de dados limpo e organizado para construir seu novo modelo de regressão! \n", - "
\n" - ], - "metadata": { - "id": "y8TJ0Za_bn5Y" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 4. Visualização de dados com ggplot2\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "\n", - "Existe um *sábio* ditado que diz o seguinte:\n", - "\n", - "> \"O gráfico simples trouxe mais informações à mente do analista de dados do que qualquer outro dispositivo.\" --- John Tukey\n", - "\n", - "Parte do papel do cientista de dados é demonstrar a qualidade e a natureza dos dados com os quais está trabalhando. Para isso, eles frequentemente criam visualizações interessantes, como gráficos, diagramas e tabelas, mostrando diferentes aspectos dos dados. Dessa forma, eles conseguem mostrar visualmente relações e lacunas que, de outra maneira, seriam difíceis de identificar.\n", - "\n", - "As visualizações também podem ajudar a determinar a técnica de aprendizado de máquina mais apropriada para os dados. Um gráfico de dispersão que parece seguir uma linha, por exemplo, indica que os dados são bons candidatos para um exercício de regressão linear.\n", - "\n", - "O R oferece vários sistemas para criar gráficos, mas [`ggplot2`](https://ggplot2.tidyverse.org/index.html) é um dos mais elegantes e versáteis. O `ggplot2` permite compor gráficos **combinando componentes independentes**.\n", - "\n", - "Vamos começar com um gráfico de dispersão simples para as colunas Price e Month.\n", - "\n", - "Neste caso, começaremos com [`ggplot()`](https://ggplot2.tidyverse.org/reference/ggplot.html), fornecendo um conjunto de dados e um mapeamento estético (com [`aes()`](https://ggplot2.tidyverse.org/reference/aes.html)) e, em seguida, adicionaremos camadas (como [`geom_point()`](https://ggplot2.tidyverse.org/reference/geom_point.html)) para gráficos de dispersão.\n" - ], - "metadata": { - "id": "mYSH6-EtbvNa" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Set a theme for the plots\n", - "theme_set(theme_light())\n", - "\n", - "# Create a scatter plot\n", - "p <- ggplot(data = new_pumpkins, aes(x = Price, y = Month))\n", - "p + geom_point()" - ], - "outputs": [], - "metadata": { - "id": "g2YjnGeOcLo4" - } - }, - { - "cell_type": "markdown", - "source": [ - "Este é um gráfico útil 🤷? Algo nele te surpreende?\n", - "\n", - "Não é particularmente útil, já que tudo o que ele faz é mostrar seus dados como uma distribuição de pontos em um determinado mês.\n", - "
\n" - ], - "metadata": { - "id": "Ml7SDCLQcPvE" - } - }, - { - "cell_type": "markdown", - "source": [ - "### **Como tornamos isso útil?**\n", - "\n", - "Para exibir dados úteis em gráficos, geralmente é necessário agrupar os dados de alguma forma. Por exemplo, no nosso caso, calcular o preço médio das abóboras para cada mês forneceria mais insights sobre os padrões subjacentes em nossos dados. Isso nos leva a mais uma abordagem do **dplyr**:\n", - "\n", - "#### `dplyr::group_by() %>% summarize()`\n", - "\n", - "A agregação agrupada no R pode ser facilmente realizada usando\n", - "\n", - "`dplyr::group_by() %>% summarize()`\n", - "\n", - "- `dplyr::group_by()` altera a unidade de análise do conjunto de dados completo para grupos individuais, como por mês.\n", - "\n", - "- `dplyr::summarize()` cria um novo data frame com uma coluna para cada variável de agrupamento e uma coluna para cada estatística resumida que você especificou.\n", - "\n", - "Por exemplo, podemos usar `dplyr::group_by() %>% summarize()` para agrupar as abóboras com base na coluna **Month** e, em seguida, calcular o **preço médio** para cada mês.\n" - ], - "metadata": { - "id": "jMakvJZIcVkh" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Find the average price of pumpkins per month\r\n", - "new_pumpkins %>%\r\n", - " group_by(Month) %>% \r\n", - " summarise(mean_price = mean(Price))" - ], - "outputs": [], - "metadata": { - "id": "6kVSUa2Bcilf" - } - }, - { - "cell_type": "markdown", - "source": [ - "Sucinto!✨\n", - "\n", - "Características categóricas, como meses, são melhor representadas usando um gráfico de barras 📊. As camadas responsáveis por gráficos de barras são `geom_bar()` e `geom_col()`. Consulte `?geom_bar` para saber mais.\n", - "\n", - "Vamos criar um agora!\n" - ], - "metadata": { - "id": "Kds48GUBcj3W" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Find the average price of pumpkins per month then plot a bar chart\r\n", - "new_pumpkins %>%\r\n", - " group_by(Month) %>% \r\n", - " summarise(mean_price = mean(Price)) %>% \r\n", - " ggplot(aes(x = Month, y = mean_price)) +\r\n", - " geom_col(fill = \"midnightblue\", alpha = 0.7) +\r\n", - " ylab(\"Pumpkin Price\")" - ], - "outputs": [], - "metadata": { - "id": "VNbU1S3BcrxO" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤩🤩 Esta é uma visualização de dados mais útil! Parece indicar que o preço mais alto para abóboras ocorre em setembro e outubro. Isso atende às suas expectativas? Por que sim ou por que não?\n", - "\n", - "Parabéns por concluir a segunda lição 👏! Você preparou seus dados para a construção do modelo e, em seguida, descobriu mais insights usando visualizações!\n" - ], - "metadata": { - "id": "zDm0VOzzcuzR" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/2-Regression/2-Data/solution/notebook.ipynb b/translations/br/2-Regression/2-Data/solution/notebook.ipynb deleted file mode 100644 index cadd6f6b8..000000000 --- a/translations/br/2-Regression/2-Data/solution/notebook.ipynb +++ /dev/null @@ -1,437 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
70BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN9/24/1615.015.015.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
71BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN9/24/1618.018.018.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
72BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN10/1/1618.018.018.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
73BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN10/1/1617.017.017.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
74BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN10/8/1615.015.015.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade \\\n", - "70 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "71 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "72 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "73 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "74 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "\n", - " Date Low Price High Price Mostly Low ... Unit of Sale Quality \\\n", - "70 9/24/16 15.0 15.0 15.0 ... NaN NaN \n", - "71 9/24/16 18.0 18.0 18.0 ... NaN NaN \n", - "72 10/1/16 18.0 18.0 18.0 ... NaN NaN \n", - "73 10/1/16 17.0 17.0 17.0 ... NaN NaN \n", - "74 10/8/16 15.0 15.0 15.0 ... NaN NaN \n", - "\n", - " Condition Appearance Storage Crop Repack Trans Mode Unnamed: 24 \\\n", - "70 NaN NaN NaN NaN N NaN NaN \n", - "71 NaN NaN NaN NaN N NaN NaN \n", - "72 NaN NaN NaN NaN N NaN NaN \n", - "73 NaN NaN NaN NaN N NaN NaN \n", - "74 NaN NaN NaN NaN N NaN NaN \n", - "\n", - " Unnamed: 25 \n", - "70 NaN \n", - "71 NaN \n", - "72 NaN \n", - "73 NaN \n", - "74 NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 2, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "pumpkins = pd.read_csv('../../data/US-pumpkins.csv')\n", - "\n", - "pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)]\n", - "\n", - "pumpkins.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "City Name 0\n", - "Type 406\n", - "Package 0\n", - "Variety 0\n", - "Sub Variety 167\n", - "Grade 415\n", - "Date 0\n", - "Low Price 0\n", - "High Price 0\n", - "Mostly Low 24\n", - "Mostly High 24\n", - "Origin 0\n", - "Origin District 396\n", - "Item Size 114\n", - "Color 145\n", - "Environment 415\n", - "Unit of Sale 404\n", - "Quality 415\n", - "Condition 415\n", - "Appearance 415\n", - "Storage 415\n", - "Crop 415\n", - "Repack 0\n", - "Trans Mode 415\n", - "Unnamed: 24 415\n", - "Unnamed: 25 391\n", - "dtype: int64" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pumpkins.isnull().sum()" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - " Month Package Low Price High Price Price\n", - "70 9 1 1/9 bushel cartons 15.00 15.0 13.50\n", - "71 9 1 1/9 bushel cartons 18.00 18.0 16.20\n", - "72 10 1 1/9 bushel cartons 18.00 18.0 16.20\n", - "73 10 1 1/9 bushel cartons 17.00 17.0 15.30\n", - "74 10 1 1/9 bushel cartons 15.00 15.0 13.50\n", - "... ... ... ... ... ...\n", - "1738 9 1/2 bushel cartons 15.00 15.0 30.00\n", - "1739 9 1/2 bushel cartons 13.75 15.0 28.75\n", - "1740 9 1/2 bushel cartons 10.75 15.0 25.75\n", - "1741 9 1/2 bushel cartons 12.00 12.0 24.00\n", - "1742 9 1/2 bushel cartons 12.00 12.0 24.00\n", - "\n", - "[415 rows x 5 columns]\n" - ] - } - ], - "source": [ - "\n", - "# A set of new columns for a new dataframe. Filter out nonmatching columns\n", - "columns_to_select = ['Package', 'Low Price', 'High Price', 'Date']\n", - "pumpkins = pumpkins.loc[:, columns_to_select]\n", - "\n", - "# Get an average between low and high price for the base pumpkin price\n", - "price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2\n", - "\n", - "# Convert the date to its month only\n", - "month = pd.DatetimeIndex(pumpkins['Date']).month\n", - "\n", - "# Create a new dataframe with this basic data\n", - "new_pumpkins = pd.DataFrame({'Month': month, 'Package': pumpkins['Package'], 'Low Price': pumpkins['Low Price'],'High Price': pumpkins['High Price'], 'Price': price})\n", - "\n", - "# Convert the price if the Package contains fractional bushel values\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/(1 + 1/9)\n", - "\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price/(1/2)\n", - "\n", - "print(new_pumpkins)\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "\n", - "price = new_pumpkins.Price\n", - "month = new_pumpkins.Month\n", - "plt.scatter(price, month)\n", - "plt.show()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0, 0.5, 'Pumpkin Price')" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX4AAAEJCAYAAACT/UyFAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAAARAElEQVR4nO3de5AlZX3G8e8joKigiIwbVNYVQ6ErwcVaiRW0CgUNikEQKxFTijHJahlUSsvUqknE/LVE0KoYNVkDigloNCoQLt5AxUuCLrrhIhqUQgMiLBGE0goR+OWP0+sMszOzZ8ft0zO830/VqTndfc7phwae6XlPX1JVSJLa8aChA0iSJsvil6TGWPyS1BiLX5IaY/FLUmMsfklqzK5DBxjHPvvsU6tWrRo6hiQtK1dcccVtVTU1e/6yKP5Vq1axadOmoWNI0rKS5IdzzXeoR5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktSYZXECl3auVesvHDoCN2w4eugIUrMsfjXNX4JqkUM9ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqTG/Fn2S/JF9M8p0k1yR5Yzf/lCQ3JdncPV7YVwZJ0rZ27fGz7wHeXFXfSrIncEWSz3fL3lNVp/W4bknSPHor/qq6Gbi5e35XkmuBx/W1PknSePrc4/+VJKuAQ4DLgcOAk5K8EtjE6K+C2yeRQ9L8Vq2/cOgI3LDh6KEjNKH3L3eT7AF8Eji5qu4EPgA8CVjD6C+C0+d537okm5Js2rJlS98xJakZvRZ/kt0Ylf7ZVfUpgKq6parurar7gA8Ch8713qraWFVrq2rt1NRUnzElqSl9HtUT4Azg2qp694z5+8542XHA1X1lkCRtq88x/sOAVwBXJdnczXsbcEKSNUABNwCv6TGDJGmWPo/q+SqQORZd1Nc6F+IXV5I04pm7ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktQYi1+SGmPxS1JjLH5JakxvxZ9kvyRfTPKdJNckeWM3f+8kn09yXffzUX1lkCRtq889/nuAN1fVauCZwJ8lWQ2sBy6pqgOAS7ppSdKE9Fb8VXVzVX2re34XcC3wOODFwFndy84Cju0rgyRpWxMZ40+yCjgEuBxYUVU3d4t+AqyY5z3rkmxKsmnLli2TiClJTei9+JPsAXwSOLmq7py5rKoKqLneV1Ubq2ptVa2dmprqO6YkNWOs4k/y0CQH7uiHJ9mNUemfXVWf6mbfkmTfbvm+wK07+rmSpMXbbvEn+T1gM/CZbnpNkvPHeF+AM4Brq+rdMxadD5zYPT8ROG8HM0uSfg3j7PGfAhwK3AFQVZuBJ47xvsOAVwDPTbK5e7wQ2AA8L8l1wJHdtCRpQnYd4zW/rKqfjXbgf2XOcfn7vaDqq0DmWXzEGOuVJPVgnOK/JsnLgV2SHAC8Afh6v7EkSX0ZZ6jn9cBTgbuBc4CfASf3mEmS1KPt7vFX1S+At3cPSdIyN85RPZ9PsteM6Ucl+WyvqSRJvRlnqGefqrpj60RV3Q48prdEkqRejVP89yVZuXUiyRMY46geSdLSNM5RPW8Hvprky4wOz3w2sK7XVJKk3ozz5e5nkjyd0aWVYXTNndv6jSVJ6su8Qz1Jntz9fDqwEvhx91jZzZMkLUML7fG/idGQzulzLCvgub0kkiT1at7ir6p1SR4E/EVVfW2CmSRJPVrwqJ6qug/4uwllkSRNwDiHc16S5PjMukqbJGl5Gqf4XwN8Arg7yZ1J7kpy5/beJElamsY5nHPPSQSRJE3GQodzHpDkvCRXJzknyeMmGUyS1I+FhnrOBC4Ajge+Dbx3IokkSb1aaKhnz6r6YPf8XUm+NYlAkqR+LVT8uyc5hOnbJz505nRV+YtAkpahhYr/ZuDdM6Z/MmPaM3claZla6Mzd50wyiCRpMsY5jl+S9ABi8UtSYyx+SWrMOHfgojt56wkzX19Vl/UVSpLUn+0Wf5JTgT8AvgPc280uwOKXpGVonD3+Y4EDq+runrNIkiZgnOK/HtgN2KHiT3Im8CLg1qo6qJt3CvCnwJbuZW+rqot25HMlqW+r1l84dARu2HB0b589TvH/Atic5BJmlH9VvWE77/swo5u4fGTW/PdU1Wk7ElKStPOMU/znd48dUlWXJVm1w4kkSb0a53r8Z+3kdZ6U5JXAJuDNVXX7XC9Kso7Rzd5ZuXLlTo4gSe1a6Hr8H+9+XpXkytmPRa7vA8CTgDWMrgV0+nwvrKqNVbW2qtZOTU0tcnWSpNkW2uN/Y/fzRTtrZVV1y9bnST7I6Hr/kqQJmnePv6pu7p6urqofznwAL1jMypLsO2PyOODqxXyOJGnxxvly9y+T3F1VlwIk+XPgOcDfL/SmJB8FDgf2SXIj8A7g8CRrGJ0AdgOjG7lLkiZonOI/BrggyVuAo4AnAy/e3puq6oQ5Zp+xY/EkSTvbOEf13JbkGOALwBXAS6uqek8mSerFvMWf5C5GQzJbPRjYH3hpkqqqR/QdTpK08y10B649JxlEkjQZ416W+SXAsxj9BfCVqjq3z1CSpP5s90YsSd4PvBa4itHhl69N8r6+g0mS+jHOHv9zgads/UI3yVnANb2mkiT1ZpxbL34fmHmxnP26eZKkZWicPf49gWuTfKObfgawKcn5AFV1TF/hJEk73zjF/1e9p5AkTcw4J3B9GSDJI7j/zdZ/2mMuSVJPxrnZ+jrgr4H/Be4Dwuiwzv37jSZJ6sM4Qz1vAQ6qqtv6DiNJ6t84R/X8gNF9dyVJDwDj7PG/Ffh6ksvZsZutS5KWoHGK/x+ASxmduXtfv3EkSX0bp/h3q6o39Z5EkjQR44zxX5xkXZJ9k+y99dF7MklSL8bZ4996J623zpjn4ZyStEyNcwLXEycRRJI0GeOcwPXKueZX1Ud2fhxJUt/GGep5xoznuwNHAN8CLH5JWobGGep5/czpJHsBH+srkCSpX+Mc1TPbzwHH/SVpmRpnjP/fGB3FA6NfFKuBj/cZSpLUn3HG+E+b8fwe4IdVdWNPeSRJPZu3+JPszugm67/J6HINZ1TVPZMKJknqx0Jj/GcBaxmV/guA0yeSSJLUq4WGelZX1W8BJDkD+MYCr91GkjOBFwG3VtVB3by9gX8BVgE3AL9fVbfveGxJ0mIttMf/y61PFjnE82HgqFnz1gOXVNUBwCXdtCRpghYq/qclubN73AUcvPV5kju398FVdRkw+768L2Y0hET389jFhJYkLd68Qz1VtUsP61tRVTd3z38CrOhhHZKkBSzmBK6doqqK6fMDttFdCnpTkk1btmyZYDJJemCbdPHfkmRfgO7nrfO9sKo2VtXaqlo7NTU1sYCS9EA36eI/Hzixe34icN6E1y9Jzeut+JN8FPh34MAkNyb5Y2AD8Lwk1wFHdtOSpAka55INi1JVJ8yz6Ii+1ilJ2r7BvtyVJA3D4pekxlj8ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktSYXYdYaZIbgLuAe4F7qmrtEDkkqUWDFH/nOVV124Drl6QmOdQjSY0ZqvgL+FySK5KsGyiDJDVpqKGeZ1XVTUkeA3w+yXer6rKZL+h+IawDWLly5RAZJekBaZA9/qq6qft5K/Bp4NA5XrOxqtZW1dqpqalJR5SkB6yJF3+ShyfZc+tz4PnA1ZPOIUmtGmKoZwXw6SRb139OVX1mgByS1KSJF39VXQ88bdLrlSSNeDinJDXG4pekxlj8ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktQYi1+SGjNI8Sc5Ksn3knw/yfohMkhSqyZe/El2Ad4HvABYDZyQZPWkc0hSq4bY4z8U+H5VXV9V/wd8DHjxADkkqUmpqsmuMHkpcFRV/Uk3/Qrgt6vqpFmvWwes6yYPBL430aDb2ge4beAMS4XbYprbYprbYtpS2RZPqKqp2TN3HSLJOKpqI7Bx6BxbJdlUVWuHzrEUuC2muS2muS2mLfVtMcRQz03AfjOmH9/NkyRNwBDF/03ggCRPTPJg4GXA+QPkkKQmTXyop6ruSXIS8FlgF+DMqrpm0jkWYckMOy0BbotpbotpbotpS3pbTPzLXUnSsDxzV5IaY/FLUmMsfklqzJI9jn9IM442+nFVfSHJy4HfAa4FNlbVLwcNOGFJ9gdewugw3HuB/wLOqao7Bw0maVH8cncOSc5m9EvxYcAdwB7Ap4AjGG2zE4dLN1lJ3gC8CLgMeCHwbUbb5DjgdVX1pcHCSVoUi38OSa6sqoOT7Mro5LLHVtW9SQL8Z1UdPHDEiUlyFbCm++d/GHBRVR2eZCVwXlUdMnDEiUnySOCtwLHAY4ACbgXOAzZU1R2DhVtCklxcVS8YOsekJHkEo/8uHg9cXFXnzFj2/qp63WDh5uFQz9we1A33PJzRXv8jgZ8CDwF2GzLYQHZlNMTzEEZ//VBVP0rS2rb4OHApcHhV/QQgyW8AJ3bLnj9gtolK8vT5FgFrJhhlKfgQcB3wSeDVSY4HXl5VdwPPHDTZPCz+uZ0BfJfRCWZvBz6R5HpG/xI/NmSwAfwj8M0klwPPBk4FSDLF6JdhS1ZV1akzZ3S/AE5N8uqBMg3lm8CXGRX9bHtNNsrgnlRVx3fPz03yduDSJMcMGWohDvXMI8ljAarqx0n2Ao4EflRV3xg02ACSPBV4CnB1VX136DxDSfI54AvAWVV1SzdvBfAq4HlVdeSA8SYqydXAcVV13RzL/ruq9pvjbQ9ISa4FnlpV982Y9yrgLcAeVfWEobLNx+KXxpTkUcB6RvePeEw3+xZG15raUFW3D5Vt0rrLq19VVdtcLj3JsVV17uRTDSPJ3wCfq6ovzJp/FPDeqjpgmGTzs/ilnSDJH1XVh4bOsRS4LaYt1W1h8Us7QZIfVdXKoXMsBW6LaUt1W/jlrjSmJFfOtwhYMcksQ3NbTFuO28Lil8a3AvhdYPZYfoCvTz7OoNwW05bdtrD4pfFdwOgojc2zFyT50sTTDMttMW3ZbQvH+CWpMV6dU5IaY/FLUmMsfglIUkn+ecb0rkm2JLlgkZ+3V5LXzZg+fLGfJe1sFr808nPgoCQP7aafx+jKrIu1F7DkrsoogcUvzXQRcHT3/ATgo1sXJNk7yblJrkzyH0kO7uafkuTMJF9Kcn13/wKADcCTkmxO8q5u3h5J/jXJd5Oc3V3mW5o4i1+a9jHgZUl2Bw4GLp+x7J3At7t7MbwN+MiMZU9mdBz3ocA7ustVrwd+UFVrquot3esOAU4GVgP7A4f1+M8izcvilzpVdSWwitHe/kWzFj8L+KfudZcCj+5uwAFwYVXdXVW3Mboxy3xna36jqm7sruK4uVuXNHGewCXd3/nAacDhwKPHfM/dM57fy/z/X437OqlX7vFL93cm8M6qumrW/K8AfwijI3SA27Zzs/m7gD37CCj9utzjkGaoqhuBv51j0SnAmd0FuX7B6HaLC33O/yT5WnfDkouBC3d2VmmxvGSDJDXGoR5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSY/4fZDFW+b6+4WkAAAAASUVORK5CYII=", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "\n", - "new_pumpkins.groupby(['Month'])['Price'].mean().plot(kind='bar')\n", - "plt.ylabel(\"Pumpkin Price\")" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6" - }, - "kernelspec": { - "display_name": "Python 3.7.0 64-bit ('3.7')", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.1" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "95726f0b8283628d5356a4f8eb8b4b76", - "translation_date": "2025-08-29T23:11:00+00:00", - "source_file": "2-Regression/2-Data/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/2-Regression/3-Linear/README.md b/translations/br/2-Regression/3-Linear/README.md deleted file mode 100644 index 657351fbb..000000000 --- a/translations/br/2-Regression/3-Linear/README.md +++ /dev/null @@ -1,380 +0,0 @@ - -# Construir um modelo de regressão usando Scikit-learn: regressão de quatro maneiras - -![Infográfico de regressão linear vs polinomial](../../../../2-Regression/3-Linear/images/linear-polynomial.png) -> Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/3-Linear/solution/R/lesson_3.html) -### Introdução - -Até agora, você explorou o que é regressão com dados de exemplo coletados do conjunto de dados de preços de abóbora que usaremos ao longo desta lição. Você também os visualizou usando Matplotlib. - -Agora você está pronto para mergulhar mais fundo na regressão para aprendizado de máquina. Embora a visualização permita que você compreenda os dados, o verdadeiro poder do aprendizado de máquina vem do _treinamento de modelos_. Modelos são treinados com dados históricos para capturar automaticamente as dependências dos dados e permitem prever resultados para novos dados que o modelo ainda não viu. - -Nesta lição, você aprenderá mais sobre dois tipos de regressão: _regressão linear básica_ e _regressão polinomial_, juntamente com algumas das matemáticas subjacentes a essas técnicas. Esses modelos nos permitirão prever os preços das abóboras dependendo de diferentes dados de entrada. - -[![ML para iniciantes - Entendendo a Regressão Linear](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "ML para iniciantes - Entendendo a Regressão Linear") - -> 🎥 Clique na imagem acima para um breve vídeo sobre regressão linear. - -> Ao longo deste currículo, assumimos conhecimento mínimo de matemática e buscamos torná-lo acessível para estudantes de outras áreas. Fique atento a notas, 🧮 chamadas, diagramas e outras ferramentas de aprendizado para ajudar na compreensão. - -### Pré-requisito - -Você já deve estar familiarizado com a estrutura dos dados de abóbora que estamos analisando. Você pode encontrá-los pré-carregados e pré-limpos no arquivo _notebook.ipynb_ desta lição. No arquivo, o preço da abóbora é exibido por alqueire em um novo data frame. Certifique-se de que pode executar esses notebooks em kernels no Visual Studio Code. - -### Preparação - -Como lembrete, você está carregando esses dados para fazer perguntas sobre eles. - -- Qual é o melhor momento para comprar abóboras? -- Qual preço posso esperar por uma caixa de abóboras em miniatura? -- Devo comprá-las em cestas de meio alqueire ou em caixas de 1 1/9 alqueire? -Vamos continuar explorando esses dados. - -Na lição anterior, você criou um data frame do Pandas e o preencheu com parte do conjunto de dados original, padronizando os preços por alqueire. Ao fazer isso, no entanto, você só conseguiu reunir cerca de 400 pontos de dados e apenas para os meses de outono. - -Dê uma olhada nos dados que pré-carregamos no notebook que acompanha esta lição. Os dados estão pré-carregados e um gráfico de dispersão inicial é traçado para mostrar os dados por mês. Talvez possamos obter um pouco mais de detalhes sobre a natureza dos dados ao limpá-los mais. - -## Uma linha de regressão linear - -Como você aprendeu na Lição 1, o objetivo de um exercício de regressão linear é ser capaz de traçar uma linha para: - -- **Mostrar relações entre variáveis**. Mostrar a relação entre variáveis -- **Fazer previsões**. Fazer previsões precisas sobre onde um novo ponto de dados cairia em relação a essa linha. - -É típico da **Regressão de Mínimos Quadrados** traçar esse tipo de linha. O termo 'mínimos quadrados' significa que todos os pontos de dados ao redor da linha de regressão são elevados ao quadrado e depois somados. Idealmente, essa soma final é o menor possível, porque queremos um número baixo de erros, ou `mínimos quadrados`. - -Fazemos isso porque queremos modelar uma linha que tenha a menor distância cumulativa de todos os nossos pontos de dados. Também elevamos os termos ao quadrado antes de somá-los, pois estamos preocupados com sua magnitude, em vez de sua direção. - -> **🧮 Mostre-me a matemática** -> -> Esta linha, chamada de _linha de melhor ajuste_, pode ser expressa por [uma equação](https://en.wikipedia.org/wiki/Simple_linear_regression): -> -> ``` -> Y = a + bX -> ``` -> -> `X` é a 'variável explicativa'. `Y` é a 'variável dependente'. A inclinação da linha é `b` e `a` é o intercepto no eixo Y, que se refere ao valor de `Y` quando `X = 0`. -> ->![calcular a inclinação](../../../../2-Regression/3-Linear/images/slope.png) -> -> Primeiro, calcule a inclinação `b`. Infográfico por [Jen Looper](https://twitter.com/jenlooper) -> -> Em outras palavras, e referindo-se à pergunta original dos dados de abóbora: "prever o preço de uma abóbora por alqueire por mês", `X` se referiria ao preço e `Y` ao mês de venda. -> ->![completar a equação](../../../../2-Regression/3-Linear/images/calculation.png) -> -> Calcule o valor de Y. Se você está pagando cerca de $4, deve ser abril! Infográfico por [Jen Looper](https://twitter.com/jenlooper) -> -> A matemática que calcula a linha deve demonstrar a inclinação da linha, que também depende do intercepto, ou onde `Y` está situado quando `X = 0`. -> -> Você pode observar o método de cálculo desses valores no site [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Também visite [este calculador de mínimos quadrados](https://www.mathsisfun.com/data/least-squares-calculator.html) para ver como os valores dos números impactam a linha. - -## Correlação - -Outro termo importante para entender é o **Coeficiente de Correlação** entre as variáveis X e Y fornecidas. Usando um gráfico de dispersão, você pode visualizar rapidamente esse coeficiente. Um gráfico com pontos de dados espalhados em uma linha ordenada tem alta correlação, mas um gráfico com pontos de dados espalhados por toda parte entre X e Y tem baixa correlação. - -Um bom modelo de regressão linear será aquele que tem um Coeficiente de Correlação alto (mais próximo de 1 do que de 0) usando o método de Mínimos Quadrados com uma linha de regressão. - -✅ Execute o notebook que acompanha esta lição e observe o gráfico de dispersão de Mês para Preço. Os dados que associam Mês ao Preço para vendas de abóbora parecem ter alta ou baixa correlação, de acordo com sua interpretação visual do gráfico de dispersão? Isso muda se você usar uma medida mais detalhada em vez de `Mês`, como *dia do ano* (ou seja, número de dias desde o início do ano)? - -No código abaixo, assumiremos que limpamos os dados e obtivemos um data frame chamado `new_pumpkins`, semelhante ao seguinte: - -ID | Mês | DiaDoAno | Variedade | Cidade | Embalagem | Preço Baixo | Preço Alto | Preço ----|-----|----------|-----------|--------|-----------|-------------|------------|------- -70 | 9 | 267 | TIPO TORTA | BALTIMORE | 1 1/9 caixas de alqueire | 15.0 | 15.0 | 13.636364 -71 | 9 | 267 | TIPO TORTA | BALTIMORE | 1 1/9 caixas de alqueire | 18.0 | 18.0 | 16.363636 -72 | 10 | 274 | TIPO TORTA | BALTIMORE | 1 1/9 caixas de alqueire | 18.0 | 18.0 | 16.363636 -73 | 10 | 274 | TIPO TORTA | BALTIMORE | 1 1/9 caixas de alqueire | 17.0 | 17.0 | 15.454545 -74 | 10 | 281 | TIPO TORTA | BALTIMORE | 1 1/9 caixas de alqueire | 15.0 | 15.0 | 13.636364 - -> O código para limpar os dados está disponível em [`notebook.ipynb`](../../../../2-Regression/3-Linear/notebook.ipynb). Realizamos os mesmos passos de limpeza da lição anterior e calculamos a coluna `DiaDoAno` usando a seguinte expressão: - -```python -day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days) -``` - -Agora que você entende a matemática por trás da regressão linear, vamos criar um modelo de regressão para ver se conseguimos prever qual embalagem de abóboras terá os melhores preços. Alguém comprando abóboras para um campo de abóboras de feriado pode querer essa informação para otimizar suas compras de embalagens de abóboras para o campo. - -## Procurando por Correlação - -[![ML para iniciantes - Procurando por Correlação: A Chave para Regressão Linear](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML para iniciantes - Procurando por Correlação: A Chave para Regressão Linear") - -> 🎥 Clique na imagem acima para um breve vídeo sobre correlação. - -Na lição anterior, você provavelmente viu que o preço médio para diferentes meses se parece com isto: - -Preço médio por mês - -Isso sugere que deve haver alguma correlação, e podemos tentar treinar um modelo de regressão linear para prever a relação entre `Mês` e `Preço`, ou entre `DiaDoAno` e `Preço`. Aqui está o gráfico de dispersão que mostra a última relação: - -Gráfico de dispersão de Preço vs. Dia do Ano - -Vamos ver se há correlação usando a função `corr`: - -```python -print(new_pumpkins['Month'].corr(new_pumpkins['Price'])) -print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price'])) -``` - -Parece que a correlação é bem pequena, -0.15 por `Mês` e -0.17 por `DiaDoAno`, mas pode haver outra relação importante. Parece que há diferentes agrupamentos de preços correspondendo a diferentes variedades de abóbora. Para confirmar essa hipótese, vamos plotar cada categoria de abóbora usando uma cor diferente. Passando um parâmetro `ax` para a função de plotagem `scatter`, podemos plotar todos os pontos no mesmo gráfico: - -```python -ax=None -colors = ['red','blue','green','yellow'] -for i,var in enumerate(new_pumpkins['Variety'].unique()): - df = new_pumpkins[new_pumpkins['Variety']==var] - ax = df.plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var) -``` - -Gráfico de dispersão de Preço vs. Dia do Ano - -Nossa investigação sugere que a variedade tem mais efeito no preço geral do que a data de venda. Podemos ver isso com um gráfico de barras: - -```python -new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar') -``` - -Gráfico de barras de preço vs variedade - -Vamos focar por enquanto apenas em uma variedade de abóbora, o 'tipo torta', e ver qual efeito a data tem no preço: - -```python -pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE'] -pie_pumpkins.plot.scatter('DayOfYear','Price') -``` -Gráfico de dispersão de Preço vs. Dia do Ano - -Se agora calcularmos a correlação entre `Preço` e `DiaDoAno` usando a função `corr`, obteremos algo como `-0.27` - o que significa que treinar um modelo preditivo faz sentido. - -> Antes de treinar um modelo de regressão linear, é importante garantir que nossos dados estejam limpos. A regressão linear não funciona bem com valores ausentes, portanto, faz sentido eliminar todas as células vazias: - -```python -pie_pumpkins.dropna(inplace=True) -pie_pumpkins.info() -``` - -Outra abordagem seria preencher esses valores vazios com valores médios da coluna correspondente. - -## Regressão Linear Simples - -[![ML para iniciantes - Regressão Linear e Polinomial usando Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "ML para iniciantes - Regressão Linear e Polinomial usando Scikit-learn") - -> 🎥 Clique na imagem acima para um breve vídeo sobre regressão linear e polinomial. - -Para treinar nosso modelo de regressão linear, usaremos a biblioteca **Scikit-learn**. - -```python -from sklearn.linear_model import LinearRegression -from sklearn.metrics import mean_squared_error -from sklearn.model_selection import train_test_split -``` - -Começamos separando os valores de entrada (features) e a saída esperada (label) em arrays numpy separados: - -```python -X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1) -y = pie_pumpkins['Price'] -``` - -> Note que tivemos que realizar `reshape` nos dados de entrada para que o pacote de regressão linear os entendesse corretamente. A regressão linear espera um array 2D como entrada, onde cada linha do array corresponde a um vetor de características de entrada. No nosso caso, como temos apenas uma entrada, precisamos de um array com formato N×1, onde N é o tamanho do conjunto de dados. - -Depois, precisamos dividir os dados em conjuntos de treino e teste, para que possamos validar nosso modelo após o treinamento: - -```python -X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) -``` - -Finalmente, treinar o modelo de regressão linear real leva apenas duas linhas de código. Definimos o objeto `LinearRegression` e ajustamos aos nossos dados usando o método `fit`: - -```python -lin_reg = LinearRegression() -lin_reg.fit(X_train,y_train) -``` - -O objeto `LinearRegression` após o ajuste (`fit`) contém todos os coeficientes da regressão, que podem ser acessados usando a propriedade `.coef_`. No nosso caso, há apenas um coeficiente, que deve ser em torno de `-0.017`. Isso significa que os preços parecem cair um pouco com o tempo, mas não muito, cerca de 2 centavos por dia. Também podemos acessar o ponto de interseção da regressão com o eixo Y usando `lin_reg.intercept_` - será em torno de `21` no nosso caso, indicando o preço no início do ano. - -Para ver quão preciso nosso modelo é, podemos prever preços em um conjunto de dados de teste e, em seguida, medir quão próximas nossas previsões estão dos valores esperados. Isso pode ser feito usando a métrica de erro quadrático médio (MSE), que é a média de todas as diferenças quadradas entre o valor esperado e o valor previsto. - -```python -pred = lin_reg.predict(X_test) - -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') -``` -Nosso erro parece estar em torno de 2 pontos, o que equivale a ~17%. Não é muito bom. Outro indicador da qualidade do modelo é o **coeficiente de determinação**, que pode ser obtido assim: - -```python -score = lin_reg.score(X_train,y_train) -print('Model determination: ', score) -``` -Se o valor for 0, significa que o modelo não leva os dados de entrada em consideração e age como o *pior preditor linear*, que é simplesmente o valor médio do resultado. O valor 1 significa que podemos prever perfeitamente todos os resultados esperados. No nosso caso, o coeficiente está em torno de 0,06, o que é bastante baixo. - -Também podemos plotar os dados de teste junto com a linha de regressão para entender melhor como a regressão funciona no nosso caso: - -```python -plt.scatter(X_test,y_test) -plt.plot(X_test,pred) -``` - -Regressão linear - -## Regressão Polinomial - -Outro tipo de Regressão Linear é a Regressão Polinomial. Embora às vezes haja uma relação linear entre as variáveis - quanto maior o volume da abóbora, maior o preço - às vezes essas relações não podem ser representadas como um plano ou linha reta. - -✅ Aqui estão [alguns exemplos](https://online.stat.psu.edu/stat501/lesson/9/9.8) de dados que poderiam usar Regressão Polinomial. - -Observe novamente a relação entre Data e Preço. Esse gráfico de dispersão parece que deveria ser analisado necessariamente por uma linha reta? Os preços não podem flutuar? Nesse caso, você pode tentar a regressão polinomial. - -✅ Polinômios são expressões matemáticas que podem consistir em uma ou mais variáveis e coeficientes. - -A regressão polinomial cria uma linha curva para ajustar melhor os dados não lineares. No nosso caso, se incluirmos uma variável `DayOfYear` ao quadrado nos dados de entrada, devemos ser capazes de ajustar nossos dados com uma curva parabólica, que terá um mínimo em um determinado ponto do ano. - -O Scikit-learn inclui uma [API de pipeline](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) útil para combinar diferentes etapas de processamento de dados. Um **pipeline** é uma cadeia de **estimadores**. No nosso caso, criaremos um pipeline que primeiro adiciona características polinomiais ao nosso modelo e, em seguida, treina a regressão: - -```python -from sklearn.preprocessing import PolynomialFeatures -from sklearn.pipeline import make_pipeline - -pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) - -pipeline.fit(X_train,y_train) -``` - -Usar `PolynomialFeatures(2)` significa que incluiremos todos os polinômios de segundo grau dos dados de entrada. No nosso caso, isso significará apenas `DayOfYear`2, mas, dado duas variáveis de entrada X e Y, isso adicionará X2, XY e Y2. Também podemos usar polinômios de grau superior, se quisermos. - -Os pipelines podem ser usados da mesma maneira que o objeto original `LinearRegression`, ou seja, podemos usar `fit` no pipeline e, em seguida, usar `predict` para obter os resultados da previsão. Aqui está o gráfico mostrando os dados de teste e a curva de aproximação: - -Regressão polinomial - -Usando Regressão Polinomial, podemos obter um MSE ligeiramente menor e um coeficiente de determinação maior, mas não significativamente. Precisamos levar em conta outras características! - -> Você pode ver que os preços mínimos das abóboras são observados em algum momento próximo ao Halloween. Como você explicaria isso? - -🎃 Parabéns, você acabou de criar um modelo que pode ajudar a prever o preço das abóboras para torta. Você provavelmente pode repetir o mesmo procedimento para todos os tipos de abóbora, mas isso seria tedioso. Vamos aprender agora como levar em conta a variedade de abóbora no nosso modelo! - -## Características Categóricas - -No mundo ideal, queremos ser capazes de prever preços para diferentes variedades de abóbora usando o mesmo modelo. No entanto, a coluna `Variety` é um pouco diferente de colunas como `Month`, porque contém valores não numéricos. Essas colunas são chamadas de **categóricas**. - -[![ML para iniciantes - Previsões com características categóricas usando Regressão Linear](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML para iniciantes - Previsões com características categóricas usando Regressão Linear") - -> 🎥 Clique na imagem acima para um breve vídeo sobre o uso de características categóricas. - -Aqui você pode ver como o preço médio depende da variedade: - -Preço médio por variedade - -Para levar a variedade em conta, primeiro precisamos convertê-la para forma numérica, ou **codificá-la**. Existem várias maneiras de fazer isso: - -* A **codificação numérica simples** criará uma tabela de diferentes variedades e, em seguida, substituirá o nome da variedade por um índice nessa tabela. Essa não é a melhor ideia para regressão linear, porque a regressão linear leva o valor numérico real do índice e o adiciona ao resultado, multiplicando por algum coeficiente. No nosso caso, a relação entre o número do índice e o preço é claramente não linear, mesmo que garantamos que os índices sejam ordenados de alguma forma específica. -* A **codificação one-hot** substituirá a coluna `Variety` por 4 colunas diferentes, uma para cada variedade. Cada coluna conterá `1` se a linha correspondente for de uma determinada variedade e `0` caso contrário. Isso significa que haverá quatro coeficientes na regressão linear, um para cada variedade de abóbora, responsável pelo "preço inicial" (ou melhor, "preço adicional") para aquela variedade específica. - -O código abaixo mostra como podemos codificar uma variedade usando one-hot: - -```python -pd.get_dummies(new_pumpkins['Variety']) -``` - - ID | FAIRYTALE | MINIATURE | MIXED HEIRLOOM VARIETIES | PIE TYPE -----|-----------|-----------|--------------------------|---------- -70 | 0 | 0 | 0 | 1 -71 | 0 | 0 | 0 | 1 -... | ... | ... | ... | ... -1738 | 0 | 1 | 0 | 0 -1739 | 0 | 1 | 0 | 0 -1740 | 0 | 1 | 0 | 0 -1741 | 0 | 1 | 0 | 0 -1742 | 0 | 1 | 0 | 0 - -Para treinar a regressão linear usando a variedade codificada como one-hot nos dados de entrada, só precisamos inicializar os dados `X` e `y` corretamente: - -```python -X = pd.get_dummies(new_pumpkins['Variety']) -y = new_pumpkins['Price'] -``` - -O restante do código é o mesmo que usamos acima para treinar a Regressão Linear. Se você tentar, verá que o erro médio quadrático é aproximadamente o mesmo, mas obtemos um coeficiente de determinação muito maior (~77%). Para obter previsões ainda mais precisas, podemos levar em conta mais características categóricas, bem como características numéricas, como `Month` ou `DayOfYear`. Para obter um grande array de características, podemos usar `join`: - -```python -X = pd.get_dummies(new_pumpkins['Variety']) \ - .join(new_pumpkins['Month']) \ - .join(pd.get_dummies(new_pumpkins['City'])) \ - .join(pd.get_dummies(new_pumpkins['Package'])) -y = new_pumpkins['Price'] -``` - -Aqui também levamos em conta `City` e o tipo de `Package`, o que nos dá um MSE de 2.84 (10%) e um coeficiente de determinação de 0.94! - -## Juntando tudo - -Para criar o melhor modelo, podemos usar dados combinados (categóricos codificados como one-hot + numéricos) do exemplo acima junto com a Regressão Polinomial. Aqui está o código completo para sua conveniência: - -```python -# set up training data -X = pd.get_dummies(new_pumpkins['Variety']) \ - .join(new_pumpkins['Month']) \ - .join(pd.get_dummies(new_pumpkins['City'])) \ - .join(pd.get_dummies(new_pumpkins['Package'])) -y = new_pumpkins['Price'] - -# make train-test split -X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) - -# setup and train the pipeline -pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) -pipeline.fit(X_train,y_train) - -# predict results for test data -pred = pipeline.predict(X_test) - -# calculate MSE and determination -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') - -score = pipeline.score(X_train,y_train) -print('Model determination: ', score) -``` - -Isso deve nos dar o melhor coeficiente de determinação de quase 97% e MSE=2.23 (~8% de erro de previsão). - -| Modelo | MSE | Determinação | -|--------|-----|--------------| -| `DayOfYear` Linear | 2.77 (17.2%) | 0.07 | -| `DayOfYear` Polinomial | 2.73 (17.0%) | 0.08 | -| `Variety` Linear | 5.24 (19.7%) | 0.77 | -| Todas as características Linear | 2.84 (10.5%) | 0.94 | -| Todas as características Polinomial | 2.23 (8.25%) | 0.97 | - -🏆 Muito bem! Você criou quatro modelos de Regressão em uma única lição e melhorou a qualidade do modelo para 97%. Na seção final sobre Regressão, você aprenderá sobre Regressão Logística para determinar categorias. - ---- -## 🚀Desafio - -Teste várias variáveis diferentes neste notebook para ver como a correlação corresponde à precisão do modelo. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Nesta lição, aprendemos sobre Regressão Linear. Existem outros tipos importantes de Regressão. Leia sobre as técnicas Stepwise, Ridge, Lasso e Elasticnet. Um bom curso para aprender mais é o [curso de Aprendizado Estatístico de Stanford](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning). - -## Tarefa - -[Construa um Modelo](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/3-Linear/assignment.md b/translations/br/2-Regression/3-Linear/assignment.md deleted file mode 100644 index 280ab1ad4..000000000 --- a/translations/br/2-Regression/3-Linear/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Criar um Modelo de Regressão - -## Instruções - -Nesta lição, você aprendeu como construir um modelo usando Regressão Linear e Polinomial. Usando esse conhecimento, encontre um conjunto de dados ou utilize um dos conjuntos integrados do Scikit-learn para criar um novo modelo. Explique em seu notebook por que escolheu a técnica utilizada e demonstre a precisão do seu modelo. Se ele não for preciso, explique o motivo. - -## Rubrica - -| Critério | Exemplary | Adequate | Needs Improvement | -| -------- | ------------------------------------------------------------ | -------------------------- | ------------------------------- | -| | apresenta um notebook completo com uma solução bem documentada | a solução está incompleta | a solução apresenta falhas ou bugs | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/3-Linear/notebook.ipynb b/translations/br/2-Regression/3-Linear/notebook.ipynb deleted file mode 100644 index 08c033497..000000000 --- a/translations/br/2-Regression/3-Linear/notebook.ipynb +++ /dev/null @@ -1,128 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Preços de Abóboras\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados em um dataframe contendo um subconjunto dos dados:\n", - "\n", - "- Considere apenas abóboras com preços por alqueire\n", - "- Converta a data para o formato de mês\n", - "- Calcule o preço como a média entre os preços mais altos e mais baixos\n", - "- Converta o preço para refletir a precificação pela quantidade em alqueires\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "from datetime import datetime\n", - "\n", - "pumpkins = pd.read_csv('../data/US-pumpkins.csv')\n", - "\n", - "pumpkins.head()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)]\n", - "\n", - "columns_to_select = ['Package', 'Variety', 'City Name', 'Low Price', 'High Price', 'Date']\n", - "pumpkins = pumpkins.loc[:, columns_to_select]\n", - "\n", - "price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2\n", - "\n", - "month = pd.DatetimeIndex(pumpkins['Date']).month\n", - "day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days)\n", - "\n", - "new_pumpkins = pd.DataFrame(\n", - " {'Month': month, \n", - " 'DayOfYear' : day_of_year, \n", - " 'Variety': pumpkins['Variety'], \n", - " 'City': pumpkins['City Name'], \n", - " 'Package': pumpkins['Package'], \n", - " 'Low Price': pumpkins['Low Price'],\n", - " 'High Price': pumpkins['High Price'], \n", - " 'Price': price})\n", - "\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/1.1\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price*2\n", - "\n", - "new_pumpkins.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Um gráfico de dispersão básico nos lembra que temos dados mensais apenas de agosto a dezembro. Provavelmente precisamos de mais dados para poder tirar conclusões de forma linear.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "plt.scatter('Month','Price',data=new_pumpkins)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "\n", - "plt.scatter('DayOfYear','Price',data=new_pumpkins)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.3-final" - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "b032d371c75279373507f003439a577e", - "translation_date": "2025-08-29T22:45:29+00:00", - "source_file": "2-Regression/3-Linear/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/2-Regression/3-Linear/solution/Julia/README.md b/translations/br/2-Regression/3-Linear/solution/Julia/README.md deleted file mode 100644 index b5983557a..000000000 --- a/translations/br/2-Regression/3-Linear/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/3-Linear/solution/R/lesson_3-R.ipynb b/translations/br/2-Regression/3-Linear/solution/R/lesson_3-R.ipynb deleted file mode 100644 index 01d25ab1a..000000000 --- a/translations/br/2-Regression/3-Linear/solution/R/lesson_3-R.ipynb +++ /dev/null @@ -1,1084 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_3-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "5015d65d61ba75a223bfc56c273aa174", - "translation_date": "2025-08-29T22:55:39+00:00", - "source_file": "2-Regression/3-Linear/solution/R/lesson_3-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "EgQw8osnsUV-" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Regressão Linear e Polinomial para Precificação de Abóboras - Aula 3\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "#### Introdução\n", - "\n", - "Até agora, você explorou o que é regressão com dados de exemplo coletados do conjunto de dados de precificação de abóboras que usaremos ao longo desta aula. Você também os visualizou usando `ggplot2`. 💪\n", - "\n", - "Agora você está pronto para se aprofundar na regressão para aprendizado de máquina. Nesta aula, você aprenderá mais sobre dois tipos de regressão: *regressão linear básica* e *regressão polinomial*, junto com parte da matemática por trás dessas técnicas.\n", - "\n", - "> Ao longo deste currículo, assumimos conhecimento mínimo de matemática e buscamos torná-la acessível para estudantes de outras áreas. Fique atento a notas, 🧮 destaques, diagramas e outras ferramentas de aprendizado para ajudar na compreensão.\n", - "\n", - "#### Preparação\n", - "\n", - "Como lembrete, você está carregando esses dados para fazer perguntas sobre eles.\n", - "\n", - "- Qual é o melhor momento para comprar abóboras?\n", - "\n", - "- Qual preço posso esperar por uma caixa de abóboras em miniatura?\n", - "\n", - "- Devo comprá-las em cestas de meio alqueire ou em caixas de 1 1/9 alqueire? Vamos continuar explorando esses dados.\n", - "\n", - "Na aula anterior, você criou um `tibble` (uma reinterpretação moderna do data frame) e o preencheu com parte do conjunto de dados original, padronizando os preços por alqueire. Ao fazer isso, no entanto, você conseguiu reunir apenas cerca de 400 pontos de dados e apenas para os meses de outono. Talvez possamos obter um pouco mais de detalhes sobre a natureza dos dados ao limpá-los mais? Vamos descobrir... 🕵️‍♀️\n", - "\n", - "Para esta tarefa, precisaremos dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [estrutura de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizado de máquina.\n", - "\n", - "- `janitor`: O [pacote janitor](https://github.com/sfirke/janitor) fornece ferramentas simples para examinar e limpar dados sujos.\n", - "\n", - "- `corrplot`: O [pacote corrplot](https://cran.r-project.org/web/packages/corrplot/vignettes/corrplot-intro.html) oferece uma ferramenta visual exploratória para matrizes de correlação que suporta o reordenamento automático de variáveis para ajudar a detectar padrões ocultos entre elas.\n", - "\n", - "Você pode instalá-los com:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"janitor\", \"corrplot\"))`\n", - "\n", - "O script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala para você caso estejam ausentes.\n" - ], - "metadata": { - "id": "WqQPS1OAsg3H" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if (!require(\"pacman\")) install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load(tidyverse, tidymodels, janitor, corrplot)" - ], - "outputs": [], - "metadata": { - "id": "tA4C2WN3skCf", - "colab": { - "base_uri": "https://localhost:8080/" - }, - "outputId": "c06cd805-5534-4edc-f72b-d0d1dab96ac0" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos carregar esses pacotes incríveis e torná-los disponíveis na nossa sessão atual do R. (Isso é apenas para ilustração, `pacman::p_load()` já fez isso por você)\n", - "\n", - "## 1. Uma linha de regressão linear\n", - "\n", - "Como você aprendeu na Aula 1, o objetivo de um exercício de regressão linear é ser capaz de traçar uma *linha* *de* *melhor ajuste* para:\n", - "\n", - "- **Mostrar relações entre variáveis**. Demonstrar a relação entre as variáveis.\n", - "\n", - "- **Fazer previsões**. Fazer previsões precisas sobre onde um novo ponto de dados se encaixaria em relação a essa linha.\n", - "\n", - "Para traçar esse tipo de linha, usamos uma técnica estatística chamada **Regressão dos Mínimos Quadrados**. O termo `mínimos quadrados` significa que todos os pontos de dados ao redor da linha de regressão são elevados ao quadrado e, em seguida, somados. Idealmente, essa soma final deve ser o menor valor possível, porque queremos um número baixo de erros, ou `mínimos quadrados`. Assim, a linha de melhor ajuste é aquela que nos dá o menor valor para a soma dos erros ao quadrado - daí o nome *regressão dos mínimos quadrados*.\n", - "\n", - "Fazemos isso porque queremos modelar uma linha que tenha a menor distância acumulada de todos os nossos pontos de dados. Também elevamos os termos ao quadrado antes de somá-los, pois estamos preocupados com a magnitude, e não com a direção.\n", - "\n", - "> **🧮 Mostre-me a matemática**\n", - ">\n", - "> Essa linha, chamada de *linha de melhor ajuste*, pode ser expressa por [uma equação](https://en.wikipedia.org/wiki/Simple_linear_regression):\n", - ">\n", - "> Y = a + bX\n", - ">\n", - "> `X` é a '`variável explicativa` ou `preditor`'. `Y` é a '`variável dependente` ou `resultado`'. A inclinação da linha é `b` e `a` é o intercepto no eixo y, que se refere ao valor de `Y` quando `X = 0`.\n", - ">\n", - "\n", - "> ![](../../../../../../2-Regression/3-Linear/solution/images/slope.png \"slope = $y/x$\")\n", - " Infográfico por Jen Looper\n", - ">\n", - "> Primeiro, calcule a inclinação `b`.\n", - ">\n", - "> Em outras palavras, e referindo-se à pergunta original dos dados das abóboras: \"prever o preço de uma abóbora por alqueire por mês\", `X` se referiria ao preço e `Y` ao mês de venda.\n", - ">\n", - "> ![](../../../../../../translated_images/pt-BR/calculation.989aa7822020d9d0ba9fc781f1ab5192f3421be86ebb88026528aef33c37b0d8.png)\n", - " Infográfico por Jen Looper\n", - "> \n", - "> Calcule o valor de Y. Se você está pagando cerca de \\$4, deve ser abril!\n", - ">\n", - "> A matemática que calcula a linha deve demonstrar a inclinação da linha, que também depende do intercepto, ou onde `Y` está situado quando `X = 0`.\n", - ">\n", - "> Você pode observar o método de cálculo desses valores no site [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Também visite [este calculador de mínimos quadrados](https://www.mathsisfun.com/data/least-squares-calculator.html) para ver como os valores dos números impactam a linha.\n", - "\n", - "Não é tão assustador, certo? 🤓\n", - "\n", - "#### Correlação\n", - "\n", - "Outro termo importante para entender é o **Coeficiente de Correlação** entre as variáveis X e Y fornecidas. Usando um gráfico de dispersão, você pode visualizar rapidamente esse coeficiente. Um gráfico com pontos de dados alinhados de forma ordenada tem alta correlação, mas um gráfico com pontos de dados espalhados por toda parte entre X e Y tem baixa correlação.\n", - "\n", - "Um bom modelo de regressão linear será aquele que possui um Coeficiente de Correlação alto (mais próximo de 1 do que de 0) usando o método de Regressão dos Mínimos Quadrados com uma linha de regressão.\n" - ], - "metadata": { - "id": "cdX5FRpvsoP5" - } - }, - { - "cell_type": "markdown", - "source": [ - "## **2. Uma dança com dados: criando um data frame que será usado para modelagem**\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "WdUKXk7Bs8-V" - } - }, - { - "cell_type": "markdown", - "source": [ - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados em um data frame contendo um subconjunto dos dados:\n", - "\n", - "- Considere apenas abóboras com preço por alqueire\n", - "\n", - "- Converta a data para o formato de mês\n", - "\n", - "- Calcule o preço como a média entre os preços mais altos e mais baixos\n", - "\n", - "- Converta o preço para refletir a precificação pela quantidade em alqueires\n", - "\n", - "> Cobrimos essas etapas na [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/2-Data/solution/lesson_2-R.ipynb).\n" - ], - "metadata": { - "id": "fMCtu2G2s-p8" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the core Tidyverse packages\n", - "library(tidyverse)\n", - "library(lubridate)\n", - "\n", - "# Import the pumpkins data\n", - "pumpkins <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/2-Regression/data/US-pumpkins.csv\")\n", - "\n", - "\n", - "# Get a glimpse and dimensions of the data\n", - "glimpse(pumpkins)\n", - "\n", - "\n", - "# Print the first 50 rows of the data set\n", - "pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "ryMVZEEPtERn" - } - }, - { - "cell_type": "markdown", - "source": [ - "No espírito de pura aventura, vamos explorar o [`pacote janitor`](../../../../../../2-Regression/3-Linear/solution/R/github.com/sfirke/janitor) que fornece funções simples para examinar e limpar dados desorganizados. Por exemplo, vamos dar uma olhada nos nomes das colunas dos nossos dados:\n" - ], - "metadata": { - "id": "xcNxM70EtJjb" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Return column names\n", - "pumpkins %>% \n", - " names()" - ], - "outputs": [], - "metadata": { - "id": "5XtpaIigtPfW" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤔 Podemos fazer melhor. Vamos tornar esses nomes de colunas `friendR` convertendo-os para a convenção [snake_case](https://en.wikipedia.org/wiki/Snake_case) usando `janitor::clean_names`. Para saber mais sobre essa função: `?clean_names`\n" - ], - "metadata": { - "id": "IbIqrMINtSHe" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Clean names to the snake_case convention\n", - "pumpkins <- pumpkins %>% \n", - " clean_names(case = \"snake\")\n", - "\n", - "# Return column names\n", - "pumpkins %>% \n", - " names()" - ], - "outputs": [], - "metadata": { - "id": "a2uYvclYtWvX" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito tidyR 🧹! Agora, uma dança com os dados usando `dplyr`, como na lição anterior! 💃\n" - ], - "metadata": { - "id": "HfhnuzDDtaDd" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Select desired columns\n", - "pumpkins <- pumpkins %>% \n", - " select(variety, city_name, package, low_price, high_price, date)\n", - "\n", - "\n", - "\n", - "# Extract the month from the dates to a new column\n", - "pumpkins <- pumpkins %>%\n", - " mutate(date = mdy(date),\n", - " month = month(date)) %>% \n", - " select(-date)\n", - "\n", - "\n", - "\n", - "# Create a new column for average Price\n", - "pumpkins <- pumpkins %>% \n", - " mutate(price = (low_price + high_price)/2)\n", - "\n", - "\n", - "# Retain only pumpkins with the string \"bushel\"\n", - "new_pumpkins <- pumpkins %>% \n", - " filter(str_detect(string = package, pattern = \"bushel\"))\n", - "\n", - "\n", - "# Normalize the pricing so that you show the pricing per bushel, not per 1 1/9 or 1/2 bushel\n", - "new_pumpkins <- new_pumpkins %>% \n", - " mutate(price = case_when(\n", - " str_detect(package, \"1 1/9\") ~ price/(1.1),\n", - " str_detect(package, \"1/2\") ~ price*2,\n", - " TRUE ~ price))\n", - "\n", - "# Relocate column positions\n", - "new_pumpkins <- new_pumpkins %>% \n", - " relocate(month, .before = variety)\n", - "\n", - "\n", - "# Display the first 5 rows\n", - "new_pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "X0wU3gQvtd9f" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho!👌 Agora você tem um conjunto de dados limpo e organizado para construir seu novo modelo de regressão!\n", - "\n", - "Que tal um gráfico de dispersão?\n" - ], - "metadata": { - "id": "UpaIwaxqth82" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Set theme\n", - "theme_set(theme_light())\n", - "\n", - "# Make a scatter plot of month and price\n", - "new_pumpkins %>% \n", - " ggplot(mapping = aes(x = month, y = price)) +\n", - " geom_point(size = 1.6)\n" - ], - "outputs": [], - "metadata": { - "id": "DXgU-j37tl5K" - } - }, - { - "cell_type": "markdown", - "source": [ - "Um gráfico de dispersão nos lembra que só temos dados mensais de agosto a dezembro. Provavelmente precisamos de mais dados para conseguir tirar conclusões de forma linear.\n", - "\n", - "Vamos dar uma olhada novamente nos nossos dados de modelagem:\n" - ], - "metadata": { - "id": "Ve64wVbwtobI" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Display first 5 rows\n", - "new_pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "HFQX2ng1tuSJ" - } - }, - { - "cell_type": "markdown", - "source": [ - "E se quiséssemos prever o `price` de uma abóbora com base nas colunas `city` ou `package`, que são do tipo caractere? Ou, de forma ainda mais simples, como poderíamos encontrar a correlação (que exige que ambos os seus inputs sejam numéricos) entre, por exemplo, `package` e `price`? 🤷🤷\n", - "\n", - "Modelos de aprendizado de máquina funcionam melhor com características numéricas em vez de valores de texto, então geralmente é necessário converter características categóricas em representações numéricas.\n", - "\n", - "Isso significa que precisamos encontrar uma maneira de reformular nossos preditores para torná-los mais fáceis de usar por um modelo de forma eficaz, um processo conhecido como `feature engineering`.\n" - ], - "metadata": { - "id": "7hsHoxsStyjJ" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 3. Pré-processamento de dados para modelagem com recipes 👩‍🍳👨‍🍳\n", - "\n", - "Atividades que reformulam os valores dos preditores para torná-los mais fáceis de serem usados de forma eficaz por um modelo são chamadas de `engenharia de atributos`.\n", - "\n", - "Modelos diferentes têm requisitos de pré-processamento diferentes. Por exemplo, mínimos quadrados requerem `codificação de variáveis categóricas`, como mês, variedade e city_name. Isso simplesmente envolve `traduzir` uma coluna com `valores categóricos` em uma ou mais `colunas numéricas` que substituem a original.\n", - "\n", - "Por exemplo, suponha que seus dados incluam a seguinte característica categórica:\n", - "\n", - "| cidade |\n", - "|:---------:|\n", - "| Denver |\n", - "| Nairobi |\n", - "| Tóquio |\n", - "\n", - "Você pode aplicar *codificação ordinal* para substituir cada categoria por um valor inteiro único, assim:\n", - "\n", - "| cidade |\n", - "|:------:|\n", - "| 0 |\n", - "| 1 |\n", - "| 2 |\n", - "\n", - "E é isso que faremos com nossos dados!\n", - "\n", - "Nesta seção, exploraremos outro pacote incrível do Tidymodels: [recipes](https://tidymodels.github.io/recipes/) - que foi projetado para ajudar você a pré-processar seus dados **antes** de treinar seu modelo. No seu núcleo, uma receita é um objeto que define quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para a modelagem.\n", - "\n", - "Agora, vamos criar uma receita que prepara nossos dados para modelagem, substituindo um número inteiro único para todas as observações nas colunas de preditores:\n" - ], - "metadata": { - "id": "AD5kQbcvt3Xl" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Specify a recipe\n", - "pumpkins_recipe <- recipe(price ~ ., data = new_pumpkins) %>% \n", - " step_integer(all_predictors(), zero_based = TRUE)\n", - "\n", - "\n", - "# Print out the recipe\n", - "pumpkins_recipe" - ], - "outputs": [], - "metadata": { - "id": "BNaFKXfRt9TU" - } - }, - { - "cell_type": "markdown", - "source": [ - "Incrível! 👏 Acabamos de criar nossa primeira receita que especifica um resultado (preço) e seus respectivos preditores, e que todas as colunas de preditores devem ser codificadas em um conjunto de números inteiros 🙌! Vamos analisar isso rapidamente:\n", - "\n", - "- A chamada para `recipe()` com uma fórmula informa à receita os *papéis* das variáveis usando os dados de `new_pumpkins` como referência. Por exemplo, a coluna `price` foi atribuída ao papel de `outcome`, enquanto o restante das colunas foi atribuído ao papel de `predictor`.\n", - "\n", - "- `step_integer(all_predictors(), zero_based = TRUE)` especifica que todos os preditores devem ser convertidos em um conjunto de números inteiros, começando a numeração em 0.\n", - "\n", - "Temos certeza de que você pode estar pensando algo como: \"Isso é tão legal!! Mas e se eu precisar confirmar que as receitas estão fazendo exatamente o que eu espero? 🤔\"\n", - "\n", - "Esse é um pensamento incrível! Veja bem, uma vez que sua receita está definida, você pode estimar os parâmetros necessários para realmente pré-processar os dados e, em seguida, extrair os dados processados. Normalmente, você não precisa fazer isso ao usar Tidymodels (veremos a convenção normal em apenas um minuto-\\> `workflows`), mas pode ser útil quando você quiser fazer algum tipo de verificação para confirmar que as receitas estão funcionando como esperado.\n", - "\n", - "Para isso, você precisará de dois outros verbos: `prep()` e `bake()`, e como sempre, nossos pequenos amigos do R criados por [`Allison Horst`](https://github.com/allisonhorst/stats-illustrations) ajudam você a entender isso melhor!\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "KEiO0v7kuC9O" - } - }, - { - "cell_type": "markdown", - "source": [ - "[`prep()`](https://recipes.tidymodels.org/reference/prep.html): estima os parâmetros necessários a partir de um conjunto de treinamento que podem ser posteriormente aplicados a outros conjuntos de dados. Por exemplo, para uma determinada coluna preditora, qual observação será atribuída ao inteiro 0, 1, 2, etc.\n", - "\n", - "[`bake()`](https://recipes.tidymodels.org/reference/bake.html): utiliza uma receita preparada e aplica as operações a qualquer conjunto de dados.\n", - "\n", - "Dito isso, vamos preparar e aplicar nossas receitas para realmente confirmar que, nos bastidores, as colunas preditoras serão primeiro codificadas antes que um modelo seja ajustado.\n" - ], - "metadata": { - "id": "Q1xtzebuuTCP" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Prep the recipe\n", - "pumpkins_prep <- prep(pumpkins_recipe)\n", - "\n", - "# Bake the recipe to extract a preprocessed new_pumpkins data\n", - "baked_pumpkins <- bake(pumpkins_prep, new_data = NULL)\n", - "\n", - "# Print out the baked data set\n", - "baked_pumpkins %>% \n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "FGBbJbP_uUUn" - } - }, - { - "cell_type": "markdown", - "source": [ - "Uhuu! 🥳 Os dados processados `baked_pumpkins` têm todos os seus preditores codificados, confirmando que, de fato, as etapas de pré-processamento definidas como nossa receita funcionarão conforme o esperado. Isso pode dificultar a leitura para você, mas torna muito mais compreensível para o Tidymodels! Reserve um tempo para descobrir qual observação foi mapeada para um número inteiro correspondente.\n", - "\n", - "Também vale mencionar que `baked_pumpkins` é um data frame no qual podemos realizar cálculos.\n", - "\n", - "Por exemplo, vamos tentar encontrar uma boa correlação entre dois pontos dos seus dados para, potencialmente, construir um bom modelo preditivo. Usaremos a função `cor()` para isso. Digite `?cor()` para saber mais sobre a função.\n" - ], - "metadata": { - "id": "1dvP0LBUueAW" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Find the correlation between the city_name and the price\n", - "cor(baked_pumpkins$city_name, baked_pumpkins$price)\n", - "\n", - "# Find the correlation between the package and the price\n", - "cor(baked_pumpkins$package, baked_pumpkins$price)\n" - ], - "outputs": [], - "metadata": { - "id": "3bQzXCjFuiSV" - } - }, - { - "cell_type": "markdown", - "source": [ - "Como se verifica, há apenas uma correlação fraca entre a Cidade e o Preço. No entanto, há uma correlação um pouco melhor entre o Pacote e seu Preço. Faz sentido, certo? Normalmente, quanto maior a caixa do produto, maior o preço.\n", - "\n", - "Já que estamos nisso, vamos também tentar visualizar uma matriz de correlação de todas as colunas usando o pacote `corrplot`.\n" - ], - "metadata": { - "id": "BToPWbgjuoZw" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the corrplot package\n", - "library(corrplot)\n", - "\n", - "# Obtain correlation matrix\n", - "corr_mat <- cor(baked_pumpkins %>% \n", - " # Drop columns that are not really informative\n", - " select(-c(low_price, high_price)))\n", - "\n", - "# Make a correlation plot between the variables\n", - "corrplot(corr_mat, method = \"shade\", shade.col = NA, tl.col = \"black\", tl.srt = 45, addCoef.col = \"black\", cl.pos = \"n\", order = \"original\")" - ], - "outputs": [], - "metadata": { - "id": "ZwAL3ksmutVR" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤩🤩 Muito melhor.\n", - "\n", - "Uma boa pergunta a se fazer agora com esses dados seria: '`Qual preço posso esperar de um determinado pacote de abóboras?`' Vamos direto ao ponto!\n", - "\n", - "> Nota: Quando você **`bake()`** a receita preparada **`pumpkins_prep`** com **`new_data = NULL`**, você extrai os dados de treinamento processados (ou seja, codificados). Se você tivesse outro conjunto de dados, por exemplo, um conjunto de teste, e quisesse ver como a receita o pré-processaria, bastaria assar **`pumpkins_prep`** com **`new_data = test_set`**\n", - "\n", - "## 4. Construir um modelo de regressão linear\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "YqXjLuWavNxW" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora que criamos uma receita e confirmamos que os dados serão pré-processados adequadamente, vamos construir um modelo de regressão para responder à pergunta: `Qual preço posso esperar de um determinado pacote de abóbora?`\n", - "\n", - "#### Treinar um modelo de regressão linear usando o conjunto de treinamento\n", - "\n", - "Como você já deve ter percebido, a coluna *price* é a variável `resultado`, enquanto a coluna *package* é a variável `preditor`.\n", - "\n", - "Para isso, primeiro dividiremos os dados de forma que 80% sejam destinados ao treinamento e 20% ao conjunto de teste. Em seguida, definiremos uma receita que codificará a coluna preditora em um conjunto de números inteiros e, depois, construiremos uma especificação de modelo. Não vamos preparar e aplicar nossa receita, já que sabemos que ela pré-processará os dados conforme esperado.\n" - ], - "metadata": { - "id": "Pq0bSzCevW-h" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "set.seed(2056)\n", - "# Split the data into training and test sets\n", - "pumpkins_split <- new_pumpkins %>% \n", - " initial_split(prop = 0.8)\n", - "\n", - "\n", - "# Extract training and test data\n", - "pumpkins_train <- training(pumpkins_split)\n", - "pumpkins_test <- testing(pumpkins_split)\n", - "\n", - "\n", - "\n", - "# Create a recipe for preprocessing the data\n", - "lm_pumpkins_recipe <- recipe(price ~ package, data = pumpkins_train) %>% \n", - " step_integer(all_predictors(), zero_based = TRUE)\n", - "\n", - "\n", - "\n", - "# Create a linear model specification\n", - "lm_spec <- linear_reg() %>% \n", - " set_engine(\"lm\") %>% \n", - " set_mode(\"regression\")" - ], - "outputs": [], - "metadata": { - "id": "CyoEh_wuvcLv" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho! Agora que temos uma receita e uma especificação de modelo, precisamos encontrar uma maneira de agrupá-las em um objeto que, primeiro, faça o pré-processamento dos dados (prep+bake nos bastidores), ajuste o modelo nos dados pré-processados e também permita possíveis atividades de pós-processamento. Que tal isso para sua tranquilidade! 🤩\n", - "\n", - "No Tidymodels, esse objeto prático é chamado de [`workflow`](https://workflows.tidymodels.org/) e organiza convenientemente seus componentes de modelagem! É o que chamaríamos de *pipelines* em *Python*.\n", - "\n", - "Então, vamos agrupar tudo em um workflow! 📦\n" - ], - "metadata": { - "id": "G3zF_3DqviFJ" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Hold modelling components in a workflow\n", - "lm_wf <- workflow() %>% \n", - " add_recipe(lm_pumpkins_recipe) %>% \n", - " add_model(lm_spec)\n", - "\n", - "# Print out the workflow\n", - "lm_wf" - ], - "outputs": [], - "metadata": { - "id": "T3olroU3v-WX" - } - }, - { - "cell_type": "markdown", - "source": [ - "👌 Além disso, um fluxo de trabalho pode ser ajustado/treinado de maneira muito semelhante a um modelo.\n" - ], - "metadata": { - "id": "zd1A5tgOwEPX" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Train the model\n", - "lm_wf_fit <- lm_wf %>% \n", - " fit(data = pumpkins_train)\n", - "\n", - "# Print the model coefficients learned \n", - "lm_wf_fit" - ], - "outputs": [], - "metadata": { - "id": "NhJagFumwFHf" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir da saída do modelo, podemos observar os coeficientes aprendidos durante o treinamento. Eles representam os coeficientes da linha de melhor ajuste que nos dá o menor erro geral entre a variável real e a prevista.\n", - "\n", - "#### Avaliar o desempenho do modelo usando o conjunto de teste\n", - "\n", - "É hora de ver como o modelo se saiu 📏! Como fazemos isso?\n", - "\n", - "Agora que treinamos o modelo, podemos usá-lo para fazer previsões para o `test_set` usando `parsnip::predict()`. Em seguida, podemos comparar essas previsões com os valores reais dos rótulos para avaliar o quão bem (ou não!) o modelo está funcionando.\n", - "\n", - "Vamos começar fazendo previsões para o conjunto de teste e, em seguida, vinculando as colunas ao conjunto de teste.\n" - ], - "metadata": { - "id": "_4QkGtBTwItF" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make predictions for the test set\n", - "predictions <- lm_wf_fit %>% \n", - " predict(new_data = pumpkins_test)\n", - "\n", - "\n", - "# Bind predictions to the test set\n", - "lm_results <- pumpkins_test %>% \n", - " select(c(package, price)) %>% \n", - " bind_cols(predictions)\n", - "\n", - "\n", - "# Print the first ten rows of the tibble\n", - "lm_results %>% \n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "UFZzTG0gwTs9" - } - }, - { - "cell_type": "markdown", - "source": [ - "Sim, você acabou de treinar um modelo e usá-lo para fazer previsões! 🔮 Será que ele é bom? Vamos avaliar o desempenho do modelo!\n", - "\n", - "No Tidymodels, fazemos isso usando `yardstick::metrics()`! Para regressão linear, vamos focar nas seguintes métricas:\n", - "\n", - "- `Root Mean Square Error (RMSE)`: A raiz quadrada do [MSE](https://en.wikipedia.org/wiki/Mean_squared_error). Isso resulta em uma métrica absoluta na mesma unidade do rótulo (neste caso, o preço de uma abóbora). Quanto menor o valor, melhor o modelo (de forma simplificada, representa o preço médio pelo qual as previsões estão erradas!).\n", - "\n", - "- `Coefficient of Determination (geralmente conhecido como R-quadrado ou R2)`: Uma métrica relativa em que, quanto maior o valor, melhor o ajuste do modelo. Essencialmente, essa métrica representa o quanto da variância entre os valores previstos e reais o modelo é capaz de explicar.\n" - ], - "metadata": { - "id": "0A5MjzM7wW9M" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Evaluate performance of linear regression\n", - "metrics(data = lm_results,\n", - " truth = price,\n", - " estimate = .pred)" - ], - "outputs": [], - "metadata": { - "id": "reJ0UIhQwcEH" - } - }, - { - "cell_type": "markdown", - "source": [ - "Lá se vai o desempenho do modelo. Vamos ver se conseguimos uma indicação melhor visualizando um gráfico de dispersão do pacote e do preço, e então usar as previsões feitas para sobrepor uma linha de melhor ajuste.\n", - "\n", - "Isso significa que teremos que preparar e processar o conjunto de teste para codificar a coluna de pacote e, em seguida, vinculá-la às previsões feitas pelo nosso modelo.\n" - ], - "metadata": { - "id": "fdgjzjkBwfWt" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Encode package column\n", - "package_encode <- lm_pumpkins_recipe %>% \n", - " prep() %>% \n", - " bake(new_data = pumpkins_test) %>% \n", - " select(package)\n", - "\n", - "\n", - "# Bind encoded package column to the results\n", - "lm_results <- lm_results %>% \n", - " bind_cols(package_encode %>% \n", - " rename(package_integer = package)) %>% \n", - " relocate(package_integer, .after = package)\n", - "\n", - "\n", - "# Print new results data frame\n", - "lm_results %>% \n", - " slice_head(n = 5)\n", - "\n", - "\n", - "# Make a scatter plot\n", - "lm_results %>% \n", - " ggplot(mapping = aes(x = package_integer, y = price)) +\n", - " geom_point(size = 1.6) +\n", - " # Overlay a line of best fit\n", - " geom_line(aes(y = .pred), color = \"orange\", size = 1.2) +\n", - " xlab(\"package\")\n", - " \n" - ], - "outputs": [], - "metadata": { - "id": "R0nw719lwkHE" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ótimo! Como você pode ver, o modelo de regressão linear não generaliza muito bem a relação entre um pacote e seu preço correspondente.\n", - "\n", - "🎃 Parabéns, você acabou de criar um modelo que pode ajudar a prever o preço de algumas variedades de abóboras. Sua plantação de abóboras para o feriado ficará linda. Mas provavelmente você pode criar um modelo melhor!\n", - "\n", - "## 5. Construir um modelo de regressão polinomial\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "HOCqJXLTwtWI" - } - }, - { - "cell_type": "markdown", - "source": [ - "Às vezes, nossos dados podem não ter uma relação linear, mas ainda assim queremos prever um resultado. A regressão polinomial pode nos ajudar a fazer previsões para relações não lineares mais complexas.\n", - "\n", - "Por exemplo, considere a relação entre o pacote e o preço no nosso conjunto de dados de abóboras. Embora às vezes haja uma relação linear entre as variáveis - quanto maior o volume da abóbora, maior o preço - em outras ocasiões essas relações não podem ser representadas como um plano ou uma linha reta.\n", - "\n", - "> ✅ Aqui estão [alguns exemplos adicionais](https://online.stat.psu.edu/stat501/lesson/9/9.8) de dados que poderiam usar regressão polinomial\n", - ">\n", - "> Dê outra olhada na relação entre Variedade e Preço no gráfico anterior. Esse gráfico de dispersão parece que necessariamente deveria ser analisado por uma linha reta? Talvez não. Nesse caso, você pode tentar a regressão polinomial.\n", - ">\n", - "> ✅ Polinômios são expressões matemáticas que podem consistir em uma ou mais variáveis e coeficientes\n", - "\n", - "#### Treine um modelo de regressão polinomial usando o conjunto de treinamento\n", - "\n", - "A regressão polinomial cria uma *linha curva* para ajustar melhor os dados não lineares.\n", - "\n", - "Vamos ver se um modelo polinomial terá um desempenho melhor ao fazer previsões. Seguiremos um procedimento um pouco semelhante ao que fizemos antes:\n", - "\n", - "- Criar uma receita que especifique os passos de pré-processamento que devem ser realizados nos nossos dados para prepará-los para modelagem, ou seja: codificar os preditores e calcular polinômios de grau *n*\n", - "\n", - "- Construir uma especificação de modelo\n", - "\n", - "- Agrupar a receita e a especificação do modelo em um fluxo de trabalho\n", - "\n", - "- Criar um modelo ajustando o fluxo de trabalho\n", - "\n", - "- Avaliar o desempenho do modelo nos dados de teste\n", - "\n", - "Vamos começar!\n" - ], - "metadata": { - "id": "VcEIpRV9wzYr" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Specify a recipe\r\n", - "poly_pumpkins_recipe <-\r\n", - " recipe(price ~ package, data = pumpkins_train) %>%\r\n", - " step_integer(all_predictors(), zero_based = TRUE) %>% \r\n", - " step_poly(all_predictors(), degree = 4)\r\n", - "\r\n", - "\r\n", - "# Create a model specification\r\n", - "poly_spec <- linear_reg() %>% \r\n", - " set_engine(\"lm\") %>% \r\n", - " set_mode(\"regression\")\r\n", - "\r\n", - "\r\n", - "# Bundle recipe and model spec into a workflow\r\n", - "poly_wf <- workflow() %>% \r\n", - " add_recipe(poly_pumpkins_recipe) %>% \r\n", - " add_model(poly_spec)\r\n", - "\r\n", - "\r\n", - "# Create a model\r\n", - "poly_wf_fit <- poly_wf %>% \r\n", - " fit(data = pumpkins_train)\r\n", - "\r\n", - "\r\n", - "# Print learned model coefficients\r\n", - "poly_wf_fit\r\n", - "\r\n", - " " - ], - "outputs": [], - "metadata": { - "id": "63n_YyRXw3CC" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### Avaliar o desempenho do modelo\n", - "\n", - "👏👏Você construiu um modelo polinomial, vamos fazer previsões no conjunto de teste!\n" - ], - "metadata": { - "id": "-LHZtztSxDP0" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make price predictions on test data\r\n", - "poly_results <- poly_wf_fit %>% predict(new_data = pumpkins_test) %>% \r\n", - " bind_cols(pumpkins_test %>% select(c(package, price))) %>% \r\n", - " relocate(.pred, .after = last_col())\r\n", - "\r\n", - "\r\n", - "# Print the results\r\n", - "poly_results %>% \r\n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "YUFpQ_dKxJGx" - } - }, - { - "cell_type": "markdown", - "source": [ - "Uhuu, vamos avaliar como o modelo se saiu no test_set usando `yardstick::metrics()`.\n" - ], - "metadata": { - "id": "qxdyj86bxNGZ" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "metrics(data = poly_results, truth = price, estimate = .pred)" - ], - "outputs": [], - "metadata": { - "id": "8AW5ltkBxXDm" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤩🤩 Desempenho muito melhor.\n", - "\n", - "O `rmse` diminuiu de cerca de 7 para cerca de 3, indicando uma redução no erro entre o preço real e o preço previsto. Você pode *interpretar livremente* isso como significando que, em média, as previsões incorretas erram por volta de R\\$3. O `rsq` aumentou de cerca de 0,4 para 0,8.\n", - "\n", - "Todas essas métricas indicam que o modelo polinomial tem um desempenho muito melhor do que o modelo linear. Bom trabalho!\n", - "\n", - "Vamos ver se conseguimos visualizar isso!\n" - ], - "metadata": { - "id": "6gLHNZDwxYaS" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Bind encoded package column to the results\r\n", - "poly_results <- poly_results %>% \r\n", - " bind_cols(package_encode %>% \r\n", - " rename(package_integer = package)) %>% \r\n", - " relocate(package_integer, .after = package)\r\n", - "\r\n", - "\r\n", - "# Print new results data frame\r\n", - "poly_results %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "\r\n", - "# Make a scatter plot\r\n", - "poly_results %>% \r\n", - " ggplot(mapping = aes(x = package_integer, y = price)) +\r\n", - " geom_point(size = 1.6) +\r\n", - " # Overlay a line of best fit\r\n", - " geom_line(aes(y = .pred), color = \"midnightblue\", size = 1.2) +\r\n", - " xlab(\"package\")\r\n" - ], - "outputs": [], - "metadata": { - "id": "A83U16frxdF1" - } - }, - { - "cell_type": "markdown", - "source": [ - "Você pode ver uma linha curva que se ajusta melhor aos seus dados! 🤩\n", - "\n", - "Você pode torná-la ainda mais suave passando uma fórmula polinomial para `geom_smooth`, assim:\n" - ], - "metadata": { - "id": "4U-7aHOVxlGU" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make a scatter plot\r\n", - "poly_results %>% \r\n", - " ggplot(mapping = aes(x = package_integer, y = price)) +\r\n", - " geom_point(size = 1.6) +\r\n", - " # Overlay a line of best fit\r\n", - " geom_smooth(method = lm, formula = y ~ poly(x, degree = 4), color = \"midnightblue\", size = 1.2, se = FALSE) +\r\n", - " xlab(\"package\")" - ], - "outputs": [], - "metadata": { - "id": "5vzNT0Uexm-w" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito parecido com uma curva suave!🤩\n", - "\n", - "Aqui está como você pode fazer uma nova previsão:\n" - ], - "metadata": { - "id": "v9u-wwyLxq4G" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make a hypothetical data frame\r\n", - "hypo_tibble <- tibble(package = \"bushel baskets\")\r\n", - "\r\n", - "# Make predictions using linear model\r\n", - "lm_pred <- lm_wf_fit %>% predict(new_data = hypo_tibble)\r\n", - "\r\n", - "# Make predictions using polynomial model\r\n", - "poly_pred <- poly_wf_fit %>% predict(new_data = hypo_tibble)\r\n", - "\r\n", - "# Return predictions in a list\r\n", - "list(\"linear model prediction\" = lm_pred, \r\n", - " \"polynomial model prediction\" = poly_pred)\r\n" - ], - "outputs": [], - "metadata": { - "id": "jRPSyfQGxuQv" - } - }, - { - "cell_type": "markdown", - "source": [ - "A previsão do `polynomial model` faz sentido, considerando os gráficos de dispersão de `price` e `package`! E, se este modelo for melhor do que o anterior, analisando os mesmos dados, você precisará planejar um orçamento para essas abóboras mais caras!\n", - "\n", - "🏆 Muito bem! Você criou dois modelos de regressão em uma única lição. Na seção final sobre regressão, você aprenderá sobre regressão logística para determinar categorias.\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Teste várias variáveis diferentes neste notebook para ver como a correlação corresponde à precisão do modelo.\n", - "\n", - "## [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/14/)\n", - "\n", - "## **Revisão e Autoestudo**\n", - "\n", - "Nesta lição, aprendemos sobre Regressão Linear. Existem outros tipos importantes de Regressão. Leia sobre as técnicas Stepwise, Ridge, Lasso e Elasticnet. Um bom curso para aprender mais é o [curso de Aprendizado Estatístico de Stanford](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning).\n", - "\n", - "Se você quiser aprender mais sobre como usar o incrível framework Tidymodels, confira os seguintes recursos:\n", - "\n", - "- Site do Tidymodels: [Comece com Tidymodels](https://www.tidymodels.org/start/)\n", - "\n", - "- Max Kuhn e Julia Silge, [*Tidy Modeling with R*](https://www.tmwr.org/)*.*\n", - "\n", - "###### **AGRADECIMENTOS A:**\n", - "\n", - "[Allison Horst](https://twitter.com/allison_horst?lang=en) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n" - ], - "metadata": { - "id": "8zOLOWqMxzk5" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/2-Regression/3-Linear/solution/notebook.ipynb b/translations/br/2-Regression/3-Linear/solution/notebook.ipynb deleted file mode 100644 index 61755c0b0..000000000 --- a/translations/br/2-Regression/3-Linear/solution/notebook.ipynb +++ /dev/null @@ -1,1111 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Regressão Linear e Polinomial para Precificação de Abóboras - Aula 3\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n", - "\n", - "- Considere apenas abóboras com preços definidos por alqueire\n", - "- Converta a data para o formato de mês\n", - "- Calcule o preço como uma média entre os preços mais altos e mais baixos\n", - "- Converta o preço para refletir a precificação pela quantidade em alqueires\n" - ] - }, - { - "cell_type": "code", - "execution_count": 167, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
0BALTIMORENaN24 inch binsNaNNaNNaN4/29/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
1BALTIMORENaN24 inch binsNaNNaNNaN5/6/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
2BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
3BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
4BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN11/5/1690.0100.090.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade Date \\\n", - "0 BALTIMORE NaN 24 inch bins NaN NaN NaN 4/29/17 \n", - "1 BALTIMORE NaN 24 inch bins NaN NaN NaN 5/6/17 \n", - "2 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "3 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "4 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 11/5/16 \n", - "\n", - " Low Price High Price Mostly Low ... Unit of Sale Quality Condition \\\n", - "0 270.0 280.0 270.0 ... NaN NaN NaN \n", - "1 270.0 280.0 270.0 ... NaN NaN NaN \n", - "2 160.0 160.0 160.0 ... NaN NaN NaN \n", - "3 160.0 160.0 160.0 ... NaN NaN NaN \n", - "4 90.0 100.0 90.0 ... NaN NaN NaN \n", - "\n", - " Appearance Storage Crop Repack Trans Mode Unnamed: 24 Unnamed: 25 \n", - "0 NaN NaN NaN E NaN NaN NaN \n", - "1 NaN NaN NaN E NaN NaN NaN \n", - "2 NaN NaN NaN N NaN NaN NaN \n", - "3 NaN NaN NaN N NaN NaN NaN \n", - "4 NaN NaN NaN N NaN NaN NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 167, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "from datetime import datetime\n", - "\n", - "pumpkins = pd.read_csv('../../data/US-pumpkins.csv')\n", - "pumpkins.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 168, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
MonthDayOfYearVarietyCityPackageLow PriceHigh PricePrice
709267PIE TYPEBALTIMORE1 1/9 bushel cartons15.015.013.636364
719267PIE TYPEBALTIMORE1 1/9 bushel cartons18.018.016.363636
7210274PIE TYPEBALTIMORE1 1/9 bushel cartons18.018.016.363636
7310274PIE TYPEBALTIMORE1 1/9 bushel cartons17.017.015.454545
7410281PIE TYPEBALTIMORE1 1/9 bushel cartons15.015.013.636364
\n", - "
" - ], - "text/plain": [ - " Month DayOfYear Variety City Package Low Price \\\n", - "70 9 267 PIE TYPE BALTIMORE 1 1/9 bushel cartons 15.0 \n", - "71 9 267 PIE TYPE BALTIMORE 1 1/9 bushel cartons 18.0 \n", - "72 10 274 PIE TYPE BALTIMORE 1 1/9 bushel cartons 18.0 \n", - "73 10 274 PIE TYPE BALTIMORE 1 1/9 bushel cartons 17.0 \n", - "74 10 281 PIE TYPE BALTIMORE 1 1/9 bushel cartons 15.0 \n", - "\n", - " High Price Price \n", - "70 15.0 13.636364 \n", - "71 18.0 16.363636 \n", - "72 18.0 16.363636 \n", - "73 17.0 15.454545 \n", - "74 15.0 13.636364 " - ] - }, - "execution_count": 168, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)]\n", - "\n", - "new_columns = ['Package', 'Variety', 'City Name', 'Month', 'Low Price', 'High Price', 'Date']\n", - "pumpkins = pumpkins.drop([c for c in pumpkins.columns if c not in new_columns], axis=1)\n", - "\n", - "price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2\n", - "\n", - "month = pd.DatetimeIndex(pumpkins['Date']).month\n", - "day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days)\n", - "\n", - "new_pumpkins = pd.DataFrame(\n", - " {'Month': month, \n", - " 'DayOfYear' : day_of_year, \n", - " 'Variety': pumpkins['Variety'], \n", - " 'City': pumpkins['City Name'], \n", - " 'Package': pumpkins['Package'], \n", - " 'Low Price': pumpkins['Low Price'],\n", - " 'High Price': pumpkins['High Price'], \n", - " 'Price': price})\n", - "\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/1.1\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price*2\n", - "\n", - "new_pumpkins.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Um gráfico de dispersão nos lembra que temos dados mensais apenas de agosto a dezembro. Provavelmente precisamos de mais dados para poder tirar conclusões de forma linear.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 169, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 169, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX4AAAEGCAYAAABiq/5QAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjQuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8rg+JYAAAACXBIWXMAAAsTAAALEwEAmpwYAAAkT0lEQVR4nO3dfXRV9Z3v8fc3EB7kYcAQA+Wh0IZSUWLqzWVARi+W+lQdodXOtHcQZ41dOGumc1tn5graXqc67Ywybe2009Urtb3F2mnrkhYVtEIj1NoRNTAQEFQyhRpoCBihgEJIyPf+cXZiHs5Jzsbss0/O/rzWOivnfM/Z53zdhm9+57d/D+buiIhIchTFnYCIiOSWCr+ISMKo8IuIJIwKv4hIwqjwi4gkzOC4E8jGuHHjfOrUqXGnISIyoGzZsuUNdy/tHh8QhX/q1KnU1NTEnYaIyIBiZr9NF1dXj4hIwqjwi4gkjAq/iEjCqPCLiCSMCr+ISMKo8EuHphPNbK8/StOJ5rhTEZEIDYjhnBK9x7YdYNnqWoqLimhpa2PFDRVcXzkx7rREJAJq8QtNJ5pZtrqWUy1tHG9u5VRLG7evrlXLX6RAqfAL+4+cpLio669CcVER+4+cjCkjEYmSCr8waexwWtrausRa2tqYNHZ4TBmJSJRU+IWSkUNZcUMFQwcb5xQPYuhgY8UNFZSMHBp3aiISARV+ASC1AaeBBT9FpGBFWvjNbJ+Z7TCzbWZWE8TONbMNZrYn+Dk2yhykb+0Xd5tb23j79BmaW3VxV6SQ5aLFf7m7V7p7VfB4OVDt7tOB6uCxxEgXd0WSJY6unoXAquD+KmBRDDlIJ7q4K5IsURd+B9ab2RYzWxrEyty9ASD4eV7EOUgf2i/uDisuYtTQwQwrLtLFXZECFvXM3Xnu/jszOw/YYGavZHtg8IdiKcCUKVOiyk8C11dOZF75OPYfOcmkscNV9EUKWKQtfnf/XfDzEPAzYDbQaGYTAIKfhzIcu9Ldq9y9qrS0x85hEoGSkUO5aPIYFX2RAhdZ4TezEWY2qv0+cCWwE3gcuDl42c3AY1HlICIiPUXZ1VMG/MzM2j/n393952b2EvCImd0CvA58IsIcRESkm8gKv7v/BrgoTbwJWBDV54qISO80c1dEJGFU+KVDzd4mvrb+VWr2NsWdiohESBuxCACLH9zMc3Wpgv+NZ+q4tLyEH3x6TsxZiUgU1OIXavY2dRT9dr+qa1LLX6RAqfALz+55I1RcRAY2FX7hsunjQsVFZGBT4ReqppVwaXlJl9il5SVUTSvJcISIDGQq/ALAjVWTGTKoiCGDjCGDivhE1eS4UxKRiKjwS8dGLKfPtHH6jHP6jDZiESlkKvyijVjOUvWugyx7dDvVuw7GnYpIKBrHL9qI5Sxcef8mXmt8C4Cf1OxnRtkInr5tfqw5iWRLLX7p2IhlyCBj6OBUP782YsmsetfBjqLf7tXGt9TylwFDhV8AqNn3JqfPOM2tqX7+mt++GXdKeWv9rsZQcZF8o8Iv1DUe56HNr3eJPfT869Q1Ho8po/x25cyyUHGRfKPCL2yrPxoqnnQLZo5nRtmILrEZZSNYMHN8TBmJhKOLu0Ll5DGh4gJP3zaf6l0HWb+rkStnlqnoy4ASeYvfzAaZ2X+a2drg8RfN7ICZbQtuH406B+ldedkolsztuqH9krlTKC8bFVNGA8OCmeO578aLVPSz1HSime31RzU/JA/kosX/WWA3MLpT7H53/0oOPluydM/CWSyZM5Vt9UepnDxGRV/61WPbDrBsdS3FRUW0tLWx4oYKrq+cGHdaiRVpi9/MJgHXAg9G+TnSP8rLRnFj1WQVfelX7TPDT7W0cby5lVMtmhket6i7er4O3A60dYt/xsxqzex7ZjY23YFmttTMasys5vDhwxGnKSJR0czw/BNZ4Tez64BD7r6l21PfBt4PVAINwFfTHe/uK929yt2rSktLo0pTRCKmmeH5J8oW/zzgejPbB/wY+LCZPezuje5+xt3bgO8AsyPMQURi1j4zfFhxEaOGDmZYcZFmhscssou77n4HcAeAmc0H/t7dF5vZBHdvCF72MWBnVDmISH64vnIi88rHsf/ISSaNHa6iH7M4xvGvMLNKwIF9wK0x5CAiOVYycqgKfp7ISeF3903ApuD+Tbn4TBERSU9LNoiIJIwKv4hIwqjwi4gkjAq/iEjCqPCLiCSMCr+ISMKo8EsHLZsbztLvv8AHv/AkS7//QtypDAh1jcd5tKZeO7vlAW3EIoCWzQ1r6vJ1HffXv/IGU5evY9+918aYUX67a82OLtt7Lpk7hXsWzooxo2RTi1+0bG5ImVr4avmnpz2d848Kv2jZ3JCerWsKFU867emcf1T4RcvmhnRZeUmoeNJpT+f8o8IvWjY3pJV//oeh4kmnPZ3zj7l73Dn0qaqqymtqauJOo+A1nWjWsrkhLP3+Czxb18Rl5SUq+lmoazyuPZ1zzMy2uHtVj7gKv4hIYcpU+NXVIyKSMJEXfjMbZGb/aWZrg8fnmtkGM9sT/Ey72brkniZwhfPlJ3Yy959/wZef0CZy2ViztZ5Pr3qJNVvr404l8SLv6jGzvwWqgNHufp2ZrQDedPd7zWw5MNbdl/X2HurqiZ4mcIXzvuXr6DwOqgj4jSZwZTTnnzZw8NjpjscTRg/h+TuviDGjZIilq8fMJgHXAg92Ci8EVgX3VwGLosxB+qYJXOF8+YmdtHWLtQVx6WnN1vouRR+g4dhptfxjFHVXz9eB26HLv5Oy9s3Wg5/npTvQzJaaWY2Z1Rw+fDjiNJNNE7jCWbvzYKh40q3dkeF8ZYhL9CIr/GZ2HXDI3beczfHuvtLdq9y9qrS0tJ+zk840gSuc6y4cHyqedNfNynC+MsQlelG2+OcB15vZPuDHwIfN7GGg0cwmAAQ/D0WYg2RBE7jC+fwfX9jjH05REJeeFl08mQmjh3SJTRg9hEUXT44pI8nJOH4zmw/8fXBx91+Apk4Xd89199t7O14Xd3NDE7jC+fITO1m78yDXXTheRT8La7bWs3bHQa6bNV5FP0dincDVrfCXAI8AU4DXgU+4+5u9Ha/CLyISXqbCn5P1+N19E7ApuN8ELMjF54qISE+auSsikjAFXfg1EzWcBzbu4Zp/fZYHNu6JO5UBQVsJykBVsFsvaiZqOOd/4UlOtqau9+xuOM7Xq/ew+0sfjTmr/KWtBGUgK8gWv2aihvPAxj0dRb/dyVZXyz8DbSUoA11BFn7NRA1nTW1DqHjSaStBGegKsvBrJmo4iyomhIonnbYSlIGuIAu/ZqKGc+vl0xk+2LrEhg82br18ekwZ5TdtJSgDXUHvwKWZqOE8sHEPa2obWFQxQUU/C9pKUPKdtl4U6WdqWEi+i3Xmrkih0XBhGcgKso9fJEoaLiwDnQq/dFj0zV/yvuXrWPTNX8adSl7TcOGzo5n0+UNdPQLA1OXrOu5vO3CCqcvXsU97yKY1aexwjje3dokdb27VcOFeqGssv6jFLxlb+Gr5p/dnK/8jVDzp1DWWf1T4hdoDJ0LFk+6VQ2+HiiedusbyT5R77g4zsxfNbLuZvWxmdwfxL5rZATPbFty0EljMKiaODBVPug+ed06oeNJpJn3+ibLF3wx82N0vAiqBq81sTvDc/e5eGdyejDAHycKav/kfoeJJ9/O/vTxUPOnaZ9IPHVzUcdNM+nhFVvg9pb2voDi45f9ssYT6o/KSLo8v7fZY5N2o2fcmza1tHbea3/a626pELNI+fjMbZGbbgEPABnd/IXjqM2ZWa2bfM7OxUeYgfavZ28RzdU1dYr+qa6Jmb1OGI5Jt6fdfCBVPOi1jnX8iLfzufsbdK4FJwGwzuxD4NvB+Ut0/DcBX0x1rZkvNrMbMag4fPhxlmon37J43QsWT7tm69H8QM8WTTstY55+cjOpx96OkNlu/2t0bgz8IbcB3gNkZjlnp7lXuXlVaWpqLNBPrsunjQsWT7rIM3WCZ4kmnZazzT5SjekrNbExwfzjwEeAVM+u8yPvHgJ1R5SDZqZqWvmBliifdyj//w1DxpMu0cqlWNI1PlC3+CcBGM6sFXiLVx78WWGFmO4L45cBtEeYgWfj7n2wNFU+6//nAr0PFk06/X/knsiUb3L0W+FCa+E1RfaacnQ27D4WKJ92Lvz0aKp50+v3KP5q5K1xx/nmh4kk3+71jQsWTTr9f+UeFX/jKn14cKp50/37rvFDxpNPvV/5R4RcA/mDYoF4fi7wb40cP6fJ4QrfHklsq/MLD/7GX35860yX2+1NnePg/9saUUX6r+Id1oeJJt2ZrPQePne4Sazh2mjVb62PKSLIq/Gb2ATOrNrOdweMKM/tCtKlJrjxW2xAqnnTHMqwmnCmedGt3HAwVl+hl2+L/DnAH0AIdI3Y+GVVSklsLKyaEiifd6Axri2WKJ911s8aHikv0si3857j7i91irWlfKQPO4kumpe3jX3zJtJgyym+1d6ffmSxTPOkWXTy5R5/+hNFDWHTx5JgykmwL/xtm9n6C1TXN7EZS6+xIgVjYbRu8hR/Stni9+ddPVnZ5/I1uj6Wr5++8gq//SQUfOf88vv4nFTx/5xVxp5Ro5t73Sslm9j5gJXAJcATYCyx2932RZheoqqrympqaXHxUItU1Hucj9z/bI/6L2y7TtPo0mk40M+++ZzjV8s7mIsOKi/j1sg9rjXnJK2a2xd2rusezmrnr7r8BPmJmI4Aid9d6qgWkt9UTVfh7at9K8BTvFP72rQRV+GUgyHZUzz+Z2Rh3f8vdj5vZWDP7UtTJSW5o9cRwtJWgDHTZ9vFfEyytDIC7HwG0V26BGDtiCIOKrEtsUJExdoQm2aTTvpVgEWCk/hFpK8G+1TUe59Gaem3AkgeyXaRtkJkNdfdm6FhmWb/lBWL/kZMUGXSewlVkqOuiF/9nzY6Ojh4PHl9fqQvimdy1ZkeXXbiWzJ3CPQtnxZhRsmXb4n8YqDazW8zsL4ANwKro0pJcamk9Q8uZrhf5W844La1nMhyRbJrpHI62Xsw/WRV+d18BfBk4H7gA+McgJgXghb3pN77OFE86zXQOR1sv5p+s1+N396eApyLMRWRAWFgxgZf2HUkbl540eCD/9NriN7Pngp/HzexYp9txMzvWx7HDzOxFM9tuZi+b2d1B/Fwz22Bme4KfY/vvP0fOxlUXpJ86nymedJrpHE552SiWzJ3SJbZk7hQNFY5Rry1+d/+j4OfZ/B9qBj7s7ifMrBh4zsyeAj4OVLv7vWa2HFgOLDuL95d+oj1Rw0vXxy+Z3bNwFkvmTGVb/VEqJ4/R71bM+uzjN7Oi9lU5w/CUE8HD4uDmwELeuTC8ClgU9r2lf12+ojpUPOm05+7ZKS8bxY1Vk1X080Cfhd/d24DtZjalr9d2Z2aDzGwbcIjUZusvAGXu3hC8dwOQdv81M1tqZjVmVnP48OGwHy0h7H3zVKh40mnPXRnosh3OOQF4OViT//H2W18HufsZd68EJgGzzezCbBNz95XuXuXuVaWlpdkeJmdh2rnDQsWTTnvuykCX7aieu9/Nh7j7UTPbBFwNNJrZBHdvMLMJpL4NSIw23r6Aqct77h618fYFMWST//791nlpz5f23JWBoq9RPcPM7HPAJ4APAr9291+23/o4ttTMxgT3hwMfAV4BHgduDl52M/DYu/ovkH6x795rmRismT5x9BD23au15Xuz795ruWTaGAYXwSXTxuh8yYDSV4t/Faldt34FXAPMBD6b5XtPAFaZ2SBSf2Aecfe1ZvY88IiZ3QK8TuqPisTsrjU7OBDsi3rg2GnuemyHptT3QS18Gaj6Kvwz3X0WgJl9F+i+C1dGwfaMH0oTbwLUh5BHMk2pXzJnqkZgiBSgvi7utrTfcXdttVigNKVeJFn6avFf1GmGrgHDg8dGaqj+6Eizk5zQlPqz84Wfbueplxu55oIyvvTxi+JORyRrfc3cHdTb81IYystGMaNsBK82vtURm1E2Qt08veg8qufhF/fz8Iv7dYFXBoxsx/FLAatrPN6l6AO82viWls3N4As/3R4qLpJvVPhFffwhPfVyY6i4SL5R4RfGnlMcKp5011xQFioukm9U+IUjb7eEiiddpgu5usArA4UKv2hUz1nYd++1LJ49iZIRxSyePUkXdmVAyXoHLilc7RtlPPR8182wNaqnd1/6+EV86eNxZyESngq/ANooQyRJVPilQ3nZKBV8kQRQH7+ISMKo8EuHusbjPFpTr4lbIgVOXT0CpJZl7rxC55K5U7Qss0iBUotfMi7LrJa/SGGKrPCb2WQz22hmu83sZTP7bBD/opkdMLNtwe2jUeUg2dGSDSLJEmVXTyvwd+6+1cxGAVvMbEPw3P3u/pUIP1tC0AQukWSJrPC7ewPQENw/bma7gYlRfZ6cvbEjhqQ2WOgUsyAuIoUnJ338ZjaV1DaMLwShz5hZrZl9z8zGZjhmqZnVmFnN4cOHc5FmYu0/cpKRQ7u2AUYOHcz+IydjykhEohR54TezkcBq4HPufgz4NvB+oJLUN4KvpjvO3Ve6e5W7V5WWlkadZqJNGjuclra2LrGWtjYmjR0eU0YiEqVIC7+ZFZMq+j90958CuHuju59x9zbgO8DsKHOQvpWMHMqKGyoYbDDIYLDBihsqKBk5NO7URCQCUY7qMeC7wG53/1qn+IROL/sYsDOqHCR7/7ZxD60OZxxaHb61cU/cKYlIRKIc1TMPuAnYYWbbgtidwKfMrJLUtcR9wK0R5iBZqN51kNfSbL1YvesgC2aOjykrEYlKlKN6niM1OKS7J6P6TDk763el3zJw/a5GFX6RAqSZu8KVM9NvGZgpLiIDmwq/sGDmeGaUjegSm1E2Qq19kQKlRdoEgKdvm0/1roOs39XIlTPLVPRFCpgKv3RYMHO8Cr5IAqirR0QkYVT4RUQSRoVfOmgHLpFkUB+/ANqBSyRJ1OIX7cAlkjAq/KIduEQSRoVftAOXSMKo8AvlZaNYMndKl9iSuVMoLxsVU0YiEiVd3BUA7lk4iyVzprKt/iiVk8eo6IsUMBV+6VBeNkoFPwQtcRGOzld4TSea2X/kJJPGDu/XjZFU+EXOwpX3b+rYw+AnNfuZUTaCp2+bH2tO+UznK7zHth1g2epaiouKaGlrY8UNFVxfObFf3jvKHbgmm9lGM9ttZi+b2WeD+LlmtsHM9gQ/0262LpKvetu4RnrS+Qqv6UQzy1bXcqqljePNrZxqaeP21bU0nWjul/eP8uJuK/B37n4+MAf4azObCSwHqt19OlAdPJY8ULO3ia+tf5WavU1xp5LXetu4RnrS+Qpv/5GTFBd1Lc/FRUXsP3KyX94/ssLv7g3uvjW4fxzYDUwEFgKrgpetAhZFlYNkb/GDm7nxgc1845k6bnxgMzc9uDnulPKWNq4JR+crvEljh9PS1tYl1tLWxqSxw/vl/XMynNPMpgIfAl4Ayty9AVJ/HIDzcpGDZFazt4nn6rq28n9V16SWfwbauCYcna/wSkYOZcUNFQwrLmLU0MEMKy5ixQ0V/XaBN/KLu2Y2ElgNfM7dj5ml24Y37XFLgaUAU6ZM6ePV8m48u+eNjPGqaSU5zmZg0MY14eh8hXd95UTmlY+LZFSPuXu/vVmPNzcrBtYCT7v714LYq8B8d28wswnAJnef0dv7VFVVeU1NTWR5Jl3N3iZufKBn186jt85R4RcZwMxsi7tXdY9HOarHgO8Cu9uLfuBx4Obg/s3AY1HlINmpmlbCpeVdC/yl5SUq+n1Ys7WeT696iTVb6+NOZUBoOtHM9vqj/TYyRc5elF0984CbgB1mti2I3QncCzxiZrcArwOfiDAHydKeQ11X4qw7pJU5ezPnnzZw8NhpAH6x+xD3/fwVnr/zipizyl9RjkmX8KIc1fOcu5u7V7h7ZXB70t2b3H2Bu08Pfr4ZVQ6SnTVb6zuKWLuGY6fVks1A5yucqMekS3gFvUibvlpmZ+2O9BNpMsWTTucrnKjHpEt4BVv4H9t2gHn3PcPiB19g3n3P8Pi2A3GnlLeum5V+hEWmeNLpfIUT9Zh0Ca8gC7++WobT+PtToeJJt+jiyUwYPaRLbMLoISy6eHJMGeW3qMekS3gFuUhb+1fLU7zTymj/aqlftp7W1DZkjN96+fQcZzMwPH/nFazZWs/aHQe5btZ4Ff0+RDkmXcIryMKvr5bhLKqYwO6GnqN4FlVMiCGbgWPRxZNV8EMoGTlUBT9PFGRXT/tXy6GDjXOKBzF0sOmrZS9uvXw6wwd3nVE9fLCptS9SoAqy8AOk5iMbWPBTevXfpp7b5XFVt8fSk1YzDaeu8TiP1tRT16g5InEryK6e9ou7za3vdPfcvrqWeeXj1OpPo7dF2jR7N73FD27uOGffeKaOS8tL+MGn58ScVf66a80OHtr8esfjJXOncM/CWTFmlGwF2eLXuOFwelukTXrSaqbh1DUe71L0AR56/nW1/GNUkIVfF3fDuWz6uFDxpNMfynC21R8NFZfoFWTh17jhcDJ156ibJz39oQyncvKYUHGJXkH28YPGDYfx5Sd2Zox//o8vzHE2+e9Xrx3KGNcfy57Ky0axZO4UHnq+ax9/edmoGLNKtoIt/KBxw9lauzPD2jM7D6rwp/HIlv0Z47dddX6OsxkY7lk4iyVzprKt/iiVk8eo6MesILt6JJzrLsyw9kyGeNJNGnNOqLiklJeN4saqySr6eUCFX/jT2e8NFU+68d3W6ekrLil/8/BLXHDXU/zNwy/FncqAUb3rIMse3U71rv5d+bWgu3okO8/VHc4YV+usp5r634eKC0xdvq7j/hM7D/HE8nXsu/faGDPKf1fev4nXGt8C4Cc1+5lRNoKnb5vfL+8d5daL3zOzQ2a2s1Psi2Z2wMy2BbePRvX5kr2jb7eEiifdmdYzoeJJl6mFr5Z/ZtW7DnYU/XavNr7Vby3/KLt6vg9cnSZ+f+cduSL8fMnSW6dbQ8WTrunt9OclUzzpnnkt/fyGTHGB9bsaQ8XDinLrxWcBbas4AFw1M/1F3EzxpJv1npGh4kn34Q+kn9+QKS5w5cyyUPGw4ri4+xkzqw26gsZmepGZLTWzGjOrOXw4fR+09I+qaSVpV+fUmPT07l50Uah40n1z8X8PFRdYMHM8M8pGdInNKBvBgn5qjOW68H8beD9QCTQAX830Qndf6e5V7l5VWlqao/SSqXrXQU62epfYyVbv95EEhWLS2OEMK+76T2dYcZGWBOnFvnuvpXxc6vyUjxuuC7tZePq2+dxx1Qc4f8Io7rjqA/12YRdyXPjdvdHdz7h7G/AdYHYuP1/Si7o/sdCUjBzKqZaua0GdamnTZMFeTL9jHXVvpBZJrHvjJNPvWNfHEbL4wc3889OvsbvhOP/89Gvc9ODmfnvvnBZ+M+u8pdPHgPRrBUhOzXrP6FDxpPvCT7eHiifd/U/vpqXrF0paPBWX9KJeATbK4Zw/Ap4HZpjZfjO7BVhhZjvMrBa4HLgtqs+X7A0bkn46R6Z40j31cvpvQpniSfdYbfouw0xxiX4F2ChH9XzK3Se4e7G7T3L377r7Te4+y90r3P16d0+/y7fklFZPDOeaC9KPrMgUT7qFFekvSGaKS/QrwGrJBpGQLv9g+gKfKZ50mRau04J2mVVNK+HS8q6j6i4tL+m3kXb6Li+9bpShJRt66u1ieH8NtyskmUaHVe86qPPVix98eg41e5t4ds8bXDZ9XL8Or1aLX9TVE1LUk2sKjUaNnb2qaSX87ZUz+n1OjQq/dGyU0Zk2ysgs6sk1hUZ/KPOPuXvfr4pZVVWV19TUxJ1GwatrPK6NMkKo3nWQ9bsauXJmmYp+H666fxOvdlp0rD9XmpTMzGyLu1f1iKvwi0gu6A9l7mUq/Lq4K3KWmk40a0/nEBbMHK+CnydU+EXOwmPbDrBsdS3FRUW0tLWx4oYKrq+cGHdaIlnRxV2RkJpONLNsdS2nWto43tzKqZY2bl9dS9OJ5rhTE8mKCr9ISPuPnKS4qOs/neKiIvYfORlTRiLhqPCLhDRp7HBa2rquztnS1qZlmWXAUOEXCalk5FBW3FBBcREMKoLiIlhxQ4Uu8Pah6UQz2+uPqkssD+jirshZ+LeNe2hfkv8M8K2Ne3Rxtxe6GJ5f1OIXCal610Fe6zQZCeDVxre0Y1kGuhief1T4RULS2jPh6GJ4/olyI5bvmdkhM9vZKXaumW0wsz3Bz4ybrYvkK609E44uhuefKFv83weu7hZbDlS7+3SgOngsMqBokbZw2i+GDysuYtTQwQwrLtLF8JhFulaPmU0F1rr7hcHjV4H57t4Q7L+7yd1n9PU+WqtH8pHWnglHS1zkXr6s1VPWvt1iUPzPy/RCM1sKLAWYMmVKppeJxEZrz4RTMnKoCn6eyNuLu+6+0t2r3L2qtLQ07nRERApGrgt/Y9DFQ/DzUI4/X0Qk8XJd+B8Hbg7u3ww8luPPFxFJvCiHc/4IeB6YYWb7zewW4F7gCjPbA1wRPBYRkRyK7OKuu38qw1MLovpMERHp24DYetHMDgO/PcvDxwFv9GM6/UV5haO8wlFe4eRrXvDucnuvu/cYHTMgCv+7YWY16caxxk15haO8wlFe4eRrXhBNbnk7nFNERKKhwi8ikjBJKPwr404gA+UVjvIKR3mFk695QQS5FXwfv4iIdJWEFr+IiHSiwi8ikjAFU/jN7DYze9nMdprZj8xsWLfnzcy+YWZ1ZlZrZhfnSV7zzez3ZrYtuN2Vo7w+G+T0spl9Ls3zcZ2vvvLKyfl6NxsJmdnVZvZqcO76dc+Jd5nXPjPbEZy3fl3nPENenwj+P7aZWcbhiDGcr2zzyvX5+hczeyX49/YzMxuT4dh3f77cfcDfgInAXmB48PgR4M+7veajwFOAAXOAF/Ikr/mk9izI5fm6ENgJnENq9vYvgOl5cL6yySsn5wu4DLgY2NkptgJYHtxfDtyX5rhBwH8B7wOGANuBmXHnFTy3DxiXw/N1PjAD2ARUZTgujvPVZ14xna8rgcHB/fui/P0qmBY/qUIx3MwGkyocv+v2/ELgIU/ZDIxpXyk05rzicD6w2d3fdvdW4JfAx7q9Jo7zlU1eOeHuzwJvdgsvBFYF91cBi9IcOhuoc/ffuPtp4MfBcXHnFal0ebn7bnd/tY9Dc36+sswrUhnyWh/83gNsBialObRfzldBFH53PwB8BXgdaAB+7+7ru71sIlDf6fH+IBZ3XgBzzWy7mT1lZhdEmVNgJ3CZmZWY2TmkWveTu70m5+cry7wg9+erXZeNhIB0GwnFcd6yyQvAgfVmtsVSGx3lgzjOV7biPF9/Qeobd3f9cr4KovAHfZoLgWnAe4ARZra4+8vSHBrpWNYs89pKaj2Ni4BvAmuizAlSLR5SXyU3AD8n9XWxtdvLcn6+sswr5+crpJyftxDmufvFwDXAX5vZZXEnhM5XD2b2eVK/9z9M93SaWOjzVRCFH/gIsNfdD7t7C/BT4JJur9lP19bjJKLvdukzL3c/5u4ngvtPAsVmNi7ivHD377r7xe5+GamvnHu6vSSO89VnXnGdr0A2GwnFcd6y2uDI3X8X/DwE/IxUt0HcYvk9y0Yc58vMbgauA/7Mg079bvrlfBVK4X8dmGNm55iZkVr6eXe31zwOLAlGq8wh1e3SEHdeZjY+eA4zm03q/0lTxHlhwX7HZjYF+Djwo24vieN89ZlXXOcrkM1GQi8B081smpkNAT4ZHBdrXmY2wsxGtd8ndSFxZ/fXxSCO89WnOM6XmV0NLAOud/e3M7ysf85XFFes47gBdwOvkPqf8wNgKPCXwF8GzxvwLVJXxHfQy9X8HOf1GeBlUt0am4FLcpTXr4BdwecuCGL5cL76yisn54vUH5wGoIVUK+sWoASoJvUtpBo4N3jte4AnOx37UeC14Nx9Ph/yIjUKZHtwezlHeX0suN8MNAJP58n56jOvmM5XHan++23B7f9Gdb60ZIOISMIUSlePiIhkSYVfRCRhVPhFRBJGhV9EJGFU+EVEEkaFXwQwMzezH3R6PNjMDpvZ2rN8vzFm9ledHs8/2/cS6W8q/CIpbwEXmtnw4PEVwIF38X5jgL/q60UicVDhF3nHU8C1wf1P0WnWsKXWvF8TrJW+2cwqgvgXg7XVN5nZb8zsfwWH3Au8P1jL/V+C2EgzezRYc/2H7TOQRXJNhV/kHT8GPmmpzXIqgBc6PXc38J/uXgHcCTzU6bkPAleRWsvlH8ysmNS6+P/l7pXu/r+D130I+Bwwk9TM0HkR/reIZKTCLxJw91pgKqnW/pPdnv4jUktu4O7PACVm9gfBc+vcvdnd3yC1QFpZho940d33u3sbqSn5U/v1P0AkS4PjTkAkzzxOag+F+aTWwGnX23K4zZ1iZ8j87yrb14lESi1+ka6+B9zj7ju6xZ8F/gxSI3SAN9z9WC/vcxwYFUWCIu+WWhwinbj7fuBf0zz1ReD/mVkt8DbvLIOc6X2azOzXwWbaTwHr+jtXkbOl1TlFRBJGXT0iIgmjwi8ikjAq/CIiCaPCLyKSMCr8IiIJo8IvIpIwKvwiIgnz/wEDeg/76NO6rgAAAABJRU5ErkJggg==", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "new_pumpkins.plot.scatter('Month','Price')" - ] - }, - { - "cell_type": "code", - "execution_count": 170, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 170, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "new_pumpkins.plot.scatter('DayOfYear','Price')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 171, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "-0.14878293554077535\n", - "-0.16673322492745407\n" - ] - } - ], - "source": [ - "print(new_pumpkins['Month'].corr(new_pumpkins['Price']))\n", - "print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price']))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Parece que a correlação é bem pequena, mas há alguma outra relação mais importante - porque os pontos de preço no gráfico acima parecem ter vários clusters distintos. Vamos fazer um gráfico que mostrará diferentes variedades de abóbora:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 172, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "ax=None\n", - "colors = ['red','blue','green','yellow']\n", - "for i,var in enumerate(new_pumpkins['Variety'].unique()):\n", - " ax = new_pumpkins[new_pumpkins['Variety']==var].plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var)" - ] - }, - { - "cell_type": "code", - "execution_count": 173, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 173, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXAAAAGKCAYAAAAVEBpAAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjQuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8rg+JYAAAACXBIWXMAAAsTAAALEwEAmpwYAAAcxklEQVR4nO3df5h3dV3n8ecrwEBEARm4bhW8UxEDfwDekqztpiiFmiGGCW5GZhduLRVpJaX5a7e9bP25musurAiRgqaopGEiF+TiKnrzQ4SQIEMSEG615BbzB/DeP8538sswv+c7c85n5vm4rrnm/PjOzIvx/r488znnfE6qCklSe36s7wCSpOWxwCWpURa4JDXKApekRlngktSoHdfyh+211161efPmtfyRktS8yy677BtVNTVz+5oW+ObNm9m6deta/khJal6Sr862fcEhlCQ7J/l8ki8muSbJ60bbX5vk5iRXjj6eNenQkqS5LeYI/PvAEVX1nSQ7AZckOX+0761V9abViydJmsuCBV7drZrfGa3uNPrw9k1J6tmirkJJskOSK4HbgQuq6tLRrpOSXJXk9CR7rFZISdJ9LarAq+ruqjoYeBhwWJLHAu8CHgkcDNwKvHm2r01yYpKtSbZu27ZtIqElSUu8Dryq/gW4GDiqqm4bFfs9wGnAYXN8zalVtaWqtkxN3ecqGEnSMi3mKpSpJLuPlncBngF8OcmmsZcdA1y9KgklSbNazFUom4Azk+xAV/gfqKqPJTkrycF0JzRvBF66aiklSfexmKtQrgIOmWX7i1YlkSRpUdb0TkwN3+ZTPt53hAXd+IZn9x1BGgQns5KkRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1KjmH6nWwiPAwMeASZo8j8AlqVEWuCQ1asECT7Jzks8n+WKSa5K8brR9zyQXJLl+9HmP1Y8rSZq2mCPw7wNHVNUTgIOBo5I8GTgFuLCq9gcuHK1LktbIggVene+MVncafRRwNHDmaPuZwHNXI6AkaXaLGgNPskOSK4HbgQuq6lJgn6q6FWD0ee85vvbEJFuTbN22bduEYkuSFlXgVXV3VR0MPAw4LMljF/sDqurUqtpSVVumpqaWGVOSNNOSrkKpqn8BLgaOAm5Lsglg9Pn2SYeTJM1tMVehTCXZfbS8C/AM4MvAecAJo5edAHx0lTJKkmaxmDsxNwFnJtmBrvA/UFUfS/JZ4ANJXgLcBDx/FXNKkmZYsMCr6irgkFm2fxN4+mqEkiQtzDsxJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhq1YIEn2TfJRUmuTXJNkt8ZbX9tkpuTXDn6eNbqx5UkTdtxEa+5C3h5VV2eZDfgsiQXjPa9taretHrxJElzWbDAq+pW4NbR8vYk1wIPXe1gkqT5LWkMPMlm4BDg0tGmk5JcleT0JHvM8TUnJtmaZOu2bdtWllaS9G8WXeBJHgB8CDi5qu4A3gU8EjiY7gj9zbN9XVWdWlVbqmrL1NTUyhNLkoBFFniSnejK+71VdS5AVd1WVXdX1T3AacBhqxdTkjTTYq5CCfBu4NqqesvY9k1jLzsGuHry8SRJc1nMVShPAV4EfCnJlaNtfwQcn+RgoIAbgZeuQj5J0hwWcxXKJUBm2fXXk48jSVos78SUpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJatSCBZ5k3yQXJbk2yTVJfme0fc8kFyS5fvR5j9WPK0matpgj8LuAl1fVTwJPBv5zkgOBU4ALq2p/4MLRuiRpjSxY4FV1a1VdPlreDlwLPBQ4Gjhz9LIzgeeuUkZJ0iyWNAaeZDNwCHApsE9V3QpdyQN7TzydJGlOiy7wJA8APgScXFV3LOHrTkyyNcnWbdu2LSejJGkWiyrwJDvRlfd7q+rc0ebbkmwa7d8E3D7b11bVqVW1paq2TE1NTSKzJInFXYUS4N3AtVX1lrFd5wEnjJZPAD46+XiSpLnsuIjXPAV4EfClJFeOtv0R8AbgA0leAtwEPH9VEkqSZrVggVfVJUDm2P30ycaRJC2Wd2JKUqMscElqlAUuSY2ywCWpURa4JDXKApekRi3mOnBJy7D5lI/3HWFRbnzDs/uOoGXyCFySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjXIyK0lNcHKw+/IIXJIaZYFLUqMWLPAkpye5PcnVY9tem+TmJFeOPp61ujElSTMt5gj8DOCoWba/taoOHn389WRjSZIWsmCBV9WngW+tQRZJ0hKsZAz8pCRXjYZY9pjrRUlOTLI1ydZt27at4MdJksYtt8DfBTwSOBi4FXjzXC+sqlOraktVbZmamlrmj5MkzbSsAq+q26rq7qq6BzgNOGyysSRJC1lWgSfZNLZ6DHD1XK+VJK2OBe/ETHI28FRgryRfA14DPDXJwUABNwIvXb2IkqTZLFjgVXX8LJvfvQpZJElL4J2YktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY1asMCTnJ7k9iRXj23bM8kFSa4ffd5jdWNKkmZazBH4GcBRM7adAlxYVfsDF47WJUlraMECr6pPA9+asflo4MzR8pnAcycbS5K0kOWOge9TVbcCjD7vPdcLk5yYZGuSrdu2bVvmj5MkzbTqJzGr6tSq2lJVW6amplb7x0nShrHcAr8tySaA0efbJxdJkrQYyy3w84ATRssnAB+dTBxJ0mIt5jLCs4HPAgck+VqSlwBvAI5Mcj1w5GhdkrSGdlzoBVV1/By7nj7hLJKkJfBOTElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGLfhU+vkkuRHYDtwN3FVVWyYRSpK0sBUV+MjTquobE/g+kqQlcAhFkhq10gIv4JNJLkty4iQCSZIWZ6VDKE+pqluS7A1ckOTLVfXp8ReMiv1EgP3222+FP06SNG1FR+BVdcvo8+3Ah4HDZnnNqVW1paq2TE1NreTHSZLGLLvAk+yaZLfpZeBngasnFUySNL+VDKHsA3w4yfT3eV9VfWIiqSRJC1p2gVfVV4AnTDCLJGkJvIxQkhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1akUFnuSoJNcluSHJKZMKJUla2LILPMkOwDuBZwIHAscnOXBSwSRJ81vJEfhhwA1V9ZWq+gFwDnD0ZGJJkhaSqlreFybHAkdV1a+P1l8E/FRVnTTjdScCJ45WDwCuW37cNbMX8I2+Q6wj/j4nx9/lZLXy+3x4VU3N3LjjCr5hZtl2n/83qKpTgVNX8HPWXJKtVbWl7xzrhb/PyfF3OVmt/z5XMoTyNWDfsfWHAbesLI4kabFWUuBfAPZP8hNJ7gccB5w3mViSpIUsewilqu5KchLwN8AOwOlVdc3EkvWrqSGfBvj7nBx/l5PV9O9z2ScxJUn98k5MSWqUBS5JjbLAJalRG77Akzxwnn37rWUWaS5JHpzkmCRP7DtLi5J8YGz5T2fs++TaJ5qMDV/gwMXTC0kunLHvI2uapHHr9U3ShyQfS/LY0fIm4Grg14CzkpzcZ7ZG7T+2fOSMffe5w7EVFvi97yjdc559Wti6fJP05Ceq6urR8ouBC6rqOcBP0RW5lma+y+2avRRvJbfSrxc1x/Js65rfunyT9OSHY8tPB04DqKrtSe7pJ1LT7p/kELqD1l1Gyxl97NJrshWwwGHvJC+j+x9yepnRukeNS7Mu3yQ9+ackv0U3ZcWhwCcAkuwC7NRnsEZ9HXjLLMvT603a8DfyJHnNfPur6nVrlaV1SS6ab39VPW2tsrQuyd7A64FNwDur6pOj7U8DnlhVb+ozn4Zhwxf4fJKcXFVv6zuHNC7JjlV1V985WpJkf+CNwKOALwG/V1U395tq5TyJOb+XLfwSLSTJkUku6DtHS5JcMrZ81ozdn1/jOOvB6cDHgV8ELgfe0W+cybDA5+dVKEuQ5Igkf5/kO0n+IsmBSbYCbwDe1Xe+xuw6tnzQjH3+u1y63arqtKq6rqreCGzuO9AkeBJzfo4vLc2b6Z6+9Fm6Z6V+DvjjqvofvaZqk1f0TNbOYyfV4d4n2amqy3tLtgIbvsCTbGf2N0SA+69xnNZVVV08Wv5Ikm2W97LtnuQYur+Sd0/yvNH2AA/qL1azZrvyZHq9gCPWPNEEeBJTE5PkK8DvjW160/h6VZ275qEaleQ98+2vqhevVZb1IMkDq+qOvnNMmgU+iyS7As8FXlhVz+45TjMWKJ2qKu8gVC+S/APwyqo6p+8sk2SBj4weC/cs4IXAUcCHgHOr6q96DaYNaeyGsllV1Vvm2697S/Jw4G3AA4DfqKob+k00GY6BJ0cCxwM/B1wEnAUc5p+oSzdL6RTwDeCSqvrHHiK1bLe+A6wnVfVV4JgkRwGfSfIF4J6x/b/QW7gV2PAFTvdMz/8L/PR0ySTxxNvyzFY6m4FXJnntevvzdZV9s6r+rO8Q60mSA4A/oHu/v5OxAm/Vhh9CGV1KdBxwLPAV4Bzg1VX18F6DrSNJ9gQ+VVWH9p2lFUku9/c1OUneAPwC8PKqOr/vPJOy4W/kqaorquoVVfVI4LXAIcD9kpyf5MR+060PVfUtvPlE/doCHLqeyhss8Hs9aKCqPlNVJwEPpTvhcXhfudaTJEcA/9x3jsY8Pskds3xsT7LuLodbA3tW1ff6DjFpjoHPMmVsVd1DNzb+N2sfp11JvsR9b4raE7gF+JW1T9S0L1XVIX2H0LBZ4PCgsbvc7sObT5bkecAPxtaL7mTcnT3lkaY9Isl5c+30KpR2PQj4eWYfoy3AAl+893vibWL+su8A68w2url61hULHG7yDsGJ8UTl5Bw8vZDkT6vqFWPrn6yqn+0lVbu2V9Xf9h1i0ixwZ3abpKn57iD07sEledTY8pHAK8bWfdTf0t3Yd4DVYIHDt9brRDc92IHuVmWPxFeXBx1LVFVznudqmQUOnwQuS/Kaqnpf32Ead2tVvb7vEOuED4jWgjb8nZgASR5KNzfwXnRPjhmfI8GTmIuU5IrZLn1Lsi9w3OhJKFqEJBczz5G2D4gWeAQOQFXdnOTjwJ8Az+FHBe5VKEvz9OmFJHsBz6ebKOxh+Htckqp6at8Z1pMkv1xVfzFafkpVfWZs30mtzjuz4Y/AkxxEd9R9C/C7VXVrz5GalWQ34Bi6KXkfDXwYeEFVPazXYA2a794E8C/DpRqfW2bmPDMtzzvjETh8EDi5qu5z12WSXb0JZUlup3ti+qvoppCt0WPBtHTPmWeffxkuXeZYnm29GRZ4d73tXkm2AFdV1Q+S7A2cDPwq8JD+ojXnj+hmdnwX8L4k7+85T7Ocj37iao7l2dabseEnswL+E3Al8A7gc0lOAK6lO9P/xB5zNaeq3lpVP0U3bWeAjwAPSfKKJI/uNVyDkuwwOpcwvX6/JCcmubbPXI16TJKrRvP1TC9Prx/Qd7jlcgw8+Tu6hzl8K8l+wA3Af6iqz/UcbV1I8ji6MfFfGk3Zq0VIchzwv4E7gevppjo+C/gC8F+q6vL+0rVn9Ei1OY2e2NMcC/y+JzSurqrH9plJSnI18NyquiHJocBn6S7F/HDP0TQgFnhyO91TeKYdN75eVb+95qEalWQ7s48nhu6p9A9c40jNmuXA4stV9Zg+M7Vs7N/m9AnL6X+nTf/b9CQm/P6M9ct6SbEOVJUP4p2cvWfMK/OA8XXnlVma9fpvc8MfgUtDlOQ18+wupyxYmiQ7012w8CjgKuD0qrqr31Qrt+ELPMlfMf8ty01O9N6HWf5MZbS+I3C/qvIvvglI8qSq+kLfOVoyuqT1h3RPpH8m8NWq+p1+U62cbyh4U98B1ouZf6aO7sz8TeCldHdlapmSHEh3fuZ44Nt0D+nV4h1YVY8DSPJuuhvOmrfhC3yuSd6nJ2AC1t0k8Kstye50N0L9CvA+4ElV9c0+M7VodOnb8aOPu4CHA1uq6sY+czXqh9MLVXVX0uzNl/ey4Qt83IwJmB6KR41LMvr9vRx4AXA6cEhVfbvfVG1K8v/oHvd3DnBsVV2f5B8t72V7QpLpOf9DN0XvHXgVStvmmIDpEU7AtCxfpXv24HuA7wIvGT/S8cqJJdlGN4vjPnRP4Lmehm/57ltV7dB3htWw4QscJ2CapDfyo5JZl5dtrZWqOjrJg4BfBF6X5FHA7kkOq6p1MX6rlfMqlOR36ca6d6Ubr30/cEFVPaLXYNrQkuxUVT8cW9+bbmjqeGDfqtq3t3AajA1f4NOSPILuzXEcsD/wGuDDVfX3vQZrSJK3z7ffu1oXb3SH8EeBs4GLauyNmuThrc7docna8AWeZL+qumnGtsfRlfkLnIBp8UYzOc6pqs5cqyytS/Jg4Fh+dEDxQeDsqrq012AaFAv83k/q+FBV/WLfmaRxSR5Cd3XUccDewDlV9cp+U2kILPCxB/HO9VBeLU6S8+bb712ty5fkAcDzgJcBm6pqn54jaQC8CmX+J3VoaQ4H/olu3PZSGn5U1RCM5u94Dt1w3lOATwB/CHyyz1waDo/Ak7vpJs0P3VN4vju9i4Yv8O9Dkh2AI+kK5/HAx+nGba/pNViDkrwPeAbwabqbeT5WVd/rN5WGZsMXuFZHkh+nK/I3Aq+vqnf0HKkpoxPC51bV9r6zaLgscE3UqLifTVfem4Hz6KbuvLnPXNJ6ZIFrYpKcCTwWOJ/uSomre44krWsWuCYmyT105xPg3ieEPZ8grQILXBqgJM+bb39VnbtWWTRcFrg0QKO/Zq4cfcCMpxxV1a+tdSYNjwUuDdBoRswX0D3D8aN0l2Pe0G8qDY0FLg1Ykl2Bo+nK/MHAK+d6ipQ2nh/rO4CkeX2P7hmYd9BNebxzv3E0JB6BSwOU5Gl019IfBnyK7rLMrf2m0tBY4NIAjU5iXgVcQndJ5r3eqM6tLnAyK2moXtx3AA2fR+DSwI2mkq2qunPBF2tD8SSmNFBJfiPJTcBXgZuSfDXJb/adS8NhgUsDlORVdHOBP7WqHlxVDwaeBjxztE9yCEUaoiTXAU+YOQd4kl2AL1bVo/tJpiHxCFwaqNke4FBV/wrc00McDZAFLg3T15I8febGJEcAt/aQRwPkEIo0QEkOopsD5RLgMrrrwJ9E92zMo31MncAClwZr9FDjFwIH0c1GeA3wXp+NqWneyCMNVFV9L8lFwO10R+DXWt4a5xG4NEBJHgj8H+CJdHOC/xjwBLrhlJdU1R39pdNQWODSACU5A7gReH1V3TPaFuCPgUdV1a/0l05DYYFLA5Tk+qraf6n7tLF4GaE0TFn4JdroLHBpmD6T5NWjYZN/k+SPgc/1lEkD4xCKNECjk5jvBg6lO4lZwCHAFXQnMb/dXzoNhQUuDViSRwIHMroOvKr+IcnJVfW2fpNpCCxwqTFJbqqq/frOof45Bi61xxOcAixwqUX+2SzAW+mlQUqyndmLOsAuaxxHA+UYuCQ1yiEUqSFJdk/yyr5zaBgscGmAkuyb5NQkH0vy60nun+TNwPXA3n3n0zA4Bi4N058Dfwt8CDiK7u7La4DHVdXX+wym4XAMXBqgJF+sqieMrd8G7FdV3+8xlgbGI3BpoJLswY+u+f46cP8kuwJU1bd6C6bB8AhcGqAkN9I9fX62m3aqqh6xtok0RBa4JDXKIRRpgJIcOt/+qrp8rbJouDwClwZo9DDjuVRVHbFmYTRYFrgkNcobeaQBSvIHY8vPn7Hvv619Ig2RBS4N03Fjy384Y99RaxlEw2WBS8OUOZZnW9cGZYFLw1RzLM+2rg3Kk5jSACW5G7iTH83//d3pXcDOVbVTX9k0HBa4JDXKG3mkAUqy53z7nQtF4BG4NEhJ/pFurDvAJuAWfnTy0rlQBFjg0uAluaKqDuk7h4bHq1Ck4fMoS7OywCWpUZ7ElAYoycvGVveesU5VvWWNI2mALHBpmHYbWz5txroEeBJTkprlGLgkNcoCl6RGWeCS1ChPYkoDleQA4ETgMaNN1wKnVdV1/aXSkHgELg1QksOBi4HtwKl0V6LcCVyU5Mk9RtOAeBWKNEBJzgf+tKounrH9Z4BTquqZvQTToFjg0gAl+fuqevQc+66rqgPWOpOGxyEUaZi2z7PvzjVLoUHzJKY0TPsmefss2wM8dK3DaJgscGmYfn+efVvXLIUGzTFwqTFJdqyqu/rOof45Bi4NUJJLxpbPmrH782scRwNlgUvDtOvY8kEz9gUJC1waqvnGNh33FOBJTGmodk9yDN1B1u5JnjfaHuBB/cXSkHgSUxqgJGcwz5F2Vb147dJoqCxwSWqUY+DSACV5R5L7PEYtyWOSfKqPTBoeC1wapq8DVyZ5IUCS+yf578B5wDt7TabBcAhFGqgkPwH8Gd0DjR8CfAD4r1X13V6DaTA8ApeGa/roake69+q1lrfGWeDSACV5FfAp4M+r6t8B/x44OsnfJjmw33QaCq8Dl4ZpCjikqrYDVNXNwLFJngl8CPjJPsNpGBwDlxqT5Mer6vt951D/PAKXBmiOucDH/faaBNGgWeDSMF3WdwANn0MoktQoj8ClAUpy3nz7q+oX1iqLhssCl4bpcOCfgLOBS3EOcM3CIRRpgJLsABwJHA88Hvg4cHZVXdNrMA2KN/JIA1RVd1fVJ6rqBODJwA3AxUl+q+doGhCHUKSBSvLjwLPpjsI3A28Hzu0zk4bFIRRpgJKcCTwWOB84p6qu7jmSBsgClwYoyT3AnaPV8TdpgKqqB659Kg2NBS5JjfIkpiQ1ygKXpEZZ4JLUKAtczUtycZKfm7Ht5CT/c5Ff//okz1jgNb+a5CErySlNmgWu9eBs4LgZ244bbZ9Xkh2q6tVVtdCT3n+V7rmU0mBY4FoPPgj8/OjGF5JspivbFybZmuSaJK+bfnGSG5O8OsklwPOTnJHk2NG+J44eW3ZZkr9Jsmm0bwvw3iRXJnl2kg+Pfb8jk3iDjdacBa7mVdU3gc8DR402HQe8H3hlVW2hm0vkZ5I8fuzLvldVP11V50xvSLIT8A7g2Kp6InA68CdV9UFgK/Afq+pg4K+Bn0wyNfrSFwPvWbX/QGkOFrjWi/FhlOnhk19KcjlwBXAQMP4w4PfP8j0OoLv78YIkVwKvAh4280XV3TxxFvDLSXanmznw/In8V0hL4FwoWi8+ArwlyaHALsA/A78HPKmq/jnJGcDOY6+/8z7fobvL8ZqqOnwRP+89wF8B3wP+sqruWkF2aVk8Ate6UFXfAS6mG/Y4G3ggXUl/O8k+wDMX8W2uA6aSHA7dkEqSg0b7tgO7jf28W4Bb6I7Sz5jMf4W0NB6Baz05m262vuOq6stJrgCuAb4CfGahL66qH4xOWL49yYPo3h9vG32PM4D/leRfgcOr6l+B9wJTVfV3q/EfIy3EuVCkZUryZ8AVVfXuvrNoY7LApWVIchndEM2RVfX9vvNoY7LAJalRnsSUpEZZ4JLUKAtckhplgUtSoyxwSWrU/wdO32Yxjk19aAAAAABJRU5ErkJggg==", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 174, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "-0.2669192282197318\n" - ] - }, - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 174, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE']\n", - "print(pie_pumpkins['DayOfYear'].corr(pie_pumpkins['Price']))\n", - "pie_pumpkins.plot.scatter('DayOfYear','Price')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Linear\n", - "\n", - "Usaremos o Scikit Learn para treinar um modelo de regressão linear:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 175, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.linear_model import LinearRegression\n", - "from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error\n", - "from sklearn.model_selection import train_test_split" - ] - }, - { - "cell_type": "code", - "execution_count": 176, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.77 (17.2%)\n" - ] - } - ], - "source": [ - "X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1)\n", - "y = pie_pumpkins['Price']\n", - "\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n", - "lin_reg = LinearRegression()\n", - "lin_reg.fit(X_train,y_train)\n", - "\n", - "pred = lin_reg.predict(X_test)\n", - "\n", - "mse = np.sqrt(mean_squared_error(y_test,pred))\n", - "print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 177, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "[]" - ] - }, - "execution_count": 177, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.scatter(X_test,y_test)\n", - "plt.plot(X_test,pred)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "A inclinação da linha pode ser determinada a partir dos coeficientes de regressão linear:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 178, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "(array([-0.01751876]), 21.133734359909326)" - ] - }, - "execution_count": 178, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "lin_reg.coef_, lin_reg.intercept_" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 179, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array([16.64893156])" - ] - }, - "execution_count": 179, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Pumpkin price on programmer's day\n", - "\n", - "lin_reg.predict([[256]])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Polinomial\n", - "\n", - "Às vezes, a relação entre as características e os resultados é inerentemente não linear. Por exemplo, os preços de abóboras podem ser altos no inverno (meses=1,2), depois caírem no verão (meses=5-7) e subirem novamente. A regressão linear não consegue capturar essa relação com precisão.\n", - "\n", - "Nesse caso, podemos considerar adicionar características extras. Uma maneira simples é usar polinômios das características de entrada, o que resultaria em **regressão polinomial**. No Scikit Learn, podemos pré-computar automaticamente características polinomiais usando pipelines:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 180, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.73 (17.0%)\n", - "Model determination: 0.07639977655280217\n" - ] - }, - { - "data": { - "text/plain": [ - "[]" - ] - }, - "execution_count": 180, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "from sklearn.preprocessing import PolynomialFeatures\n", - "from sklearn.pipeline import make_pipeline\n", - "\n", - "pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression())\n", - "\n", - "pipeline.fit(X_train,y_train)\n", - "\n", - "pred = pipeline.predict(X_test)\n", - "\n", - "mse = np.sqrt(mean_squared_error(y_test,pred))\n", - "print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n", - "\n", - "score = pipeline.score(X_train,y_train)\n", - "print('Model determination: ', score)\n", - "\n", - "plt.scatter(X_test,y_test)\n", - "plt.plot(sorted(X_test),pipeline.predict(sorted(X_test)))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Codificando variedades\n", - "\n", - "No mundo ideal, queremos ser capazes de prever os preços de diferentes variedades de abóbora usando o mesmo modelo. Para levar a variedade em consideração, primeiro precisamos convertê-la para uma forma numérica, ou seja, **codificar**. Existem várias maneiras de fazer isso:\n", - "\n", - "* Codificação numérica simples, que cria uma tabela com as diferentes variedades e, em seguida, substitui o nome da variedade por um índice nessa tabela. Essa não é a melhor ideia para regressão linear, porque a regressão linear considera o valor numérico do índice, e esse valor numérico provavelmente não terá uma correlação direta com o preço.\n", - "* Codificação one-hot, que substitui a coluna `Variety` por 4 colunas diferentes, uma para cada variedade, que conterão 1 se a linha correspondente for da variedade em questão, e 0 caso contrário.\n", - "\n", - "O código abaixo mostra como podemos realizar a codificação one-hot de uma variedade:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 181, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
FAIRYTALEMINIATUREMIXED HEIRLOOM VARIETIESPIE TYPE
700001
710001
720001
730001
740001
...............
17380100
17390100
17400100
17410100
17420100
\n", - "

415 rows × 4 columns

\n", - "
" - ], - "text/plain": [ - " FAIRYTALE MINIATURE MIXED HEIRLOOM VARIETIES PIE TYPE\n", - "70 0 0 0 1\n", - "71 0 0 0 1\n", - "72 0 0 0 1\n", - "73 0 0 0 1\n", - "74 0 0 0 1\n", - "... ... ... ... ...\n", - "1738 0 1 0 0\n", - "1739 0 1 0 0\n", - "1740 0 1 0 0\n", - "1741 0 1 0 0\n", - "1742 0 1 0 0\n", - "\n", - "[415 rows x 4 columns]" - ] - }, - "execution_count": 181, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.get_dummies(new_pumpkins['Variety'])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Linear em Variedade\n", - "\n", - "Agora usaremos o mesmo código mencionado acima, mas, em vez de `DayOfYear`, utilizaremos nossa variedade codificada em one-hot como entrada:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 182, - "metadata": {}, - "outputs": [], - "source": [ - "X = pd.get_dummies(new_pumpkins['Variety'])\n", - "y = new_pumpkins['Price']" - ] - }, - { - "cell_type": "code", - "execution_count": 183, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 5.24 (19.7%)\n", - "Model determination: 0.774085281105197\n" - ] - } - ], - "source": [ - "def run_linear_regression(X,y):\n", - " X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n", - " lin_reg = LinearRegression()\n", - " lin_reg.fit(X_train,y_train)\n", - "\n", - " pred = lin_reg.predict(X_test)\n", - "\n", - " mse = np.sqrt(mean_squared_error(y_test,pred))\n", - " print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n", - "\n", - " score = lin_reg.score(X_train,y_train)\n", - " print('Model determination: ', score)\n", - "\n", - "run_linear_regression(X,y)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Podemos também tentar usar outras características da mesma maneira e combiná-las com características numéricas, como `Month` ou `DayOfYear`:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 184, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.84 (10.5%)\n", - "Model determination: 0.9401096672643048\n" - ] - } - ], - "source": [ - "X = pd.get_dummies(new_pumpkins['Variety']) \\\n", - " .join(new_pumpkins['Month']) \\\n", - " .join(pd.get_dummies(new_pumpkins['City'])) \\\n", - " .join(pd.get_dummies(new_pumpkins['Package']))\n", - "y = new_pumpkins['Price']\n", - "\n", - "run_linear_regression(X,y)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Polinomial\n", - "\n", - "A regressão polinomial também pode ser usada com características categóricas que foram codificadas em one-hot. O código para treinar a regressão polinomial seria essencialmente o mesmo que vimos acima.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 185, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.23 (8.25%)\n", - "Model determination: 0.9652870784724543\n" - ] - } - ], - "source": [ - "from sklearn.preprocessing import PolynomialFeatures\n", - "from sklearn.pipeline import make_pipeline\n", - "\n", - "pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression())\n", - "\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n", - "\n", - "pipeline.fit(X_train,y_train)\n", - "\n", - "pred = pipeline.predict(X_test)\n", - "\n", - "mse = np.sqrt(mean_squared_error(y_test,pred))\n", - "print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n", - "\n", - "score = pipeline.score(X_train,y_train)\n", - "print('Model determination: ', score)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5" - }, - "kernelspec": { - "display_name": "Python 3.7.0 64-bit ('3.7')", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.9.5" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "d77bd89ae7e79780c68c58bab91f13f8", - "translation_date": "2025-08-29T22:47:23+00:00", - "source_file": "2-Regression/3-Linear/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/2-Regression/4-Logistic/README.md b/translations/br/2-Regression/4-Logistic/README.md deleted file mode 100644 index c61dbdc50..000000000 --- a/translations/br/2-Regression/4-Logistic/README.md +++ /dev/null @@ -1,414 +0,0 @@ - -# Regressão logística para prever categorias - -![Infográfico de regressão logística vs. regressão linear](../../../../2-Regression/4-Logistic/images/linear-vs-logistic.png) - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta aula está disponível em R!](../../../../2-Regression/4-Logistic/solution/R/lesson_4.html) - -## Introdução - -Nesta última aula sobre Regressão, uma das técnicas básicas _clássicas_ de ML, vamos explorar a Regressão Logística. Você usaria essa técnica para descobrir padrões e prever categorias binárias. Este doce é chocolate ou não? Esta doença é contagiosa ou não? Este cliente escolherá este produto ou não? - -Nesta aula, você aprenderá: - -- Uma nova biblioteca para visualização de dados -- Técnicas de regressão logística - -✅ Aprofunde seu entendimento sobre como trabalhar com este tipo de regressão neste [módulo de aprendizado](https://docs.microsoft.com/learn/modules/train-evaluate-classification-models?WT.mc_id=academic-77952-leestott) - -## Pré-requisito - -Depois de trabalhar com os dados de abóbora, já estamos suficientemente familiarizados para perceber que há uma categoria binária com a qual podemos trabalhar: `Color`. - -Vamos construir um modelo de regressão logística para prever, com base em algumas variáveis, _qual é a cor provável de uma determinada abóbora_ (laranja 🎃 ou branca 👻). - -> Por que estamos falando de classificação binária em uma aula sobre regressão? Apenas por conveniência linguística, já que a regressão logística é [na verdade um método de classificação](https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression), embora baseado em linearidade. Aprenda sobre outras formas de classificar dados no próximo grupo de aulas. - -## Definir a pergunta - -Para nossos propósitos, vamos expressar isso como um binário: 'Branca' ou 'Não Branca'. Há também uma categoria 'listrada' em nosso conjunto de dados, mas há poucas instâncias dela, então não a utilizaremos. Ela desaparece quando removemos valores nulos do conjunto de dados, de qualquer forma. - -> 🎃 Curiosidade: às vezes chamamos abóboras brancas de abóboras 'fantasma'. Elas não são muito fáceis de esculpir, então não são tão populares quanto as laranjas, mas têm uma aparência interessante! Assim, poderíamos reformular nossa pergunta como: 'Fantasma' ou 'Não Fantasma'. 👻 - -## Sobre regressão logística - -A regressão logística difere da regressão linear, que você aprendeu anteriormente, em alguns aspectos importantes. - -[![ML para iniciantes - Entendendo a Regressão Logística para Classificação de Machine Learning](https://img.youtube.com/vi/KpeCT6nEpBY/0.jpg)](https://youtu.be/KpeCT6nEpBY "ML para iniciantes - Entendendo a Regressão Logística para Classificação de Machine Learning") - -> 🎥 Clique na imagem acima para um breve vídeo sobre regressão logística. - -### Classificação binária - -A regressão logística não oferece os mesmos recursos que a regressão linear. A primeira oferece uma previsão sobre uma categoria binária ("branca ou não branca"), enquanto a segunda é capaz de prever valores contínuos, por exemplo, dado a origem de uma abóbora e o tempo de colheita, _quanto seu preço aumentará_. - -![Modelo de classificação de abóbora](../../../../2-Regression/4-Logistic/images/pumpkin-classifier.png) -> Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -### Outras classificações - -Existem outros tipos de regressão logística, incluindo multinomial e ordinal: - -- **Multinomial**, que envolve mais de uma categoria - "Laranja, Branca e Listrada". -- **Ordinal**, que envolve categorias ordenadas, útil se quisermos ordenar nossos resultados logicamente, como nossas abóboras que são ordenadas por um número finito de tamanhos (mini, pequeno, médio, grande, extra grande, extra extra grande). - -![Regressão multinomial vs ordinal](../../../../2-Regression/4-Logistic/images/multinomial-vs-ordinal.png) - -### As variáveis NÃO precisam ser correlacionadas - -Lembra como a regressão linear funcionava melhor com variáveis mais correlacionadas? A regressão logística é o oposto - as variáveis não precisam estar alinhadas. Isso funciona para este conjunto de dados, que tem correlações relativamente fracas. - -### Você precisa de muitos dados limpos - -A regressão logística fornecerá resultados mais precisos se você usar mais dados; nosso pequeno conjunto de dados não é ideal para esta tarefa, então tenha isso em mente. - -[![ML para iniciantes - Análise e Preparação de Dados para Regressão Logística](https://img.youtube.com/vi/B2X4H9vcXTs/0.jpg)](https://youtu.be/B2X4H9vcXTs "ML para iniciantes - Análise e Preparação de Dados para Regressão Logística") - -> 🎥 Clique na imagem acima para um breve vídeo sobre preparação de dados para regressão linear. - -✅ Pense nos tipos de dados que se adaptariam bem à regressão logística. - -## Exercício - organizar os dados - -Primeiro, limpe os dados, removendo valores nulos e selecionando apenas algumas colunas: - -1. Adicione o seguinte código: - - ```python - - columns_to_select = ['City Name','Package','Variety', 'Origin','Item Size', 'Color'] - pumpkins = full_pumpkins.loc[:, columns_to_select] - - pumpkins.dropna(inplace=True) - ``` - - Você sempre pode dar uma olhada no seu novo dataframe: - - ```python - pumpkins.info - ``` - -### Visualização - gráfico categórico - -Agora você carregou o [notebook inicial](../../../../2-Regression/4-Logistic/notebook.ipynb) com os dados de abóbora novamente e os limpou para preservar um conjunto de dados contendo algumas variáveis, incluindo `Color`. Vamos visualizar o dataframe no notebook usando uma biblioteca diferente: [Seaborn](https://seaborn.pydata.org/index.html), que é construída sobre o Matplotlib que usamos anteriormente. - -Seaborn oferece algumas maneiras interessantes de visualizar seus dados. Por exemplo, você pode comparar distribuições dos dados para cada `Variety` e `Color` em um gráfico categórico. - -1. Crie tal gráfico usando a função `catplot`, com os dados de abóbora `pumpkins`, e especificando um mapeamento de cores para cada categoria de abóbora (laranja ou branca): - - ```python - import seaborn as sns - - palette = { - 'ORANGE': 'orange', - 'WHITE': 'wheat', - } - - sns.catplot( - data=pumpkins, y="Variety", hue="Color", kind="count", - palette=palette, - ) - ``` - - ![Uma grade de dados visualizados](../../../../2-Regression/4-Logistic/images/pumpkins_catplot_1.png) - - Observando os dados, você pode ver como os dados de `Color` se relacionam com `Variety`. - - ✅ Dado este gráfico categórico, quais são algumas explorações interessantes que você pode imaginar? - -### Pré-processamento de dados: codificação de características e rótulos - -Nosso conjunto de dados de abóboras contém valores de string para todas as suas colunas. Trabalhar com dados categóricos é intuitivo para humanos, mas não para máquinas. Algoritmos de aprendizado de máquina funcionam bem com números. É por isso que a codificação é uma etapa muito importante na fase de pré-processamento de dados, pois nos permite transformar dados categóricos em dados numéricos, sem perder nenhuma informação. Uma boa codificação leva à construção de um bom modelo. - -Para codificação de características, existem dois tipos principais de codificadores: - -1. Codificador ordinal: é adequado para variáveis ordinais, que são variáveis categóricas cujos dados seguem uma ordem lógica, como a coluna `Item Size` em nosso conjunto de dados. Ele cria um mapeamento de forma que cada categoria seja representada por um número, que é a ordem da categoria na coluna. - - ```python - from sklearn.preprocessing import OrdinalEncoder - - item_size_categories = [['sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo']] - ordinal_features = ['Item Size'] - ordinal_encoder = OrdinalEncoder(categories=item_size_categories) - ``` - -2. Codificador categórico: é adequado para variáveis nominais, que são variáveis categóricas cujos dados não seguem uma ordem lógica, como todas as características diferentes de `Item Size` em nosso conjunto de dados. É uma codificação one-hot, o que significa que cada categoria é representada por uma coluna binária: a variável codificada é igual a 1 se a abóbora pertence àquela `Variety` e 0 caso contrário. - - ```python - from sklearn.preprocessing import OneHotEncoder - - categorical_features = ['City Name', 'Package', 'Variety', 'Origin'] - categorical_encoder = OneHotEncoder(sparse_output=False) - ``` - -Então, `ColumnTransformer` é usado para combinar múltiplos codificadores em uma única etapa e aplicá-los às colunas apropriadas. - -```python - from sklearn.compose import ColumnTransformer - - ct = ColumnTransformer(transformers=[ - ('ord', ordinal_encoder, ordinal_features), - ('cat', categorical_encoder, categorical_features) - ]) - - ct.set_output(transform='pandas') - encoded_features = ct.fit_transform(pumpkins) -``` - -Por outro lado, para codificar o rótulo, usamos a classe `LabelEncoder` do scikit-learn, que é uma classe utilitária para ajudar a normalizar rótulos de forma que contenham apenas valores entre 0 e n_classes-1 (aqui, 0 e 1). - -```python - from sklearn.preprocessing import LabelEncoder - - label_encoder = LabelEncoder() - encoded_label = label_encoder.fit_transform(pumpkins['Color']) -``` - -Depois de codificar as características e o rótulo, podemos mesclá-los em um novo dataframe `encoded_pumpkins`. - -```python - encoded_pumpkins = encoded_features.assign(Color=encoded_label) -``` - -✅ Quais são as vantagens de usar um codificador ordinal para a coluna `Item Size`? - -### Analisar relações entre variáveis - -Agora que pré-processamos nossos dados, podemos analisar as relações entre as características e o rótulo para ter uma ideia de quão bem o modelo será capaz de prever o rótulo com base nas características. - -A melhor maneira de realizar esse tipo de análise é plotando os dados. Usaremos novamente a função `catplot` do Seaborn para visualizar as relações entre `Item Size`, `Variety` e `Color` em um gráfico categórico. Para melhor plotar os dados, usaremos a coluna codificada `Item Size` e a coluna não codificada `Variety`. - -```python - palette = { - 'ORANGE': 'orange', - 'WHITE': 'wheat', - } - pumpkins['Item Size'] = encoded_pumpkins['ord__Item Size'] - - g = sns.catplot( - data=pumpkins, - x="Item Size", y="Color", row='Variety', - kind="box", orient="h", - sharex=False, margin_titles=True, - height=1.8, aspect=4, palette=palette, - ) - g.set(xlabel="Item Size", ylabel="").set(xlim=(0,6)) - g.set_titles(row_template="{row_name}") -``` - -![Um gráfico categórico de dados visualizados](../../../../2-Regression/4-Logistic/images/pumpkins_catplot_2.png) - -### Usar um gráfico de dispersão - -Como `Color` é uma categoria binária (Branca ou Não), ela precisa de '[uma abordagem especializada](https://seaborn.pydata.org/tutorial/categorical.html?highlight=bar) para visualização'. Existem outras maneiras de visualizar a relação dessa categoria com outras variáveis. - -Você pode visualizar variáveis lado a lado com gráficos do Seaborn. - -1. Experimente um gráfico de dispersão ('swarm plot') para mostrar a distribuição de valores: - - ```python - palette = { - 0: 'orange', - 1: 'wheat' - } - sns.swarmplot(x="Color", y="ord__Item Size", data=encoded_pumpkins, palette=palette) - ``` - - ![Um gráfico de dispersão de dados visualizados](../../../../2-Regression/4-Logistic/images/swarm_2.png) - -**Atenção**: o código acima pode gerar um aviso, já que o Seaborn pode falhar ao representar uma quantidade tão grande de pontos de dados em um gráfico de dispersão. Uma solução possível é diminuir o tamanho do marcador, usando o parâmetro 'size'. No entanto, esteja ciente de que isso afeta a legibilidade do gráfico. - -> **🧮 Mostre-me a Matemática** -> -> A regressão logística se baseia no conceito de 'máxima verossimilhança' usando [funções sigmoides](https://wikipedia.org/wiki/Sigmoid_function). Uma 'Função Sigmoide' em um gráfico tem a forma de um 'S'. Ela pega um valor e o mapeia para algo entre 0 e 1. Sua curva também é chamada de 'curva logística'. Sua fórmula é assim: -> -> ![função logística](../../../../2-Regression/4-Logistic/images/sigmoid.png) -> -> onde o ponto médio da sigmoide encontra-se no ponto 0 de x, L é o valor máximo da curva, e k é a inclinação da curva. Se o resultado da função for maior que 0.5, o rótulo em questão será atribuído à classe '1' da escolha binária. Caso contrário, será classificado como '0'. - -## Construir seu modelo - -Construir um modelo para encontrar essas classificações binárias é surpreendentemente simples no Scikit-learn. - -[![ML para iniciantes - Regressão Logística para classificação de dados](https://img.youtube.com/vi/MmZS2otPrQ8/0.jpg)](https://youtu.be/MmZS2otPrQ8 "ML para iniciantes - Regressão Logística para classificação de dados") - -> 🎥 Clique na imagem acima para um breve vídeo sobre construção de um modelo de regressão linear. - -1. Selecione as variáveis que deseja usar em seu modelo de classificação e divida os conjuntos de treinamento e teste chamando `train_test_split()`: - - ```python - from sklearn.model_selection import train_test_split - - X = encoded_pumpkins[encoded_pumpkins.columns.difference(['Color'])] - y = encoded_pumpkins['Color'] - - X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) - - ``` - -2. Agora você pode treinar seu modelo, chamando `fit()` com seus dados de treinamento, e imprimir o resultado: - - ```python - from sklearn.metrics import f1_score, classification_report - from sklearn.linear_model import LogisticRegression - - model = LogisticRegression() - model.fit(X_train, y_train) - predictions = model.predict(X_test) - - print(classification_report(y_test, predictions)) - print('Predicted labels: ', predictions) - print('F1-score: ', f1_score(y_test, predictions)) - ``` - - Veja o desempenho do seu modelo. Não está ruim, considerando que você tem apenas cerca de 1000 linhas de dados: - - ```output - precision recall f1-score support - - 0 0.94 0.98 0.96 166 - 1 0.85 0.67 0.75 33 - - accuracy 0.92 199 - macro avg 0.89 0.82 0.85 199 - weighted avg 0.92 0.92 0.92 199 - - Predicted labels: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 - 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 - 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 - 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 - 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 - 0 0 0 1 0 0 0 0 0 0 0 0 1 1] - F1-score: 0.7457627118644068 - ``` - -## Melhor compreensão via uma matriz de confusão - -Embora você possa obter um relatório de desempenho [termos](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html?highlight=classification_report#sklearn.metrics.classification_report) imprimindo os itens acima, talvez consiga entender seu modelo mais facilmente usando uma [matriz de confusão](https://scikit-learn.org/stable/modules/model_evaluation.html#confusion-matrix) para ajudar a entender como o modelo está se saindo. - -> 🎓 Uma '[matriz de confusão](https://wikipedia.org/wiki/Confusion_matrix)' (ou 'matriz de erro') é uma tabela que expressa os verdadeiros vs. falsos positivos e negativos do seu modelo, avaliando assim a precisão das previsões. - -1. Para usar uma matriz de confusão, chame `confusion_matrix()`: - - ```python - from sklearn.metrics import confusion_matrix - confusion_matrix(y_test, predictions) - ``` - - Veja a matriz de confusão do seu modelo: - - ```output - array([[162, 4], - [ 11, 22]]) - ``` - -No Scikit-learn, as linhas (eixo 0) são os rótulos reais e as colunas (eixo 1) são os rótulos previstos. - -| | 0 | 1 | -| :---: | :---: | :---: | -| 0 | TN | FP | -| 1 | FN | TP | - -O que está acontecendo aqui? Digamos que nosso modelo seja solicitado a classificar abóboras entre duas categorias binárias, categoria 'branca' e categoria 'não branca'. - -- Se seu modelo prevê uma abóbora como não branca e ela pertence à categoria 'não branca' na realidade, chamamos isso de verdadeiro negativo, mostrado pelo número no canto superior esquerdo. -- Se seu modelo prevê uma abóbora como branca e ela pertence à categoria 'não branca' na realidade, chamamos isso de falso negativo, mostrado pelo número no canto inferior esquerdo. -- Se seu modelo prevê uma abóbora como não branca e ela pertence à categoria 'branca' na realidade, chamamos isso de falso positivo, mostrado pelo número no canto superior direito. -- Se seu modelo prevê uma abóbora como branca e ela pertence à categoria 'branca' na realidade, chamamos isso de verdadeiro positivo, mostrado pelo número no canto inferior direito. - -Como você deve ter imaginado, é preferível ter um número maior de verdadeiros positivos e verdadeiros negativos e um número menor de falsos positivos e falsos negativos, o que implica que o modelo está se saindo melhor. -Como a matriz de confusão se relaciona com precisão e recall? Lembre-se, o relatório de classificação mostrado acima indicou precisão (0,85) e recall (0,67). - -Precisão = tp / (tp + fp) = 22 / (22 + 4) = 0,8461538461538461 - -Recall = tp / (tp + fn) = 22 / (22 + 11) = 0,6666666666666666 - -✅ P: De acordo com a matriz de confusão, como o modelo se saiu? R: Não foi ruim; há um bom número de verdadeiros negativos, mas também alguns falsos negativos. - -Vamos revisitar os termos que vimos anteriormente com a ajuda do mapeamento de TP/TN e FP/FN na matriz de confusão: - -🎓 Precisão: TP/(TP + FP) A fração de instâncias relevantes entre as instâncias recuperadas (ex.: quais rótulos foram bem rotulados) - -🎓 Recall: TP/(TP + FN) A fração de instâncias relevantes que foram recuperadas, independentemente de estarem bem rotuladas ou não - -🎓 f1-score: (2 * precisão * recall)/(precisão + recall) Uma média ponderada entre precisão e recall, sendo o melhor 1 e o pior 0 - -🎓 Suporte: O número de ocorrências de cada rótulo recuperado - -🎓 Precisão geral: (TP + TN)/(TP + TN + FP + FN) A porcentagem de rótulos previstos corretamente para uma amostra. - -🎓 Média Macro: O cálculo das métricas médias não ponderadas para cada rótulo, sem levar em conta o desequilíbrio entre os rótulos. - -🎓 Média Ponderada: O cálculo das métricas médias para cada rótulo, levando em conta o desequilíbrio entre os rótulos ao ponderá-los pelo suporte (o número de instâncias verdadeiras para cada rótulo). - -✅ Você consegue pensar em qual métrica deve observar se quiser que seu modelo reduza o número de falsos negativos? - -## Visualizar a curva ROC deste modelo - -[![ML para iniciantes - Analisando o desempenho da regressão logística com curvas ROC](https://img.youtube.com/vi/GApO575jTA0/0.jpg)](https://youtu.be/GApO575jTA0 "ML para iniciantes - Analisando o desempenho da regressão logística com curvas ROC") - -> 🎥 Clique na imagem acima para um breve vídeo sobre curvas ROC - -Vamos fazer mais uma visualização para ver a chamada curva 'ROC': - -```python -from sklearn.metrics import roc_curve, roc_auc_score -import matplotlib -import matplotlib.pyplot as plt -%matplotlib inline - -y_scores = model.predict_proba(X_test) -fpr, tpr, thresholds = roc_curve(y_test, y_scores[:,1]) - -fig = plt.figure(figsize=(6, 6)) -plt.plot([0, 1], [0, 1], 'k--') -plt.plot(fpr, tpr) -plt.xlabel('False Positive Rate') -plt.ylabel('True Positive Rate') -plt.title('ROC Curve') -plt.show() -``` - -Usando Matplotlib, plote a [Curva Característica de Operação do Receptor](https://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html?highlight=roc) ou ROC do modelo. As curvas ROC são frequentemente usadas para visualizar o desempenho de um classificador em termos de seus verdadeiros positivos versus falsos positivos. "As curvas ROC geralmente apresentam a taxa de verdadeiros positivos no eixo Y e a taxa de falsos positivos no eixo X." Assim, a inclinação da curva e o espaço entre a linha do ponto médio e a curva são importantes: você quer uma curva que rapidamente suba e ultrapasse a linha. No nosso caso, há falsos positivos no início, e então a linha sobe e ultrapassa adequadamente: - -![ROC](../../../../2-Regression/4-Logistic/images/ROC_2.png) - -Por fim, use a API [`roc_auc_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html?highlight=roc_auc#sklearn.metrics.roc_auc_score) do Scikit-learn para calcular a 'Área Sob a Curva' (AUC): - -```python -auc = roc_auc_score(y_test,y_scores[:,1]) -print(auc) -``` -O resultado é `0.9749908725812341`. Dado que o AUC varia de 0 a 1, você quer um valor alto, já que um modelo que é 100% correto em suas previsões terá um AUC de 1; neste caso, o modelo está _muito bom_. - -Em futuras lições sobre classificações, você aprenderá como iterar para melhorar os resultados do seu modelo. Mas, por enquanto, parabéns! Você concluiu estas lições sobre regressão! - ---- -## 🚀Desafio - -Há muito mais para explorar sobre regressão logística! Mas a melhor maneira de aprender é experimentando. Encontre um conjunto de dados que se preste a este tipo de análise e construa um modelo com ele. O que você aprende? dica: experimente [Kaggle](https://www.kaggle.com/search?q=logistic+regression+datasets) para conjuntos de dados interessantes. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Leia as primeiras páginas [deste artigo de Stanford](https://web.stanford.edu/~jurafsky/slp3/5.pdf) sobre alguns usos práticos da regressão logística. Pense em tarefas que são mais adequadas para um ou outro tipo de regressão entre as que estudamos até agora. O que funcionaria melhor? - -## Tarefa - -[Repetindo esta regressão](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/4-Logistic/assignment.md b/translations/br/2-Regression/4-Logistic/assignment.md deleted file mode 100644 index 6f376cf45..000000000 --- a/translations/br/2-Regression/4-Logistic/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Repetindo uma Regressão - -## Instruções - -Na aula, você utilizou um subconjunto dos dados de abóbora. Agora, volte aos dados originais e tente usar todos eles, limpos e padronizados, para construir um modelo de Regressão Logística. - -## Rubrica - -| Critério | Exemplary | Adequado | Precisa de Melhorias | -| --------- | ----------------------------------------------------------------------- | ------------------------------------------------------------ | ----------------------------------------------------------- | -| | Um notebook é apresentado com um modelo bem explicado e de bom desempenho | Um notebook é apresentado com um modelo que apresenta desempenho mínimo | Um notebook é apresentado com um modelo de baixo desempenho ou nenhum | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/4-Logistic/notebook.ipynb b/translations/br/2-Regression/4-Logistic/notebook.ipynb deleted file mode 100644 index f29d1084e..000000000 --- a/translations/br/2-Regression/4-Logistic/notebook.ipynb +++ /dev/null @@ -1,269 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Variedades de Abóbora e Cor\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n", - "\n", - "Vamos observar a relação entre cor e variedade\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
0BALTIMORENaN24 inch binsNaNNaNNaN4/29/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
1BALTIMORENaN24 inch binsNaNNaNNaN5/6/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
2BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
3BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
4BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN11/5/1690.0100.090.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade Date \\\n", - "0 BALTIMORE NaN 24 inch bins NaN NaN NaN 4/29/17 \n", - "1 BALTIMORE NaN 24 inch bins NaN NaN NaN 5/6/17 \n", - "2 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "3 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "4 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 11/5/16 \n", - "\n", - " Low Price High Price Mostly Low ... Unit of Sale Quality Condition \\\n", - "0 270.0 280.0 270.0 ... NaN NaN NaN \n", - "1 270.0 280.0 270.0 ... NaN NaN NaN \n", - "2 160.0 160.0 160.0 ... NaN NaN NaN \n", - "3 160.0 160.0 160.0 ... NaN NaN NaN \n", - "4 90.0 100.0 90.0 ... NaN NaN NaN \n", - "\n", - " Appearance Storage Crop Repack Trans Mode Unnamed: 24 Unnamed: 25 \n", - "0 NaN NaN NaN E NaN NaN NaN \n", - "1 NaN NaN NaN E NaN NaN NaN \n", - "2 NaN NaN NaN N NaN NaN NaN \n", - "3 NaN NaN NaN N NaN NaN NaN \n", - "4 NaN NaN NaN N NaN NaN NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 1, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "\n", - "full_pumpkins = pd.read_csv('../data/US-pumpkins.csv')\n", - "\n", - "full_pumpkins.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.1" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "dee08c2b49057b0de8b6752c4dbca368", - "translation_date": "2025-08-29T22:57:44+00:00", - "source_file": "2-Regression/4-Logistic/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/2-Regression/4-Logistic/solution/Julia/README.md b/translations/br/2-Regression/4-Logistic/solution/Julia/README.md deleted file mode 100644 index 79e0d6458..000000000 --- a/translations/br/2-Regression/4-Logistic/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb b/translations/br/2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb deleted file mode 100644 index 3604e2c91..000000000 --- a/translations/br/2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb +++ /dev/null @@ -1,685 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Construir um modelo de regressão logística - Aula 4\n", - "\n", - "![Infográfico de regressão logística vs. regressão linear](../../../../../../translated_images/pt-BR/linear-vs-logistic.ba180bf95e7ee667.webp)\n", - "\n", - "#### **[Questionário pré-aula](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/15/)**\n", - "\n", - "#### Introdução\n", - "\n", - "Nesta última aula sobre Regressão, uma das técnicas *clássicas* básicas de Machine Learning, vamos explorar a Regressão Logística. Você usaria essa técnica para descobrir padrões e prever categorias binárias. Este doce é de chocolate ou não? Esta doença é contagiosa ou não? Este cliente escolherá este produto ou não?\n", - "\n", - "Nesta aula, você aprenderá:\n", - "\n", - "- Técnicas para regressão logística\n", - "\n", - "✅ Aprofunde seu entendimento sobre como trabalhar com este tipo de regressão neste [módulo do Learn](https://learn.microsoft.com/training/modules/introduction-classification-models/?WT.mc_id=academic-77952-leestott)\n", - "\n", - "## Pré-requisito\n", - "\n", - "Depois de trabalhar com os dados de abóboras, já estamos suficientemente familiarizados com eles para perceber que há uma categoria binária com a qual podemos trabalhar: `Color`.\n", - "\n", - "Vamos construir um modelo de regressão logística para prever, dado algumas variáveis, *qual é a cor provável de uma determinada abóbora* (laranja 🎃 ou branca 👻).\n", - "\n", - "> Por que estamos falando de classificação binária em uma aula sobre regressão? Apenas por conveniência linguística, já que a regressão logística é [na verdade um método de classificação](https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression), embora baseado em um modelo linear. Aprenda sobre outras formas de classificar dados no próximo grupo de aulas.\n", - "\n", - "Para esta aula, precisaremos dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizado de máquina.\n", - "\n", - "- `janitor`: O pacote [janitor](https://github.com/sfirke/janitor) oferece ferramentas simples para examinar e limpar dados desorganizados.\n", - "\n", - "- `ggbeeswarm`: O pacote [ggbeeswarm](https://github.com/eclarke/ggbeeswarm) fornece métodos para criar gráficos no estilo \"beeswarm\" usando ggplot2.\n", - "\n", - "Você pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"janitor\", \"ggbeeswarm\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala caso estejam ausentes.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load(tidyverse, tidymodels, janitor, ggbeeswarm)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## **Defina a pergunta**\n", - "\n", - "Para os nossos propósitos, vamos expressar isso como um binário: 'Branco' ou 'Não Branco'. Há também uma categoria 'listrado' em nosso conjunto de dados, mas há poucos exemplos dela, então não a utilizaremos. De qualquer forma, ela desaparece quando removemos os valores nulos do conjunto de dados.\n", - "\n", - "> 🎃 Curiosidade: às vezes chamamos abóboras brancas de abóboras 'fantasmas'. Elas não são muito fáceis de esculpir, então não são tão populares quanto as laranjas, mas têm uma aparência bem legal! Assim, também poderíamos reformular nossa pergunta como: 'Fantasma' ou 'Não Fantasma'. 👻\n", - "\n", - "## **Sobre regressão logística**\n", - "\n", - "A regressão logística difere da regressão linear, que você aprendeu anteriormente, de algumas maneiras importantes.\n", - "\n", - "#### **Classificação binária**\n", - "\n", - "A regressão logística não oferece os mesmos recursos que a regressão linear. A primeira fornece uma previsão sobre uma `categoria binária` (\"laranja ou não laranja\"), enquanto a segunda é capaz de prever `valores contínuos`, por exemplo, dado a origem de uma abóbora e o momento da colheita, *quanto o preço dela vai aumentar*.\n", - "\n", - "![Infográfico por Dasani Madipalli](../../../../../../translated_images/pt-BR/pumpkin-classifier.562771f104ad5436.webp)\n", - "\n", - "### Outras classificações\n", - "\n", - "Existem outros tipos de regressão logística, incluindo multinomial e ordinal:\n", - "\n", - "- **Multinomial**, que envolve mais de uma categoria - \"Laranja, Branco e Listrado\".\n", - "\n", - "- **Ordinal**, que envolve categorias ordenadas, útil se quisermos organizar nossos resultados de forma lógica, como nossas abóboras ordenadas por um número finito de tamanhos (mini,pequeno,médio,grande,xl,xxl).\n", - "\n", - "![Regressão multinomial vs ordinal](../../../../../../translated_images/pt-BR/multinomial-vs-ordinal.36701b4850e37d86.webp)\n", - "\n", - "#### **As variáveis NÃO precisam ser correlacionadas**\n", - "\n", - "Lembra como a regressão linear funcionava melhor com variáveis mais correlacionadas? A regressão logística é o oposto - as variáveis não precisam estar alinhadas. Isso funciona para este conjunto de dados, que tem correlações um tanto fracas.\n", - "\n", - "#### **Você precisa de muitos dados limpos**\n", - "\n", - "A regressão logística fornecerá resultados mais precisos se você usar mais dados; nosso pequeno conjunto de dados não é o ideal para essa tarefa, então tenha isso em mente.\n", - "\n", - "✅ Pense nos tipos de dados que se adaptariam bem à regressão logística.\n", - "\n", - "## Exercício - organize os dados\n", - "\n", - "Primeiro, limpe um pouco os dados, removendo valores nulos e selecionando apenas algumas das colunas:\n", - "\n", - "1. Adicione o seguinte código:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Load the core tidyverse packages\n", - "library(tidyverse)\n", - "\n", - "# Import the data and clean column names\n", - "pumpkins <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/2-Regression/data/US-pumpkins.csv\") %>% \n", - " clean_names()\n", - "\n", - "# Select desired columns\n", - "pumpkins_select <- pumpkins %>% \n", - " select(c(city_name, package, variety, origin, item_size, color)) \n", - "\n", - "# Drop rows containing missing values and encode color as factor (category)\n", - "pumpkins_select <- pumpkins_select %>% \n", - " drop_na() %>% \n", - " mutate(color = factor(color))\n", - "\n", - "# View the first few rows\n", - "pumpkins_select %>% \n", - " slice_head(n = 5)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Você pode sempre dar uma olhada no seu novo dataframe usando a função [*glimpse()*](https://pillar.r-lib.org/reference/glimpse.html) como mostrado abaixo:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "pumpkins_select %>% \n", - " glimpse()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Vamos confirmar que estaremos realmente lidando com um problema de classificação binária:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Subset distinct observations in outcome column\n", - "pumpkins_select %>% \n", - " distinct(color)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Visualização - gráfico categórico\n", - "Agora você já carregou novamente os dados das abóboras e os limpou para preservar um conjunto de dados contendo algumas variáveis, incluindo Cor. Vamos visualizar o dataframe no notebook usando a biblioteca ggplot.\n", - "\n", - "A biblioteca ggplot oferece maneiras interessantes de visualizar seus dados. Por exemplo, você pode comparar as distribuições dos dados para cada Variedade e Cor em um gráfico categórico.\n", - "\n", - "1. Crie um gráfico desse tipo usando a função geombar, com os dados das abóboras, e especifique um mapeamento de cores para cada categoria de abóbora (laranja ou branca):\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "python" - } - }, - "outputs": [], - "source": [ - "# Specify colors for each value of the hue variable\n", - "palette <- c(ORANGE = \"orange\", WHITE = \"wheat\")\n", - "\n", - "# Create the bar plot\n", - "ggplot(pumpkins_select, aes(y = variety, fill = color)) +\n", - " geom_bar(position = \"dodge\") +\n", - " scale_fill_manual(values = palette) +\n", - " labs(y = \"Variety\", fill = \"Color\") +\n", - " theme_minimal()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Ao observar os dados, você pode ver como as informações de Cor se relacionam com a Variedade.\n", - "\n", - "✅ Dado este gráfico categórico, quais são algumas explorações interessantes que você consegue imaginar?\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Pré-processamento de dados: codificação de características\n", - "\n", - "Nosso conjunto de dados de abóboras contém valores em formato de texto para todas as suas colunas. Trabalhar com dados categóricos é intuitivo para humanos, mas não para máquinas. Os algoritmos de aprendizado de máquina funcionam melhor com números. Por isso, a codificação é uma etapa muito importante na fase de pré-processamento de dados, pois nos permite transformar dados categóricos em dados numéricos, sem perder nenhuma informação. Uma boa codificação contribui para a construção de um bom modelo.\n", - "\n", - "Para a codificação de características, existem dois principais tipos de codificadores:\n", - "\n", - "1. Codificador ordinal: é adequado para variáveis ordinais, que são variáveis categóricas cujos dados seguem uma ordem lógica, como a coluna `item_size` no nosso conjunto de dados. Ele cria um mapeamento em que cada categoria é representada por um número, que corresponde à ordem da categoria na coluna.\n", - "\n", - "2. Codificador categórico: é adequado para variáveis nominais, que são variáveis categóricas cujos dados não seguem uma ordem lógica, como todas as características diferentes de `item_size` no nosso conjunto de dados. Trata-se de uma codificação one-hot, o que significa que cada categoria é representada por uma coluna binária: a variável codificada é igual a 1 se a abóbora pertence àquela variedade e 0 caso contrário.\n", - "\n", - "O Tidymodels oferece mais um pacote interessante: [recipes](https://recipes.tidymodels.org/) - um pacote para pré-processamento de dados. Vamos definir uma `recipe` que especifica que todas as colunas preditoras devem ser codificadas em um conjunto de números inteiros, `prep` para estimar as quantidades e estatísticas necessárias para quaisquer operações e, por fim, `bake` para aplicar os cálculos aos novos dados.\n", - "\n", - "> Normalmente, o recipes é usado como um pré-processador para modelagem, onde define quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para a modelagem. Nesse caso, é **altamente recomendado** que você use um `workflow()` em vez de estimar manualmente uma receita usando prep e bake. Veremos tudo isso em breve.\n", - ">\n", - "> No entanto, por enquanto, estamos usando recipes + prep + bake para especificar quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para análise de dados e, em seguida, extrair os dados pré-processados com as etapas aplicadas.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Preprocess and extract data to allow some data analysis\n", - "baked_pumpkins <- recipe(color ~ ., data = pumpkins_select) %>%\n", - " # Define ordering for item_size column\n", - " step_mutate(item_size = ordered(item_size, levels = c('sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo'))) %>%\n", - " # Convert factors to numbers using the order defined above (Ordinal encoding)\n", - " step_integer(item_size, zero_based = F) %>%\n", - " # Encode all other predictors using one hot encoding\n", - " step_dummy(all_nominal(), -all_outcomes(), one_hot = TRUE) %>%\n", - " prep(data = pumpkin_select) %>%\n", - " bake(new_data = NULL)\n", - "\n", - "# Display the first few rows of preprocessed data\n", - "baked_pumpkins %>% \n", - " slice_head(n = 5)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "✅ Quais são as vantagens de usar um codificador ordinal para a coluna Item Size?\n", - "\n", - "### Analisar relações entre variáveis\n", - "\n", - "Agora que pré-processamos nossos dados, podemos analisar as relações entre as características e o rótulo para ter uma ideia de quão bem o modelo será capaz de prever o rótulo com base nas características. A melhor maneira de realizar esse tipo de análise é plotando os dados. \n", - "Usaremos novamente a função ggplot geom_boxplot_ para visualizar as relações entre Item Size, Variety e Color em um gráfico categórico. Para melhorar a visualização dos dados, utilizaremos a coluna codificada de Item Size e a coluna não codificada de Variety.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Define the color palette\n", - "palette <- c(ORANGE = \"orange\", WHITE = \"wheat\")\n", - "\n", - "# We need the encoded Item Size column to use it as the x-axis values in the plot\n", - "pumpkins_select_plot<-pumpkins_select\n", - "pumpkins_select_plot$item_size <- baked_pumpkins$item_size\n", - "\n", - "# Create the grouped box plot\n", - "ggplot(pumpkins_select_plot, aes(x = `item_size`, y = color, fill = color)) +\n", - " geom_boxplot() +\n", - " facet_grid(variety ~ ., scales = \"free_x\") +\n", - " scale_fill_manual(values = palette) +\n", - " labs(x = \"Item Size\", y = \"\") +\n", - " theme_minimal() +\n", - " theme(strip.text = element_text(size = 12)) +\n", - " theme(axis.text.x = element_text(size = 10)) +\n", - " theme(axis.title.x = element_text(size = 12)) +\n", - " theme(axis.title.y = element_blank()) +\n", - " theme(legend.position = \"bottom\") +\n", - " guides(fill = guide_legend(title = \"Color\")) +\n", - " theme(panel.spacing = unit(0.5, \"lines\"))+\n", - " theme(strip.text.y = element_text(size = 4, hjust = 0)) \n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "#### Use um gráfico swarm\n", - "\n", - "Como Cor é uma categoria binária (Branco ou Não), ela requer '[uma abordagem especializada](https://github.com/rstudio/cheatsheets/blob/main/data-visualization.pdf) para visualização'.\n", - "\n", - "Experimente um `gráfico swarm` para mostrar a distribuição de cor em relação ao item_size.\n", - "\n", - "Usaremos o [pacote ggbeeswarm](https://github.com/eclarke/ggbeeswarm), que fornece métodos para criar gráficos no estilo beeswarm usando ggplot2. Gráficos beeswarm são uma forma de plotar pontos que normalmente se sobreporiam, organizando-os lado a lado.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Create beeswarm plots of color and item_size\n", - "baked_pumpkins %>% \n", - " mutate(color = factor(color)) %>% \n", - " ggplot(mapping = aes(x = color, y = item_size, color = color)) +\n", - " geom_quasirandom() +\n", - " scale_color_brewer(palette = \"Dark2\", direction = -1) +\n", - " theme(legend.position = \"none\")\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora que temos uma ideia da relação entre as categorias binárias de cor e o grupo maior de tamanhos, vamos explorar a regressão logística para determinar a provável cor de uma abóbora.\n", - "\n", - "## Construa seu modelo\n", - "\n", - "Selecione as variáveis que você deseja usar no seu modelo de classificação e divida os dados em conjuntos de treinamento e teste. O [rsample](https://rsample.tidymodels.org/), um pacote do Tidymodels, fornece uma infraestrutura para divisão e reamostragem de dados de forma eficiente:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Split data into 80% for training and 20% for testing\n", - "set.seed(2056)\n", - "pumpkins_split <- pumpkins_select %>% \n", - " initial_split(prop = 0.8)\n", - "\n", - "# Extract the data in each split\n", - "pumpkins_train <- training(pumpkins_split)\n", - "pumpkins_test <- testing(pumpkins_split)\n", - "\n", - "# Print out the first 5 rows of the training set\n", - "pumpkins_train %>% \n", - " slice_head(n = 5)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "🙌 Estamos prontos para treinar um modelo ajustando as características de treinamento ao rótulo de treinamento (cor).\n", - "\n", - "Começaremos criando uma receita que especifica as etapas de pré-processamento que devem ser realizadas em nossos dados para prepará-los para a modelagem, ou seja: codificar variáveis categóricas em um conjunto de números inteiros. Assim como `baked_pumpkins`, criaremos uma `pumpkins_recipe`, mas não usaremos `prep` e `bake`, já que isso será incorporado em um fluxo de trabalho, como você verá em apenas alguns passos.\n", - "\n", - "Existem várias maneiras de especificar um modelo de regressão logística no Tidymodels. Veja `?logistic_reg()`. Por enquanto, especificaremos um modelo de regressão logística usando o mecanismo padrão `stats::glm()`.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Create a recipe that specifies preprocessing steps for modelling\n", - "pumpkins_recipe <- recipe(color ~ ., data = pumpkins_train) %>% \n", - " step_mutate(item_size = ordered(item_size, levels = c('sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo'))) %>%\n", - " step_integer(item_size, zero_based = F) %>% \n", - " step_dummy(all_nominal(), -all_outcomes(), one_hot = TRUE)\n", - "\n", - "# Create a logistic model specification\n", - "log_reg <- logistic_reg() %>% \n", - " set_engine(\"glm\") %>% \n", - " set_mode(\"classification\")\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora que temos uma receita e uma especificação de modelo, precisamos encontrar uma maneira de combiná-los em um objeto que primeiro pré-processará os dados (prep+bake nos bastidores), ajustará o modelo nos dados pré-processados e também permitirá atividades de pós-processamento, se necessário.\n", - "\n", - "No Tidymodels, esse objeto prático é chamado de [`workflow`](https://workflows.tidymodels.org/) e organiza convenientemente seus componentes de modelagem.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Bundle modelling components in a workflow\n", - "log_reg_wf <- workflow() %>% \n", - " add_recipe(pumpkins_recipe) %>% \n", - " add_model(log_reg)\n", - "\n", - "# Print out the workflow\n", - "log_reg_wf\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Depois que um fluxo de trabalho é *especificado*, um modelo pode ser `treinado` usando a função [`fit()`](https://tidymodels.github.io/parsnip/reference/fit.html). O fluxo de trabalho estimará uma receita e pré-processará os dados antes do treinamento, então não será necessário fazer isso manualmente usando prep e bake.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Train the model\n", - "wf_fit <- log_reg_wf %>% \n", - " fit(data = pumpkins_train)\n", - "\n", - "# Print the trained workflow\n", - "wf_fit\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "O modelo exibe os coeficientes aprendidos durante o treinamento.\n", - "\n", - "Agora que treinamos o modelo usando os dados de treinamento, podemos fazer previsões nos dados de teste usando [parsnip::predict()](https://parsnip.tidymodels.org/reference/predict.model_fit.html). Vamos começar usando o modelo para prever os rótulos do nosso conjunto de teste e as probabilidades para cada rótulo. Quando a probabilidade for maior que 0,5, a classe prevista será `WHITE`, caso contrário, será `ORANGE`.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Make predictions for color and corresponding probabilities\n", - "results <- pumpkins_test %>% select(color) %>% \n", - " bind_cols(wf_fit %>% \n", - " predict(new_data = pumpkins_test)) %>%\n", - " bind_cols(wf_fit %>%\n", - " predict(new_data = pumpkins_test, type = \"prob\"))\n", - "\n", - "# Compare predictions\n", - "results %>% \n", - " slice_head(n = 10)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Muito bom! Isso oferece mais insights sobre como a regressão logística funciona.\n", - "\n", - "### Melhor compreensão por meio de uma matriz de confusão\n", - "\n", - "Comparar cada previsão com seu respectivo valor real (\"ground truth\") não é uma maneira muito eficiente de determinar o quão bem o modelo está prevendo. Felizmente, o Tidymodels tem mais algumas cartas na manga: [`yardstick`](https://yardstick.tidymodels.org/) - um pacote usado para medir a eficácia de modelos utilizando métricas de desempenho.\n", - "\n", - "Uma métrica de desempenho associada a problemas de classificação é a [`matriz de confusão`](https://wikipedia.org/wiki/Confusion_matrix). Uma matriz de confusão descreve o quão bem um modelo de classificação está performando. Ela tabula quantos exemplos de cada classe foram classificados corretamente por um modelo. No nosso caso, ela mostrará quantas abóboras laranjas foram classificadas como laranjas e quantas abóboras brancas foram classificadas como brancas; a matriz de confusão também mostra quantas foram classificadas nas categorias **erradas**.\n", - "\n", - "A função [**`conf_mat()`**](https://tidymodels.github.io/yardstick/reference/conf_mat.html) do yardstick calcula essa tabela cruzada de classes observadas e previstas.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Confusion matrix for prediction results\n", - "conf_mat(data = results, truth = color, estimate = .pred_class)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Vamos interpretar a matriz de confusão. Nosso modelo foi solicitado a classificar abóboras entre duas categorias binárias, a categoria `branca` e a categoria `não-branca`.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora é branca e ela realmente pertence à categoria 'branca', chamamos isso de `verdadeiro positivo`, representado pelo número no canto superior esquerdo.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora não é branca e ela realmente pertence à categoria 'branca', chamamos isso de `falso negativo`, representado pelo número no canto inferior esquerdo.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora é branca e ela realmente pertence à categoria 'não-branca', chamamos isso de `falso positivo`, representado pelo número no canto superior direito.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora não é branca e ela realmente pertence à categoria 'não-branca', chamamos isso de `verdadeiro negativo`, representado pelo número no canto inferior direito.\n", - "\n", - "| Verdade |\n", - "|:-------:|\n", - "\n", - "| | | |\n", - "|---------------|--------|-------|\n", - "| **Previsto** | BRANCA | LARANJA |\n", - "| BRANCA | VP | FP |\n", - "| LARANJA | FN | VN |\n", - "\n", - "Como você deve ter imaginado, é preferível ter um número maior de verdadeiros positivos e verdadeiros negativos e um número menor de falsos positivos e falsos negativos, o que implica que o modelo tem um desempenho melhor.\n", - "\n", - "A matriz de confusão é útil porque dá origem a outras métricas que podem nos ajudar a avaliar melhor o desempenho de um modelo de classificação. Vamos analisar algumas delas:\n", - "\n", - "🎓 Precisão: `VP/(VP + FP)` definida como a proporção de positivos previstos que são realmente positivos. Também chamada de [valor preditivo positivo](https://en.wikipedia.org/wiki/Positive_predictive_value \"Positive predictive value\").\n", - "\n", - "🎓 Revocação: `VP/(VP + FN)` definida como a proporção de resultados positivos em relação ao número de amostras que eram realmente positivas. Também conhecida como `sensibilidade`.\n", - "\n", - "🎓 Especificidade: `VN/(VN + FP)` definida como a proporção de resultados negativos em relação ao número de amostras que eram realmente negativas.\n", - "\n", - "🎓 Acurácia: `VP + VN/(VP + VN + FP + FN)` A porcentagem de rótulos previstos corretamente para uma amostra.\n", - "\n", - "🎓 Medida F: Uma média ponderada entre a precisão e a revocação, sendo 1 o melhor valor e 0 o pior.\n", - "\n", - "Vamos calcular essas métricas!\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Combine metric functions and calculate them all at once\n", - "eval_metrics <- metric_set(ppv, recall, spec, f_meas, accuracy)\n", - "eval_metrics(data = results, truth = color, estimate = .pred_class)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Visualizar a curva ROC deste modelo\n", - "\n", - "Vamos fazer mais uma visualização para observar a chamada [`curva ROC`](https://en.wikipedia.org/wiki/Receiver_operating_characteristic):\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Make a roc_curve\n", - "results %>% \n", - " roc_curve(color, .pred_ORANGE) %>% \n", - " autoplot()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Curvas ROC são frequentemente usadas para obter uma visão do desempenho de um classificador em termos de verdadeiros positivos versus falsos positivos. Curvas ROC geralmente apresentam a `Taxa de Verdadeiros Positivos`/Sensibilidade no eixo Y e a `Taxa de Falsos Positivos`/1-Especificidade no eixo X. Assim, a inclinação da curva e o espaço entre a linha do ponto médio e a curva são importantes: você quer uma curva que rapidamente suba e ultrapasse a linha. No nosso caso, há falsos positivos no início, e então a linha sobe e ultrapassa adequadamente.\n", - "\n", - "Por fim, vamos usar `yardstick::roc_auc()` para calcular a Área Sob a Curva. Uma forma de interpretar a AUC é como a probabilidade de que o modelo classifique um exemplo positivo aleatório mais alto do que um exemplo negativo aleatório.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Calculate area under curve\n", - "results %>% \n", - " roc_auc(color, .pred_ORANGE)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "O resultado é cerca de `0.975`. Dado que o AUC varia de 0 a 1, você quer um valor alto, já que um modelo que acerta 100% das previsões terá um AUC de 1; neste caso, o modelo é *muito bom*.\n", - "\n", - "Em futuras lições sobre classificações, você aprenderá como melhorar os resultados do seu modelo (como lidar com dados desbalanceados neste caso).\n", - "\n", - "## 🚀Desafio\n", - "\n", - "Há muito mais para explorar sobre regressão logística! Mas a melhor forma de aprender é experimentando. Encontre um conjunto de dados que se preste a esse tipo de análise e construa um modelo com ele. O que você aprende? dica: experimente [Kaggle](https://www.kaggle.com/search?q=logistic+regression+datasets) para conjuntos de dados interessantes.\n", - "\n", - "## Revisão & Estudo Individual\n", - "\n", - "Leia as primeiras páginas [deste artigo de Stanford](https://web.stanford.edu/~jurafsky/slp3/5.pdf) sobre alguns usos práticos da regressão logística. Pense em tarefas que são mais adequadas para um ou outro tipo de regressão entre as que estudamos até agora. O que funcionaria melhor?\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "anaconda-cloud": "", - "kernelspec": { - "display_name": "R", - "langauge": "R", - "name": "ir" - }, - "language_info": { - "codemirror_mode": "r", - "file_extension": ".r", - "mimetype": "text/x-r-source", - "name": "R", - "pygments_lexer": "r", - "version": "3.4.1" - }, - "coopTranslator": { - "original_hash": "feaf125f481a89c468fa115bf2aed580", - "translation_date": "2025-08-29T23:04:05+00:00", - "source_file": "2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/br/2-Regression/4-Logistic/solution/notebook.ipynb b/translations/br/2-Regression/4-Logistic/solution/notebook.ipynb deleted file mode 100644 index 7042722d3..000000000 --- a/translations/br/2-Regression/4-Logistic/solution/notebook.ipynb +++ /dev/null @@ -1,1255 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Regressão Logística - Aula 4\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 63, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
0BALTIMORENaN24 inch binsNaNNaNNaN4/29/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
1BALTIMORENaN24 inch binsNaNNaNNaN5/6/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
2BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
3BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
4BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN11/5/1690.0100.090.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade Date \n", - "0 BALTIMORE NaN 24 inch bins NaN NaN NaN 4/29/17 \\\n", - "1 BALTIMORE NaN 24 inch bins NaN NaN NaN 5/6/17 \n", - "2 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "3 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "4 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 11/5/16 \n", - "\n", - " Low Price High Price Mostly Low ... Unit of Sale Quality Condition \n", - "0 270.0 280.0 270.0 ... NaN NaN NaN \\\n", - "1 270.0 280.0 270.0 ... NaN NaN NaN \n", - "2 160.0 160.0 160.0 ... NaN NaN NaN \n", - "3 160.0 160.0 160.0 ... NaN NaN NaN \n", - "4 90.0 100.0 90.0 ... NaN NaN NaN \n", - "\n", - " Appearance Storage Crop Repack Trans Mode Unnamed: 24 Unnamed: 25 \n", - "0 NaN NaN NaN E NaN NaN NaN \n", - "1 NaN NaN NaN E NaN NaN NaN \n", - "2 NaN NaN NaN N NaN NaN NaN \n", - "3 NaN NaN NaN N NaN NaN NaN \n", - "4 NaN NaN NaN N NaN NaN NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 63, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "\n", - "full_pumpkins = pd.read_csv('../../data/US-pumpkins.csv')\n", - "\n", - "full_pumpkins.head()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 64, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NamePackageVarietyOriginItem SizeColor
2BALTIMORE24 inch binsHOWDEN TYPEDELAWAREmedORANGE
3BALTIMORE24 inch binsHOWDEN TYPEVIRGINIAmedORANGE
4BALTIMORE24 inch binsHOWDEN TYPEMARYLANDlgeORANGE
5BALTIMORE24 inch binsHOWDEN TYPEMARYLANDlgeORANGE
6BALTIMORE36 inch binsHOWDEN TYPEMARYLANDmedORANGE
\n", - "
" - ], - "text/plain": [ - " City Name Package Variety Origin Item Size Color\n", - "2 BALTIMORE 24 inch bins HOWDEN TYPE DELAWARE med ORANGE\n", - "3 BALTIMORE 24 inch bins HOWDEN TYPE VIRGINIA med ORANGE\n", - "4 BALTIMORE 24 inch bins HOWDEN TYPE MARYLAND lge ORANGE\n", - "5 BALTIMORE 24 inch bins HOWDEN TYPE MARYLAND lge ORANGE\n", - "6 BALTIMORE 36 inch bins HOWDEN TYPE MARYLAND med ORANGE" - ] - }, - "execution_count": 64, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Select the columns we want to use\n", - "columns_to_select = ['City Name','Package','Variety', 'Origin','Item Size', 'Color']\n", - "pumpkins = full_pumpkins.loc[:, columns_to_select]\n", - "\n", - "# Drop rows with missing values\n", - "pumpkins.dropna(inplace=True)\n", - "\n", - "pumpkins.head()" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Vamos dar uma olhada nos nossos dados!\n", - "\n", - "Visualizando-os com Seaborn\n" - ] - }, - { - "cell_type": "code", - "execution_count": 65, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 65, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAjQAAAHpCAYAAACVw6ZvAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/bCgiHAAAACXBIWXMAAA9hAAAPYQGoP6dpAABU3klEQVR4nO3deVRU5f8H8PeFkQFZZXNQ2RQBwy3NNRVGMTCz3JW0JJcyjdwXLJcwBSszTcU0wKxccl9KyoVxS0VTEhXXRM1A+7qwmOz394eH+/M6A7IKV9+vc+7Jee6zfO7IkXfP3JkRRFEUQURERKRgRlVdABEREVF5MdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdDQc0sURaSnp4MfxUREpHwMNPTcysjIgLW1NTIyMqq6FCIiKicGGiIiIlI8BhoiIiJSPAYaIiIiUjwGGiIiIlI8VVUXQFTVrq5qAkszZnsipXIbdqWqS6BqgP+KExERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdCUU3BwMHr27KnXrtPpIAgC7t27J7Xl5+djwYIFaNKkCUxNTVGrVi1069YNhw4dkvqcO3cOgiDgyJEjsvnatm0LU1NTZGVlSW1ZWVkwNTVFVFSUVIsgCBAEATVq1EDt2rXRtWtXREdHo6CgQDafm5ub1PfRIyIiAgCQnJwMQRDg6OiIjIwM2djmzZtj1qxZBp8PPz8/g/MWHo0bN4ZGo8HcuXP1xvbv3x9t27ZFfn4+Zs2aJY1RqVRwc3PDuHHjkJmZKavP0PH4c0dERM8+BpqnRBRFDBw4EGFhYRgzZgySkpKg0+ng7OwMPz8/bNmyBQDg7e0NjUYDnU4njc3IyMCJEyfg4OAg+2V9+PBhZGdno3PnzlJbYGAgUlJSkJycjJ07d0Kr1WLMmDF47bXXkJeXJ6spLCwMKSkpsiMkJETWJyMjA1988UWJr3PTpk3SXPHx8QCA3bt3S2379+/H8uXL8cknnyAxMVEat379euzYsQPfffcdjI2NAQA+Pj7StcybNw/Lly/HhAkTZOs9Onfh0bJlyxLXS0REzwZVVRfwvPjpp5+wYcMGbNu2DT169JDaly9fjtu3b2P48OHo2rUrzM3NodVqodPpMHXqVADAwYMH4enpiU6dOkGn08HPzw/Aw10gV1dXuLu7S/Op1WpoNBoAQN26ddGiRQu0bdsWXbp0wcqVKzF8+HCpr6WlpdS3KCEhIfjyyy8xevRoODo6PvE6bW1tpT8X7ibZ2dnJ1nn99dfx5ptvYsiQITh69Cju3buH0aNHIyIiAl5eXlI/lUoljRswYAD27NmDbdu24ZtvvpH6PD43ERE9n7hD85SsXr0anp6esjBTaMKECbh9+zZ27doFANBqtTh48KC0oxIXFwc/Pz/4+voiLi5OGhcXFwetVvvEtTt37oxmzZph06ZNpa47KCgIHh4eCAsLK/XY4ixcuBC3b9/G7NmzMWrUKDRu3Fhvd+hxZmZmyMnJKfOa2dnZSE9Plx1ERPRs4A5NBdixYwcsLCxkbfn5+bLHFy5cQKNGjQyOL2y/cOECgIeB5v79+zh27BjatWsHnU6HSZMmoUOHDhgyZAiysrIgiiLi4+NlOy7F8fb2xqlTp2RtU6ZMwccffyxr27lzJzp27Cg9LryvpkePHhg3bhwaNGhQovWexMrKCjExMXjllVdgbm6OU6dOQRCEIvv/8ccfWL16tezlNQBo3749jIzkubzwPpvHhYeH45NPPtFrd307EVZWVmW4CiIiqi4YaCqAVqtFZGSkrO3o0aMYPHiwrE0UxRLN5+HhgXr16kGn08HHxwcnT56Er68vHB0d4eLigsOHD0MURWRnZ5doh6Zw7ccDw6RJkxAcHCxrq1u3rt7YgIAAdOjQAdOnT8fq1atLtF5JdO7cGW3btkXz5s3h6uqqdz4xMREWFhbIz89HTk4OunfvjsWLF8v6rFu3rsig+LjQ0FCMHz9eepyeng5nZ+fyXQQREVULDDQVwNzcHB4eHrK2v//+W/bY09MTSUlJBscXtnt6ekptfn5+iIuLQ9OmTdGwYUPp/pXCl51EUYSHh0eJfyEnJSXJ7rUBAHt7e726ixIREYF27dph0qRJJepfUiqVCiqV4R9DLy8vbNu2DSqVCnXq1IGJiYleH2dn5xJfg1qthlqtLle9RERUPfEemqdk4MCBuHjxIrZv3653bv78+bCzs0PXrl2lNq1Wi99//x27du2SbgIGIN0YrNPpSrw7s3fvXiQmJqJPnz5lrr9169bo3bu3dKPy02BiYgIPDw+4ubkZDDNERESFuEPzlAwcOBDr16/HkCFD8Pnnn6NLly5IT0/HkiVLsG3bNqxfvx7m5uZS/8L7aKKjo7FixQqp3dfXV7pvZtSoUXrrZGdnIzU1Ffn5+bh58yZiY2MRHh6O1157DW+//basb0ZGBlJTU2VtNWvWLPJ+kjlz5sDHx6fIHZWqcPv2bb1rsLGxgampaRVVREREVYE7NE+JIAj46aefMG3aNCxYsABeXl7o2LEjrl69Cp1Op/fhfO7u7nB1dUVGRgZ8fX2ldhcXF9SpUwc5OTmynZtCsbGxcHJygpubGwIDAxEXF4dFixZh69at0ue7FJoxYwacnJxkx+TJk4u8Bk9PTwwdOlT24X5Vzd/fX+8aCj/Th4iInh+CWNI7VYmeMenp6bC2tkZaWhrf5UREpHDcoSEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVTVXUBRFXt6qomsDRjtq8obsOuVHUJRPQc4r/iREREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0z5ng4GAIggBBEGBiYgIPDw+EhYUhLy8PAKDT6SAIAu7duyd7bOhITU3Vm3/WrFlF9i88/P39ERAQoDd26dKlsLGxwd9//623bu3atdGnTx/89ddfUn83NzeD80dERFTOk0dERNWWqqoLoKcvMDAQMTExyM7Oxi+//ILRo0ejRo0aCA0NLXLM+fPnYWVlJWtzdHTU6zdx4kSMHDlSetyqVSu8++67GDFihNSWm5uLJk2a4JtvvsF7770HALhy5QomT56MyMhI1KtXD5cuXZLWtbS0xMWLF/Huu++iR48eOHXqFIyNjQEAYWFhsrkBwNLSspTPCBERKR0DzXNIrVZDo9EAAN5//31s3rwZ27ZtKzbQODo6wsbG5olzW1hYwMLCQnpsbGwMS0tLab1CCxcuxAcffIBXXnkFbm5uGDZsGF555RW89dZbBtd1cnLCjBkzMGjQIFy6dAleXl4AYHDuomRnZyM7O1t6nJ6eXqJxRERU/THQEMzMzHD79u2nuuaQIUOwefNmDB06FL1798bp06dx5syZYseYmZkBAHJycsq0Znh4OD755BO9dssOi2BlaQ7bBv5lmpeIiKoe76F5jomiiN27d+PXX39F586di+1br149affFwsICPj4+5V5/+fLlOH36NMaOHYvly5fDwcGhyL4pKSn44osvULduXWl3BgCmTJkiq8vCwgIHDhwwOEdoaCjS0tKk4/r16+W+BiIiqh64Q/Mc2rFjBywsLJCbm4uCggK8+eabmDVrVrFjDhw4ILs3pUaNGuWuw9HREe+99x62bNmCnj17GuxTr149iKKI//77D82aNcPGjRthYmIinZ80aRKCg4NlY+rWrWtwLrVaDbVaXe66iYio+mGgeQ5ptVpERkbCxMQEderUgUr15B8Dd3f3Et1DU1oqlarY9Q8cOAArKys4OjoavNnX3t4eHh4eFV4XEREpCwPNc8jc3FwxIaCyghQRET1bGGioRG7duoWsrCxZm52dXYW89FQeGRkZep+HU7NmTb23mBMR0bONNwVTiXh5ecHJyUl2/PHHH1VdFmbMmKFX1+TJk6u6LCIiesoEURTFqi6CqCqkp6fD2toaV05u4du2iYgUjjs0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/LZteu7Z1tfy27mJiBSOOzRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/KRgeu5dXdUElmYlz/Zuw65UYjVERFQW3KEhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCml4OBgCIIgHXZ2dggMDMSpU6dk/QRBwJYtW2RtcXFxeO211+Dg4ABTU1M0aNAAAwYMwP79+4td083NDYIgYO3atXrnfHx8IAgCVq5cqXcuPDwcxsbG+Pzzzw3Om5qaipCQENSvXx9qtRrOzs7o0aMH9uzZI1v7q6++kh6LooiJEyfCysoKOp2uyFqLOt58803UrFkTq1evlo0rKChA+/bt0bdvXwDy59nExAQeHh4ICwtDXl4eAECn0xW5RmpqarHPJxERPXsYaMogMDAQKSkpSElJwZ49e6BSqfDaa68VO2bp0qXo0qUL7OzssG7dOpw/fx6bN29G+/btMW7cuCeu6ezsjJiYGFnbkSNHkJqaCnNzc4NjoqOjMXnyZERHR+udS05ORsuWLbF37158/vnnSExMRGxsLLRaLUaPHm1wvvz8fAwbNgyrVq1CXFwc/Pz89PocO3ZMem42btwIADh//rzUFhkZiYiICISEhCAlJUUaN3/+fPz1119YtmyZ1Fb4PF+8eBETJkzArFmz9MLZo3MXHo6OjoafRCIiemapqroAJVKr1dBoNAAAjUaDqVOnomPHjvj333/h4OCg1//atWsYO3Ysxo4diy+//FJ2rmnTpvjwww+fuOagQYOwYMECXL9+Hc7OzgAeBpZBgwZh1apVev337duHBw8eICwsDKtWrcLvv/+O9u3bS+dHjRoFQRAQHx8vC0Q+Pj4YOnSo3nzZ2dkICgrC8ePHceDAAXh5eRms89Hrt7W1BQA4OjrCxsZGag8JCcGWLVswYsQI7NixA+fOncOMGTOwbt062NvbS/0efZ7ff/99bN68Gdu2bUNoaKjU5/G5iYjo+cQdmnLKzMzEDz/8AA8PD9jZ2Rnss3HjRuTm5mLy5MkGzwuC8MR1ateujYCAAHz33XcAgP/++w/r1q0zGD4AICoqCkFBQahRowaCgoIQFRUlnbtz5w5iY2MxevRog7s7jweEzMxMdO/eHWfPnsWhQ4eKDDMlJQgCYmJicODAAaxYsQLBwcEYOHAgXn/99WLHmZmZIScnp8zrZmdnIz09XXYQEdGzgTs0ZbBjxw5YWFgAAO7fvw8nJyfs2LEDRkaG8+GFCxdgZWUl7TYAD0POkCFDpMeHDx9GkyZNil136NChmDBhAj766CNs2LABDRo0QPPmzfX6paenY8OGDTh8+DAAYPDgwejYsSMWLlwICwsLXLp0CaIowtvbu0TXO3v2bFhaWiIpKcngDlRZuLq64quvvsLw4cNRr149/Pbbb0X2FUURe/bswa+//oqQkBDZuXr16unNe+bMGYPzhIeH45NPPtFrt+ywCFaW+sHOtoF/SS6FiIiqAe7QlIFWq0VCQgISEhIQHx+PgIAAdOvWDVevXi1yzOO7MAEBAUhISMDPP/+M+/fvIz8//4nrdu/eHZmZmdi/fz+io6OL3J1Zs2YNGjRogGbNmgEAmjdvDldXV6xbtw7Aw4BQGq+88gru37+PuXPnlmrck7zzzjtwcnJCSEgIrKys9M4XBkdTU1N069YNAwYMwKxZs2R9Dhw4IP1dJCQk4JdffilyvdDQUKSlpUnH9evXK/R6iIio6nCHpgzMzc3h4eEhPf72229hbW2NFStW4NNPP9Xr37BhQ6SlpSE1NVXapbGwsICHhwdUqpL/FahUKrz11luYOXMmjh49is2bNxvsFxUVhTNnzsjmLigoQHR0NIYNG4aGDRtCEAScO3euROt26dIFISEheOONN1BQUICFCxeWuOYnUalURT4HWq0WkZGRMDExQZ06dQz2c3d3L/E9NGq1Gmq1ujzlEhFRNcUdmgogCAKMjIzw4MEDg+f79u2LGjVqYN68eeVea+jQodi3bx/eeOMN1KpVS+98YmIijh8/Dp1OJ9u50Ol0OHz4MM6dOwdbW1sEBARgyZIluH//vt4c9+7d02t75ZVXsH37dqxYsaJENzFXhMLg6OLiUqrgR0REzx/+liiD7Oxs6bNO7t69i8WLFyMzMxM9evQw2N/FxQXz58/HmDFjcOfOHQQHB8Pd3R137tzBDz/8AAAwNjYu0dqNGjXC//73P9SsWdPg+aioKLRu3RqdOnXSO9eqVStERUXh888/x5IlS/Dyyy+jdevWCAsLQ9OmTZGXl4ddu3YhMjISSUlJeuP9/f2xY8cO9OjRAwUFBVi8eHGJaq5Mt27dQlZWlqzNzs4ONWrUqKKKiIioKnCHpgxiY2Ph5OQEJycntGnTBseOHcP69esNfi5LoZCQEPz222/4999/0bdvXzRs2BCvvvoqrly5gtjY2CfeEPwoOzs7mJmZ6bXn5OTghx9+QJ8+fQyO69OnD1atWoXc3FzUr18fJ06cgFarxYQJE9C4cWN07doVe/bsQWRkZJFrd+7cGT///DNWrlyJ0aNHl/p+nIrm5eUl/V0UHn/88UeV1kRERE+fIFb1bySiKpKeng5ra2tcObmF73IiIlI47tAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeLx27bpuWdbXwsrK6uqLoOIiMqBOzRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/KRgeu5dXdUElmaVl+3dhl2ptLmJiOgh7tAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0ChMcHAwBEHAyJEj9c6NHj0agiAgODhY6tuzZ0+9sREREbJxW7ZsgSAI0mOdTgdBEHDv3j29Nby9vaFWq5GamirrW9yh0+kwa9YsNG/eXG++5ORkCIKAhIQEg/M5ODjg1VdfRWJiosHn4fEjMDCwBM8iERE9axhoFMjZ2Rlr167FgwcPpLasrCysXr0aLi4uxY41NTXFvHnzcPfu3VKve/DgQTx48AB9+/bFd999BwBo3749UlJSpKN///4IDAyUtbVv377Ua50/fx4pKSn49ddfkZ2dje7duyMnJ0fW5/F1UlJSsGbNmlKvRUREysdAo0AtWrSAs7MzNm3aJLVt2rQJLi4uePHFF4sd6+/vD41Gg/Dw8FKvGxUVhTfffBNvvfUWoqOjAQAmJibQaDTSYWZmBrVaLWszMTEp9VqOjo7QaDRo0aIFxo4di+vXr+PcuXOyPo+vo9FoUKtWrVKvRUREysdAo1BDhw5FTEyM9Dg6OhrvvPPOE8cZGxtj7ty5+Prrr/H333+XeL2MjAysX78egwcPRteuXZGWloYDBw6UqfbSSEtLw9q1awGgTMHoUdnZ2UhPT5cdRET0bFBVdQFUNoMHD0ZoaCiuXr0KADh06BDWrl0LnU73xLG9evVC8+bNMXPmTERFRZVovbVr16Jhw4bw8fEBAAwcOBBRUVHo2LFjma+hOPXq1QMA3L9/HwDw+uuvw9vbW9Znx44dsLCwkLVNmzYN06ZNMzhneHg4PvnkE712yw6LYGVpXhFlG3Tn8u4n9rFt4F9p6xMRPQ8YaBTKwcEB3bt3x8qVKyGKIrp37w57e/sSj583bx46d+6MiRMnlqh/dHQ0Bg8eLD0ePHgwfH198fXXX8PS0rLU9T/JgQMHULNmTRw5cgRz587FsmXL9PpotVpERkbK2mxtbYucMzQ0FOPHj5cep6enw9nZueKKJiKiKsNAo2BDhw7FBx98AABYsmRJqcZ26tQJAQEBCA0Nld4VVZSzZ8/iyJEjiI+Px5QpU6T2/Px8rF27FiNGjHjielZWVkhLS9NrL3wnlbW1tazd3d0dNjY28PLywq1btzBgwADs379f1sfc3BweHh5PXLuQWq2GWq0ucX8iIlIO3kOjYIGBgcjJyUFubi4CAgJKPT4iIgLbt2/H4cOHi+0XFRWFTp064c8//0RCQoJ0jB8/vsQvWXl5eeHvv//GzZs3Ze0nTpyAqalpse/OGj16NE6fPo3NmzeXaC0iInr+cIdGwYyNjZGUlCT9ubSaNGmCQYMGYdGiRUX2yc3Nxffff4+wsDA0btxYdm748OH48ssvcebMGenemqIEBATAy8sLQUFB+PTTT6HRaHDixAl8/PHHGDNmTLH116xZEyNGjMDMmTPRs2dP6TNzsrOzpc/DKaRSqUr10hsRET0buEOjcFZWVrCysirz+LCwMBQUFBR5ftu2bbh9+zZ69eqld65Ro0Zo1KhRiXZpVCoVfvvtN7i4uCAoKAiNGzfGzJkzMWbMGMyePfuJ4z/44AMkJSVh/fr1UltsbCycnJxkR4cOHZ44FxERPXsEURTFqi6CqCqkp6fD2toaV05uqdR3OZUE3+VERFQ+3KEhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFU1V1AURVzba+tlzfWE5ERFWPOzRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4pQ40cXFxlVEHERERUZmVOtAEBgaiQYMG+PTTT3H9+vXKqImIiIioVEodaG7cuIEPPvgAGzZsQP369REQEICffvoJOTk5lVEfUaW7uqoJkqPcq7oMIiIqh1IHGnt7e4wbNw4JCQk4evQoPD09MWrUKNSpUwcffvgh/vzzz8qok4iIiKhI5bopuEWLFggNDcUHH3yAzMxMREdHo2XLlujYsSPOnDlTUTUSERERFatMgSY3NxcbNmzAq6++CldXV/z6669YvHgxbt68iUuXLsHV1RX9+vWr6FqJiIiIDCr1l1OGhIRgzZo1EEURb731Fj777DM0btxYOm9ubo4vvvgCderUqdBCiYiIiIpS6kBz9uxZfP311+jduzfUarXBPvb29nx7NxERET01pX7JaebMmejXr59emMnLy8P+/fsBACqVCr6+vhVTIREREdETlDrQaLVa3LlzR689LS0NWq22QooiIiIiKo1SBxpRFCEIgl777du3YW5uXiFFEREREZVGie+h6d27NwBAEAQEBwfLXnLKz8/HqVOn0L59+4qvkIiIiOgJShxorK2tATzcobG0tISZmZl0zsTEBG3btsWIESMqvkIiIiKiJyhxoImJiQEAuLm5YeLEiXx5iYiIiKqNMr3LSa1WY/fu3fjmm2+QkZEBAPjnn3+QmZlZ4QUSERERPUmpP4fm6tWrCAwMxLVr15CdnY2uXbvC0tIS8+bNQ3Z2NpYtW1YZdRIREREVqdQ7NGPGjMFLL72Eu3fvyu6j6dWrF/bs2VOhxREREVHpzZo1C82bN6/qMp6qUgeaAwcO4OOPP4aJiYms3c3NDTdu3KiwwoiIiJ5XqampCAkJQf369aFWq+Hs7IwePXpw46AYpQ40BQUFyM/P12v/+++/YWlpWSFFPY+e9MPr5uaGr776Surv5uYGQRBw5MgR2Txjx46Fn5+f9HjWrFkQBAGCIEClUsHe3h6dOnXCV199hezsbNlYPz8/qe+jx8iRI6U+j7ZbWVmhVatW2Lp1q2yelStXGpzH1NRU6hMcHIyePXsW+Xw8fr1FWbNmDYyNjTF69Ogn9iUiUoLk5GS0bNkSe/fuxeeff47ExETExsZCq9U+1X/rcnNzn9paFaHUgeaVV16R/aIRBAGZmZmYOXMmXn311Yqs7blR1h9eU1NTTJky5Ynz+/j4ICUlBdeuXUNcXBz69euH8PBwtG/fXrqpu9CIESOQkpIiOz777DNZn5iYGKSkpOD48eN4+eWX0bdvXyQmJsr6WFlZ6c1z9erVUjwrJRMVFYXJkydjzZo1yMrKqvD5iYietlGjRkEQBMTHx6NPnz7w9PSEj48Pxo8fL/1P7LVr1/DGG2/AwsICVlZW6N+/P27evFnknAUFBQgLC0O9evWgVqvRvHlzxMbGSueTk5MhCALWrVsHX19fmJqa4scff6z0a61IpQ408+fPx6FDh/DCCy8gKysLb775pvRy07x58yqjxmdeSX54DXn33Xdx5MgR/PLLL8XOr1KpoNFoUKdOHTRp0gQhISHYt28fTp8+rfd3VrNmTWg0GtlhZWUl62NjYwONRgNPT0/Mnj0beXl5el9GKgiC3jy1a9cu5TNTvCtXruD333/H1KlT4enpiU2bNhXbPzs7G+np6bKDiKg6uXPnDmJjYzF69GiDH49iY2ODgoICvPHGG7hz5w727duHXbt24a+//sKAAQOKnHfhwoWYP38+vvjiC5w6dQoBAQF4/fXXcfHiRVm/qVOnYsyYMUhKSkJAQECFX19lKnWgqVevHv78809MmzYN48aNw4svvoiIiAicPHkSjo6OlVHjM60kP7xFcXd3x8iRIxEaGoqCgoJSrevt7Y1u3bo9MQQUJy8vD1FRUQCgd0/V0xATE4Pu3bvD2toagwcPlmopSnh4OKytraXD2dkZAGDZYRGs/FY8jZKJiIp16dIliKIIb2/vIvvs2bMHiYmJWL16NVq2bIk2bdpg1apV2LdvH44dO2ZwzBdffIEpU6Zg4MCB8PLywrx589C8eXO9l/bHjh2L3r17w93dHU5OThV5aZWu1IEGePh//IMHD8Znn32GpUuXYvjw4bJ3PFHJleSHtzgff/wxrly5UqatQW9vbyQnJ8vali5dCgsLC9nx+NxBQUGwsLCAWq3GuHHj4Obmhv79+8v6pKWl6c3TrVu3UtdYlIKCAqxcuRKDBw8GAAwcOBAHDx7ElStXihwTGhqKtLQ06bh+/XqF1UNEVBFEUXxin6SkJDg7O0v/UwYAL7zwAmxsbJCUlKTXPz09Hf/88w9efvllWfvLL7+s1/+ll14qY+VVr0SfQ7Nt2zZ069YNNWrUwLZt24rt+/rrr1dIYc+LkvzwFsfBwQETJ07EjBkzit1uLGrtx79odNCgQfjoo49kbY+/VLRgwQL4+/vjr7/+wrhx47Bo0SLY2trK+lhaWuLEiROytooMvbt27cL9+/el+7bs7e3RtWtXREdHY/bs2QbHqNVq2XeQERFVNw0bNoQgCDh37lyVrK/kbwEoUaDp2bMnUlNT4ejoWOw7UwRBMPgOKCpaRfzwjh8/HkuXLsXSpUtLNS4pKQnu7u6yNmtra3h4eBQ7TqPRwMPDAx4eHoiJicGrr76Ks2fPyl5yNDIyeuI85REVFYU7d+7IQlJBQQFOnTqFTz75BEZGZdp8JCKqUra2tggICMCSJUvw4Ycf6gWMe/fuoVGjRrh+/TquX78u7dKcPXsW9+7dwwsvvKA3p5WVFerUqYNDhw7B19dXaj906BBat25duRf0FJXoX/2CggLpl1VBQUGRB8NM6T36w3v//n298/fu3XviHBYWFpg+fTrmzJmj966lopw7dw6xsbHo06dPaUuWad26NVq2bIk5c+aUa57SuH37NrZu3Yq1a9ciISFBOk6ePIm7d+/it99+e2q1EBFVtCVLliA/Px+tW7fGxo0bcfHiRSQlJWHRokVo164d/P390aRJEwwaNAgnTpxAfHw83n77bfj6+hb5ktGkSZMwb948rFu3DufPn8fUqVORkJCAMWPGPOWrqzyl+uqD3NxcBAYGYtmyZWjYsGFl1fTcWbJkCV5++WW0bt0aYWFhaNq0KfLy8rBr1y5ERkYafE30ce+++y4WLFiA1atXo02bNrJzeXl5SE1NRUFBAW7fvg2dTodPP/0UzZs3x6RJk2R9//vvP6Smpsra1Go1atWqVeTaY8eORa9evTB58mTUrVsXwMOXsx6fBwAcHR2l3ZO0tDQkJCTIztvZ2Un/x3Hjxg29866urvj+++9hZ2eH/v37671k9uqrryIqKgqBgYFF1ktEVJ3Vr18fJ06cwJw5czBhwgSkpKTAwcEBLVu2RGRkJARBwNatWxESEoJOnTrByMgIgYGB+Prrr4uc88MPP0RaWhomTJiAW7du4YUXXsC2bduerd/lYinZ29uLFy5cKO0weoJ//vlHHD16tOjq6iqamJiIdevWFV9//XUxLi5OFEVRdHV1FRcsWCD1f/yxKIri6tWrRQCir6+v1DZz5kwRgAhANDY2Fm1tbcUOHTqICxYsELOysmTjfX19pb6PHgEBAVIfAOLmzZtl4woKCkRvb2/x/fffF0VRFGNiYgzOA0BMSUkRRVEUhwwZYvD8sGHDpOszdP77778XmzRpIo4aNcrg87hu3TrRxMRE/Pfff5/4nKelpYkAxCsnt4i3L+16Yn8iIqq+BFEs3V2p48aNg1qtRkRERPmSFFEVS09Ph7W1Na6c3AIrS3PYNvCv6pKIiKiMSv1t23l5eYiOjsbu3bvRsmVLvRuWvvzyyworjoiIiKgkSh1oTp8+jRYtWgAALly4IDv3+P0MRERERE9DqQPN4x9xT0RERFTV+GEdREREpHil3qEBgOPHj+Onn37CtWvXkJOTIztXnu8GIiIiIiqLUu/QrF27Fu3bt0dSUhI2b96M3NxcnDlzBnv37oW1tXVl1EhERERUrFIHmrlz52LBggXYvn07TExMsHDhQpw7dw79+/eHi4tLZdRIREREVKxSB5rLly+je/fuAAATExPcv38fgiBg3LhxWL58eYUXSERERPQkpb6HplatWtL3BdWtWxenT59GkyZNcO/ePfz3338VXiAREdHTlBzl/uROFcRt2JWnttazrsQ7NKdPnwYAdOrUCbt27QIA9OvXD2PGjMGIESMQFBSELl26VE6VREREJLl+/TqGDh2KOnXqwMTEBK6urhgzZgxu374t9fHz84MgCBAEAaampvD09ER4eDgMfUHA4cOHYWxsLL0C86jk5GQIggBHR0e9L0Bu3rw5Zs2aJWu7dOkShg4dChcXF6jVatStWxddunTBjz/+iLy8PKlfYW2PH2vXri3Tc1LiQNO0aVO0adMGTZo0Qb9+/QAAH330EcaPH4+bN2+iT58+iIqKKlMRREREVDJ//fUXXnrpJVy8eBFr1qzBpUuXsGzZMuzZswft2rXDnTt3pL4jRoxASkoKzp8/j9DQUMyYMQPLli3TmzMqKgohISHYv38//vnnH4PrZmRk4Isvvii2tvj4eLRo0QJJSUlYsmQJTp8+DZ1Oh+HDhyMyMhJnzpyR9Y+JiUFKSors6NmzZ+mfFAAl/i6nAwcOICYmBhs2bEBBQQH69OmD4cOHo2PHjmVamKiqFX6XU1paGqysrKq6HCKqJqr7S07dunXD6dOnceHCBZiZmUntqampaNCgAd5++21ERkbCz88PzZs3x1dffSX1admyJVxdXWUfsZKZmQknJyccP34cM2fORNOmTTFt2jTpfHJyMtzd3TFp0iRERkbi8uXLcHR0BPBwh6Znz56YNWsWRFGEj48Patasifj4eBgZ6e+ZiKIofauAIAjYvHlzmQPM40q8Q9OxY0dER0cjJSUFX3/9NZKTk+Hr6wtPT0/MmzcPqampFVIQERERGXbnzh38+uuvGDVqlCzMAIBGo8GgQYOwbt06vZeVRFHEgQMHcO7cOZiYmMjO/fTTT/D29oaXlxcGDx6M6Ohogy9LBQUFwcPDA2FhYQZrS0hIQFJSEiZOnGgwzACV+xVJpX6Xk7m5Od555x3s27cPFy5cQL9+/bBkyRK4uLjg9ddfr4waiYiICMDFixchiiIaNWpk8HyjRo1w9+5d/PvvvwCApUuXwsLCAmq1Gp06dUJBQQE+/PBD2ZioqCgMHjwYABAYGIi0tDTs27dPb25BEBAREYHly5fj8uXLeucLv9/Ry8tLart16xYsLCykY+nSpbIxQUFBsvMWFha4du1aKZ6R/1eurz7w8PDAtGnT8PHHH8PS0hI///xzeaYjIiKiEijh3SIYNGgQEhIScOjQIXTr1g0fffQR2rdvL50/f/484uPjERQUBABQqVQYMGBAkffEBgQEoEOHDpg+fXqJ1rezs0NCQgISEhJgY2Oj9+0CCxYskM4XHnXq1CnR3I8r01cfAMD+/fsRHR2NjRs3wsjICP3798ewYcPKOh0RERE9gYeHBwRBQFJSEnr16qV3PikpCbVq1YKDgwMAwNraGh4eHgAevrTk4eGBtm3bwt/fH8DD3Zm8vDxZiBBFEWq1GosXLzb4DQARERFo164dJk2aJGtv2LAhgIch6cUXXwQAGBsbS+urVPqRQ6PRSOfLq1Q7NP/88w/mzp0LT09P+Pn54dKlS1i0aBH++ecfrFixAm3btq2QooiIiEifnZ0dunbtiqVLl+LBgweyc6mpqfjxxx8xYMAAg/eqWFhYYMyYMZg4cSJEUUReXh5WrVqF+fPny3ZI/vzzT9SpUwdr1qwxWEPr1q3Ru3dvTJ06Vdb+4osvwtvbG1988QUKCgoq7qJLqMQ7NN26dcPu3bthb2+Pt99+G0OHDpW9TkZERESVb/HixWjfvj0CAgLw6aefwt3dHWfOnMGkSZNQt25dzJkzp8ix7733HmbPno2NGzdCpVLh7t27GDZsmN5OTOFHsYwcOdLgPHPmzIGPj49s10UQBMTExKBr1654+eWXERoaikaNGiE3Nxf79+/Hv//+C2NjY9k89+7d03tTkaWlJczNzUv7tABiCfXo0UPcsmWLmJeXV9IhRNVaWlqaCEBMS0ur6lKIiEolOTlZHDJkiFi7dm2xRo0aorOzsxgSEiL+73//k/r4+vqKY8aM0Rv73nvviT4+PuJrr70mvvrqqwbnP3r0qAhA/PPPP8UrV66IAMSTJ0/K+rz77rsiAHHmzJmy9vPnz4tDhgwR69WrJ6pUKtHa2lrs1KmT+M0334i5ublSPwAGj/Dw8DI9JyX+HBqiZw0/h4aI6NlRrnc5EREREVUHZX6XE9Gz4uqqJrA008/2/NI4IiLl4A4NERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/h4aIiOgRdy7vfmpr2Tbwf2prPeu4Q0NERKQQy5Ytg6WlJfLy8qS2zMxM1KhRA35+frK+Op0OgiDg8uXLcHNzw1dffaU336xZs9C8eXODj93c3CAIQpFHcHAwABR5fu3atRV89cXjDg0REZFCaLVaZGZm4vjx42jbti0A4MCBA9BoNDh69CiysrJgamoKAIiLi4OLiwsaNGhQprWOHTuG/Px8AMDvv/+OPn364Pz589J335mZmUl9Y2JiEBgYKBtvY2NTpnXLioGGiIhIIby8vODk5ASdTicFGp1OhzfeeAN79+7FkSNHpJ0anU4HrVZb5rUcHBykP9va2gIAHB0dDQYVGxsbaDSaMq9VEfiSExERkYJotVrExcVJj+Pi4uDn5wdfX1+p/cGDBzh69Gi5Ao3SMNAQEREpiFarxaFDh5CXl4eMjAycPHkSvr6+6NSpE3Q6HQDg8OHDyM7OlgWaKVOmwMLCQnbMnTu3QmoKCgrSm/vatWsVMndJ8SUnIiIiBfHz88P9+/dx7Ngx3L17F56ennBwcICvry/eeecdZGVlQafToX79+nBxcZHGTZo0SbqRt9CiRYuwf//+cte0YMEC+PvL37FVp06dcs9bGtyheQYEBwcbvMP80qVLAIDw8HAYGxvj888/1xu7cuVK2euhK1eulMYbGRnByckJAwYMwLVr1yCKIvz9/REQEKA3z9KlS2FjYwN/f/9i74p3c3OTxpSmrpJe8+M3pRERPWs8PDxQr149xMXFIS4uDr6+vgAeBghnZ2f8/vvviIuLQ+fOnWXj7O3t4eHhITsK740pL41Goze3SvV090wYaJ4RgYGBSElJkR3u7u4AgOjoaEyePBnR0dElmsvKygopKSm4ceMGNm7ciPPnz6Nfv34QBAExMTE4evQovvnmG6n/lStXMHnyZHz99dfYuHGjrAbg4d3vhY+PHTsmjSttXSW55jVr1pRpLiIiJdFqtdDpdNDpdLK3a3fq1Ak7d+5EfHz8c3X/DMBA88xQq9XQaDSyw9jYGPv27cODBw8QFhaG9PR0/P7770+cSxAEaDQaODk5oX379hg2bBji4+ORnp4OZ2dnLFy4EBMnTsSVK1cgiiKGDRuGV155BW+99Rasra1lNQD/f/e7RqOR7povS10lueZatWqVeh4iIqXRarU4ePAgEhISpB0aAPD19cU333yDnJycpxpo7t27h9TUVNlx//79p7Y+wHtonnlRUVEICgpCjRo1EBQUhKioKLRv377E42/duoXNmzfD2NgYxsbGAIAhQ4Zg8+bNGDp0KHr37o3Tp0/jzJkzT7WussjOzkZ2drb0OD09vVLXIyJlUsKn92q1Wjx48ADe3t6oXbu21O7r64uMjAzp7d1PyzvvvKPXFh4ejqlTpz61GiCS4g0ZMkQ0NjYWzc3NpaNv375iWlqaaGZmJiYkJIiiKIonT54ULSwsxIyMDGlsTEyMaG1tLXsMQDQ3Nxdr1qwpAhABiB9++KFszZs3b4r29vaikZGRuHnz5iJrA6B3vix1leSazc3NxTlz5hQ5ZubMmdL1PHpcOblFvH1pV5HjiIio+uMOzTNCq9UiMjJSemxubo41a9agQYMGaNasGQCgefPmcHV1xbp16zBs2LAi57K0tMSJEyeQm5uLnTt34scff8ScOXNkfRwdHfHee+9hy5Yt6NmzZ6lqLWtdj3v8mgEUe4NbaGgoxo8fLz0ufAmNiIiUj4HmGWFubg4PDw9ZW1RUFM6cOSO707ygoADR0dHFBgcjIyNprkaNGuHy5ct4//338f3338v6qVSqMt3FXta6HmfomoujVquhVqtLVSsRESkDA80zKjExEcePH4dOp5PtWty5cwd+fn44d+4cvL29SzTX1KlT0aBBA4wbNw4tWrSoNnUREREVYqB5RkVFRaF169bo1KmT3rlWrVohKirK4Oe/GOLs7IxevXphxowZ2LFjx1OrKz8/HwkJCbI+arUajRo1AvDwJt/U1FTZeZVKBXt7+3LVSEREysO3bT+DcnJy8MMPP6BPnz4Gz/fp0werVq1Cbm5uieccN24cfv75Z8THxz+1ujIzM/Hiiy/Kjh49ekj9Y2Nj4eTkJDs6dOhQ5vqIiEi5BFEUxaougqgqpKenw9raGldOboGVpbki3qpJRESGcYeGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUT1XVBRBVNdv6WlhZWVV1GUREVA7coSEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgoefe1VVNkBzlXtVlEBFROTDQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQKFRwcDAEQZAOOzs7BAYG4tSpU7J+giBgy5YteuOTk5MhCAISEhL0zvn5+WHs2LHSYzc3N9lahUdERESR8xZ3zJ49G+bm5rh06ZJs7D///INatWph8eLFeuuam5ujRYsWWL9+vdR/1qxZBuf39vYuxTNJRETPAgYaBQsMDERKSgpSUlKwZ88eqFQqvPbaa5WyVlhYmLRW4RESEqLXz9nZWdZnwoQJ8PHxkbVNnDgRAQEBCA4ORkFBgTR2xIgRaNmyJUaPHq237smTJ9GqVSsMGDAAv//+u3T+8blTUlJw8ODBSnkOiIio+lJVdQFUdmq1GhqNBgCg0WgwdepUdOzYEf/++y8cHBwqdC1LS0tpreIYGxvL+llYWEClUumN/eabb+Dj44Mvv/wSEydOxMqVK3Ho0CEkJiZCEAS9dTUaDZYsWYIffvgB27dvR/v27QHA4NxFyc7ORnZ2tvQ4PT29ROOIiKj6Y6B5RmRmZuKHH36Ah4cH7OzsqrqcJ3JwcMDy5csRFBSEZs2aYdy4cVi4cCGcnZ2LHKNSqVCjRg3k5OSUac3w8HB88skneu2ubyfCysqqTHMSEVH1wJecFGzHjh2wsLCAhYUFLC0tsW3bNqxbtw5GRhX/1zplyhRprcLjwIED5ZqzZ8+e6N+/PwIDA+Hr64shQ4YU2TcnJwfh4eFIS0tD586dpfbExES9ukaOHGlwjtDQUKSlpUnH9evXy1U/ERFVH9yhUTCtVovIyEgAwN27d7F06VJ069YN8fHxcHV1rdC1Jk2ahODgYFlb3bp1yz3v9OnTsWrVKnz88ccGz0+ZMgUff/wxsrKyYGFhgYiICHTv3l067+XlhW3btsnGFLXbolaroVary10zERFVPww0CmZubg4PDw/p8bfffgtra2usWLECn376abFjC3/pp6Wl6Z27d+8erK2tZW329vaytSqKSqWS/fdxhUHKwsICtWvXlt1fAwAmJiaVUhcRESkLX3J6hgiCACMjIzx48OCJfW1tbWFvb48//vhD1p6eno5Lly7B09OzssoslcIgpdFo9MIMERFRIe7QKFh2djZSU1MBPHzJafHixcjMzESPHj1k/a5cuaL3eTMNGzbE+PHjMXfuXNSuXRtt27bF7du3MXv2bDg4OKB3796y/hkZGdJahWrWrFnlN9Pm5eXp1SUIAmrXrl1FFRERUVVgoFGw2NhYODk5AXj49mZvb2+sX78efn5+sn7jx4/XG3vgwAFMnjwZFhYWmDdvHi5fvgxbW1u8/PLLiIuLg5mZmaz/jBkzMGPGDFnbe++9h2XLllXsRZXSmTNnpOegkFqtRlZWVhVVREREVUEQRVGs6iKIqkJ6ejqsra2RlpZW5TtNRERUPryHhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+Bhp57V1c1QXKUe1WXQURE5cBAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BTCsHBwejZs6esbcOGDTA1NcX8+fOlPoIgICIiQtZvy5YtEARBerxy5UrY2NgYXEcQBGzZskXWtnHjRvj5+cHa2hoWFhZo2rQpwsLCcOfOnSLnS0pKgrOzM/r164ecnJxi13y09sePwMDAIsfMmjULzZs312tPTk6GIAhISEiQPTZ0HDlyRDb2wYMHsLW1hb29PbKzs/XmdnNzk8aamZnBzc0N/fv3x969e4usk4iInm0MNOXw7bffYtCgQYiMjMSECROkdlNTU8ybNw93796tkHU++ugjDBgwAK1atcLOnTtx+vRpzJ8/H3/++Se+//57g2OOHTuGjh07IjAwEOvWrYOJiUmJ1goMDERKSorsWLNmTYVcBwDs3r1bb/6WLVvK+mzcuBE+Pj7w9vbWC3aFwsLCkJKSgvPnz2PVqlWwsbGBv78/5syZU2G1EhGRcqiqugCl+uyzzzBz5kysXbsWvXr1kp3z9/fHpUuXEB4ejs8++6xc68THx2Pu3Ln46quvMGbMGKndzc0NXbt2xb179/TG7N27F2+88QZGjRqFefPmlWo9tVoNjUZTrpqLY2dn98T5o6KiMHjwYIiiiKioKAwYMECvj6WlpTSPi4sLOnXqBCcnJ8yYMQN9+/aFl5dXpdRPRETVE3doymDKlCmYPXs2duzYoRdmAMDY2Bhz587F119/jb///rtca/3444+wsLDAqFGjDJ5//CWkzZs3o3v37vj4449LHWaqg8uXL+Pw4cPo378/+vfvjwMHDuDq1aslGjtmzBiIooitW7caPJ+dnY309HTZQUREzwYGmlLauXMnPvvsM2zduhVdunQpsl+vXr3QvHlzzJw5s1zrXbx4EfXr10eNGjWe2DczMxP9+vXDpEmTMGXKlDKtt2PHDlhYWMiOuXPnFjsmMTFRb4yPj4/Bvu3bt9fr+6jo6Gh069YNtWrVgq2tLQICAhATE1Oi2m1tbeHo6Ijk5GSD58PDw2FtbS0dzs7OAADXtxPhNuxKidYgIqLqiS85lVLTpk3xv//9DzNnzkTr1q31fiE/at68eejcuTMmTpxY5vVEUSxxXzMzM3To0AErVqxAUFAQGjVqVOr1tFotIiMjZW22trbFjvHy8sK2bdtkbTdu3ICfn59e33Xr1hVZV35+Pr777jssXLhQahs8eDAmTpyIGTNmwMjoyflbFEXZzdePCg0Nxfjx46XH6enpUqghIiJlY6Appbp162LDhg3QarUIDAzEzp07YWlpabBvp06dEBAQgNDQUAQHB8vOWVlZ4f79+ygoKJD9oi68J8ba2hoA4OnpiYMHDyI3N/eJuzTGxsbYsmULevfuDa1Wi7i4uFKHGnNzc3h4eJRqjImJid4Ylcrwj5azs3OR8//666+4ceOG3j0z+fn52LNnD7p27VpsHbdv38a///4Ld3d3g+fVajXUanWxcxARkTLxJacycHV1xb59+5CamorAwEBkZGQU2TciIgLbt2/H4cOHZe1eXl7Iy8uT3tZc6MSJEwAeBhkAePPNN5GZmYmlS5canP/xm4LVajU2bdqEVq1aQavV4uzZs6W8uqoTFRWFgQMHIiEhQXYMHDgQUVFRTxy/cOFCGBkZ6b21noiInn3coSkjZ2dn6HQ6aLVaBAQEIDY2FlZWVnr9mjRpgkGDBmHRokWydh8fH7zyyisYOnQo5s+fj/r16+P8+fMYO3YsBgwYgLp16wIA2rRpg8mTJ2PChAm4ceMGevXqhTp16uDSpUtYtmwZOnToIHv3E/Aw1GzcuBH9+vWDVqvF3r17pXta8vPz9UKUWq2WdnKys7ORmpoqO69SqWBvb1+u56vQ7du39ea3sbFBRkYGtm/fjm3btqFx48ay82+//TZ69eqFO3fuSC9/ZWRkIDU1Fbm5ubhy5Qp++OEHfPvttwgPDy/1DhMRESkfA0051KtXTxZqfv31V4P9wsLCsG7dOr32devWYebMmXjvvffwzz//oF69eujVqxemT58u6zdv3jy0bNkSS5YswbJly1BQUIAGDRqgb9++GDJkiME1TUxMsGHDBvTv318KNcDDG4dffPFFWd8GDRrg0qVLAIDY2Fg4OTnJznt5eeHcuXMle1KewN/fX69tzZo1uHHjBszNzQ3eaN2lSxeYmZnhhx9+wIcffggAmDFjBmbMmAETExNoNBq0bdsWe/bsgVarrZA6iYhIWQSxNHedEj1D0tPTYW1tjbS0NIO7a0REpBy8h4aIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUr0oDTXBwMHr27KnXrtPpIAgC7t27J7Xl5+djwYIFaNKkCUxNTVGrVi1069YNhw4dkvqcO3cOgiDgyJEjsvnatm0LU1NTZGVlSW1ZWVkwNTVFVFSUVIsgCBAEATVq1EDt2rXRtWtXREdHo6CgQDafm5ub1PfRIyIiAgCQnJwMQRDg6OiIjIwM2djmzZtj1qxZBp+P8tZfkufy0cePXrOhw83NDQDg5+dn8PzIkSMNXkdxcwqCAK1Wixo1auDgwYOycffv30f9+vUxceJEvXVNTU3xwgsvYOnSpVL/lStXGpzf1NTUYF1ERPTsUsQOjSiKGDhwIMLCwjBmzBgkJSVBp9PB2dkZfn5+2LJlCwDA29sbGo0GOp1OGpuRkYETJ07AwcFBFhQOHz6M7OxsdO7cWWoLDAxESkoKkpOTsXPnTmi1WowZMwavvfYa8vLyZDWFhYUhJSVFdoSEhMj6ZGRk4IsvvijxdZa3/tJauHChrH4AiImJkR4fO3ZM6jtixAi96/3ss88Mzvton6+++gpWVlaytu3btyMkJATBwcG4f/++NG7y5MkwMzPDp59+qrfu2bNn0b9/f4wePRpr1qyRzj8+d0pKCq5evVrm54SIiJRJEYHmp59+woYNG7Bq1SoMHz4c7u7uaNasGZYvX47XX38dw4cPl34xarVaWSA4ePAgPD090aNHD1m7TqeDq6sr3N3dpTa1Wg2NRoO6deuiRYsWmDZtGrZu3YqdO3di5cqVsposLS2h0Whkh7m5uaxPSEgIvvzyS9y6davE11qe+kvL2tpaVj8A2NjYSI8dHBykvjVr1tS7XisrK4PzPtrH2toagiDI2iwsLDB37lyYmJhgypQpAIC4uDh8++23WLVqlWyHpXDd+vXrY9asWWjYsCG2bdsmnX98bo1Gg9q1axusKzs7G+np6bKDiIieDYoINKtXr5Z+qT9uwoQJuH37Nnbt2gXgYSA4ePCgtKMSFxcHPz8/+Pr6Ii4uThoXFxcHrVb7xLU7d+6MZs2aYdOmTaWuOygoCB4eHggLCyvxmIquv7oyNTXFqlWrsHz5cmzduhVDhw7FtGnT0LJly2LHmZmZIScnp0xrhoeHw9raWjqcnZ0BAHf+isOdy7sr9CAioqerygPNjh07YGFhITu6desm63PhwgU0atTI4PjC9gsXLgB4GAju378vvVyi0+ng6+uLTp064ejRo8jKysKDBw8QHx9f4kDg7e2N5ORkWduUKVP06j5w4ICsT+F9NcuXL8fly5dLtFZ56i/Jc1lWS5cu1Zv7xx9/LNecL730EkJDQ9G7d2/Y2dnho48+KrJvfn4+fvjhB5w6dUr2MltaWlqJrzk0NBRpaWnScf369XLVT0RE1YeqqgvQarWIjIyUtR09ehSDBw+WtYmiWKL5PDw8UK9ePeh0Ovj4+ODkyZPw9fWFo6MjXFxccPjwYYiiiOzs7BIHGlEUIQiCrG3SpEkIDg6WtdWtW1dvbEBAADp06IDp06dj9erVlVp/SZ/Lshg0aJBe4CjqpZ3SmD59OsLCwjB16lSoVPo/jkuXLsW3336LnJwcGBsbY9y4cXj//fel85aWljhx4oRsjJmZmcG11Go11Gp1uWsmIqLqp8oDjbm5OTw8PGRtf//9t+yxp6cnkpKSDI4vbPf09JTa/Pz8EBcXh6ZNm6Jhw4ZwdHQEAOllG1EU4eHhIb3k8CRJSUl696rY29vr1V2UiIgItGvXDpMmTSpR/7LWX5Lnsqysra1LfL2lURhiDIUZ4P+DlJmZGZycnGBkJN9UNDIyqpS6iIhIWar8JaeSGDhwIC5evIjt27frnZs/fz7s7OzQtWtXqU2r1eL333/Hrl274OfnJ7V36tQJOp0OOp2uxLsze/fuRWJiIvr06VPm+lu3bo3evXtj6tSpJepfkfUrXWGQqlu3rl6YISIiKlTlOzQlMXDgQKxfvx5DhgzB559/ji5duiA9PR1LlizBtm3bsH79etk7jArvQ4mOjsaKFSukdl9fXwwfPhwAMGrUKL11srOzkZqaivz8fNy8eROxsbEIDw/Ha6+9hrffflvWNyMjA6mpqbK2mjVrFvnOnzlz5sDHx6fInYhHlbX+yvTff//pXa9arUatWrWeah2PE0VRry4AcHR0ZAAiInqOKOJffEEQ8NNPP2HatGlYsGABvLy80LFjR1y9ehU6nU7vA+Xc3d3h6uqKjIwM+Pr6Su0uLi6oU6cOcnJyZDsfhWJjY+Hk5AQ3NzcEBgYiLi4OixYtwtatW2FsbCzrO2PGDDg5OcmOyZMnF3kNnp6eGDp0qOzD8YpS1vor04oVK/SuNygo6KnWYEh6erpeXU5OTqV6qzwRESmfIJb0bluiZ0x6ejqsra1x5eQWWFmaP3lAKdg28K/Q+YiIqHiK2KEhIiIiKg4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESmeIr5tm6gy2dbXFvkt6UREpAzcoSEiIiLFY6AhIiIixWOgISIiIsXjPTT03BJFEQCQnp5exZUQ0dNmaWkJQRCqugyqQAw09Ny6ffs2AMDZ2bmKKyGipy0tLY1vBnjGMNDQc8vW1hYAcO3aNVhbW1dxNSWXnp4OZ2dnXL9+XTH/ICuxZkCZdSuxZuDp121paVnpa9DTxUBDzy0jo4e3kFlbWyvqH/5CVlZWiqtbiTUDyqxbiTUDyq2bqh5vCiYiIiLFY6AhIiIixWOgoeeWWq3GzJkzoVarq7qUUlFi3UqsGVBm3UqsGVBu3VR9CGLhe1eJiIiIFIo7NERERKR4DDRERESkeAw0REREpHgMNERERKR4DDT03FqyZAnc3NxgamqKNm3aID4+vspq2b9/P3r06IE6depAEARs2bJFdl4URcyYMQNOTk4wMzODv78/Ll68KOtz584dDBo0CFZWVrCxscGwYcOQmZlZaTWHh4ejVatWsLS0hKOjI3r27Inz58/L+mRlZWH06NGws7ODhYUF+vTpg5s3b8r6XLt2Dd27d0fNmjXh6OiISZMmIS8vr9LqjoyMRNOmTaUPcGvXrh127txZrWt+XEREBARBwNixY6t13bNmzYIgCLLD29u7WtdMCiYSPYfWrl0rmpiYiNHR0eKZM2fEESNGiDY2NuLNmzerpJ5ffvlF/Oijj8RNmzaJAMTNmzfLzkdERIjW1tbili1bxD///FN8/fXXRXd3d/HBgwdSn8DAQLFZs2bikSNHxAMHDogeHh5iUFBQpdUcEBAgxsTEiKdPnxYTEhLEV199VXRxcREzMzOlPiNHjhSdnZ3FPXv2iMePHxfbtm0rtm/fXjqfl5cnNm7cWPT39xdPnjwp/vLLL6K9vb0YGhpaaXVv27ZN/Pnnn8ULFy6I58+fF6dNmybWqFFDPH36dLWt+VHx8fGim5ub2LRpU3HMmDFSe3Wse+bMmaKPj4+YkpIiHf/++2+1rpmUi4GGnkutW7cWR48eLT3Oz88X69SpI4aHh1dhVQ89HmgKCgpEjUYjfv7551LbvXv3RLVaLa5Zs0YURVE8e/asCEA8duyY1Gfnzp2iIAjijRs3nkrdt27dEgGI+/btk2qsUaOGuH79eqlPUlKSCEA8fPiwKIoPg5yRkZGYmpoq9YmMjBStrKzE7Ozsp1K3KIpirVq1xG+//bba15yRkSE2bNhQ3LVrl+jr6ysFmupa98yZM8VmzZoZPFddaybl4ktO9NzJycnBH3/8AX9/f6nNyMgI/v7+OHz4cBVWZtiVK1eQmpoqq9fa2hpt2rSR6j18+DBsbGzw0ksvSX38/f1hZGSEo0ePPpU609LSAPz/l37+8ccfyM3NldXt7e0NFxcXWd1NmjRB7dq1pT4BAQFIT0/HmTNnKr3m/Px8rF27Fvfv30e7du2qfc2jR49G9+7dZfUB1fu5vnjxIurUqYP69etj0KBBuHbtWrWvmZSJX05Jz53//e9/yM/Pl/0jCQC1a9fGuXPnqqiqoqWmpgKAwXoLz6WmpsLR0VF2XqVSwdbWVupTmQoKCjB27Fi8/PLLaNy4sVSTiYkJbGxsiq3b0HUVnqssiYmJaNeuHbKysmBhYYHNmzfjhRdeQEJCQrWtee3atThx4gSOHTumd666Ptdt2rTBypUr4eXlhZSUFHzyySfo2LEjTp8+XW1rJuVioCGichs9ejROnz6NgwcPVnUpJeLl5YWEhASkpaVhw4YNGDJkCPbt21fVZRXp+vXrGDNmDHbt2gVTU9OqLqfEunXrJv25adOmaNOmDVxdXfHTTz/BzMysCiujZxFfcqLnjr29PYyNjfXeTXHz5k1oNJoqqqpohTUVV69Go8GtW7dk5/Py8nDnzp1Kv6YPPvgAO3bsQFxcHOrVqyerOycnB/fu3Su2bkPXVXiuspiYmMDDwwMtW7ZEeHg4mjVrhoULF1bbmv/44w/cunULLVq0gEqlgkqlwr59+7Bo0SKoVCrUrl27Wtb9OBsbG3h6euLSpUvV9rkm5WKgoeeOiYkJWrZsiT179khtBQUF2LNnD9q1a1eFlRnm7u4OjUYjqzc9PR1Hjx6V6m3Xrh3u3buHP/74Q+qzd+9eFBQUoE2bNpVSlyiK+OCDD7B582bs3bsX7u7usvMtW7ZEjRo1ZHWfP38e165dk9WdmJgoC2O7du2ClZUVXnjhhUqp25CCggJkZ2dX25q7dOmCxMREJCQkSMdLL72EQYMGSX+ujnU/LjMzE5cvX4aTk1O1fa5Jwar6rmSiqrB27VpRrVaLK1euFM+ePSu+++67oo2NjezdFE9TRkaGePLkSfHkyZMiAPHLL78UT548KV69elUUxYdv27axsRG3bt0qnjp1SnzjjTcMvm37xRdfFI8ePSoePHhQbNiwYaW+bfv9998Xra2tRZ1OJ3tb7n///Sf1GTlypOji4iLu3btXPH78uNiuXTuxXbt20vnCt+W+8sorYkJCghgbGys6ODhU6ttyp06dKu7bt0+8cuWKeOrUKXHq1KmiIAjib7/9Vm1rNuTRdzlV17onTJgg6nQ68cqVK+KhQ4dEf39/0d7eXrx161a1rZmUi4GGnltff/216OLiIpqYmIitW7cWjxw5UmW1xMXFiQD0jiFDhoii+PCt29OnTxdr164tqtVqsUuXLuL58+dlc9y+fVsMCgoSLSwsRCsrK/Gdd94RMzIyKq1mQ/UCEGNiYqQ+Dx48EEeNGiXWqlVLrFmzptirVy8xJSVFNk9ycrLYrVs30czMTLS3txcnTJgg5ubmVlrdQ4cOFV1dXUUTExPRwcFB7NKlixRmqmvNhjweaKpj3QMGDBCdnJxEExMTsW7duuKAAQPES5cuVeuaSbkEURTFqtkbIiIiIqoYvIeGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiKgUkpOTIQgCEhISqroUInoEAw0REREpHgMNESlKQUEBPvvsM3h4eECtVsPFxQVz5swBACQmJqJz584wMzODnZ0d3n33XWRmZkpj/fz8MHbsWNl8PXv2RHBwsPTYzc0Nc+fOxdChQ2FpaQkXFxcsX75cOu/u7g4AePHFFyEIAvz8/CrtWomo5BhoiEhRQkNDERERgenTp+Ps2bNYvXo1ateujfv37yMgIAC1atXCsWPHsH79euzevRsffPBBqdeYP38+XnrpJZw8eRKjRo3C+++/j/PnzwMA4uPjAQC7d+9GSkoKNm3aVKHXR0Rlo6rqAoiISiojIwMLFy7E4sWLMWTIEABAgwYN0KFDB6xYsQJZWVlYtWoVzM3NAQCLFy9Gjx49MG/ePNSuXbvE67z66qsYNWoUAGDKlClYsGAB4uLi4OXlBQcHBwCAnZ0dNBpNBV8hEZUVd2iISDGSkpKQnZ2NLl26GDzXrFkzKcwAwMsvv4yCggJpd6WkmjZtKv1ZEARoNBrcunWr7IUTUaVjoCEixTAzMyvXeCMjI4iiKGvLzc3V61ejRg3ZY0EQUFBQUK61iahyMdAQkWI0bNgQZmZm2LNnj965Ro0a4c8//8T9+/eltkOHDsHIyAheXl4AAAcHB6SkpEjn8/Pzcfr06VLVYGJiIo0louqDgYaIFMPU1BRTpkzB5MmTsWrVKly+fBlHjhxBVFQUBg0aBFNTUwwZMgSnT59GXFwcQkJC8NZbb0n3z3Tu3Bk///wzfv75Z5w7dw7vv/8+7t27V6oaHB0dYWZmhtjYWNy8eRNpaWmVcKVEVFoMNESkKNOnT8eECRMwY8YMNGrUCAMGDMCtW7dQs2ZN/Prrr7hz5w5atWqFvn37okuXLli8eLE0dujQoRgyZAjefvtt+Pr6on79+tBqtaVaX6VSYdGiRfjmm29Qp04dvPHGGxV9iURUBoL4+AvKRERERArDHRoiIiJSPAYaIiIiUjwGGiIiIlI8BhoiIiJSPAYaIiIiUjwGGiIiIlI8BhoiIiJSPAYaIiIiUjwGGiIiIlI8BhoiIiJSPAYaIiIiUrz/A+sUfVTiRBWAAAAAAElFTkSuQmCC", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "import seaborn as sns\n", - "# Specify colors for each values of the hue variable\n", - "palette = {\n", - " 'ORANGE': 'orange',\n", - " 'WHITE': 'wheat',\n", - "}\n", - "# Plot a bar plot to visualize how many pumpkins of each variety are orange or white\n", - "sns.catplot(\n", - " data=pumpkins, y=\"Variety\", hue=\"Color\", kind=\"count\",\n", - " palette=palette, \n", - ")" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Pré-processamento de dados\n", - "\n", - "Vamos codificar as características e os rótulos para melhor visualizar os dados e treinar o modelo\n" - ] - }, - { - "cell_type": "code", - "execution_count": 66, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array(['med', 'lge', 'sml', 'xlge', 'med-lge', 'jbo', 'exjbo'],\n", - " dtype=object)" - ] - }, - "execution_count": 66, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Let's look at the different values of the 'Item Size' column\n", - "pumpkins['Item Size'].unique()" - ] - }, - { - "cell_type": "code", - "execution_count": 67, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import OrdinalEncoder\n", - "# Encode the 'Item Size' column using ordinal encoding\n", - "item_size_categories = [['sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo']]\n", - "ordinal_features = ['Item Size']\n", - "ordinal_encoder = OrdinalEncoder(categories=item_size_categories)" - ] - }, - { - "cell_type": "code", - "execution_count": 68, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import OneHotEncoder\n", - "# Encode all the other features using one-hot encoding\n", - "categorical_features = ['City Name', 'Package', 'Variety', 'Origin']\n", - "categorical_encoder = OneHotEncoder(sparse_output=False)" - ] - }, - { - "cell_type": "code", - "execution_count": 69, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
ord__Item Sizecat__City Name_ATLANTAcat__City Name_BALTIMOREcat__City Name_BOSTONcat__City Name_CHICAGOcat__City Name_COLUMBIAcat__City Name_DALLAScat__City Name_DETROITcat__City Name_LOS ANGELEScat__City Name_MIAMI...cat__Origin_MICHIGANcat__Origin_NEW JERSEYcat__Origin_NEW YORKcat__Origin_NORTH CAROLINAcat__Origin_OHIOcat__Origin_PENNSYLVANIAcat__Origin_TENNESSEEcat__Origin_TEXAScat__Origin_VERMONTcat__Origin_VIRGINIA
21.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
31.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.01.0
43.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
53.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
61.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
\n", - "

5 rows × 48 columns

\n", - "
" - ], - "text/plain": [ - " ord__Item Size cat__City Name_ATLANTA cat__City Name_BALTIMORE \n", - "2 1.0 0.0 1.0 \\\n", - "3 1.0 0.0 1.0 \n", - "4 3.0 0.0 1.0 \n", - "5 3.0 0.0 1.0 \n", - "6 1.0 0.0 1.0 \n", - "\n", - " cat__City Name_BOSTON cat__City Name_CHICAGO cat__City Name_COLUMBIA \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_DALLAS cat__City Name_DETROIT cat__City Name_LOS ANGELES \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_MIAMI ... cat__Origin_MICHIGAN cat__Origin_NEW JERSEY \n", - "2 0.0 ... 0.0 0.0 \\\n", - "3 0.0 ... 0.0 0.0 \n", - "4 0.0 ... 0.0 0.0 \n", - "5 0.0 ... 0.0 0.0 \n", - "6 0.0 ... 0.0 0.0 \n", - "\n", - " cat__Origin_NEW YORK cat__Origin_NORTH CAROLINA cat__Origin_OHIO \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_PENNSYLVANIA cat__Origin_TENNESSEE cat__Origin_TEXAS \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_VERMONT cat__Origin_VIRGINIA \n", - "2 0.0 0.0 \n", - "3 0.0 1.0 \n", - "4 0.0 0.0 \n", - "5 0.0 0.0 \n", - "6 0.0 0.0 \n", - "\n", - "[5 rows x 48 columns]" - ] - }, - "execution_count": 69, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from sklearn.compose import ColumnTransformer\n", - "ct = ColumnTransformer(transformers=[\n", - " ('ord', ordinal_encoder, ordinal_features),\n", - " ('cat', categorical_encoder, categorical_features)\n", - " ])\n", - "# Get the encoded features as a pandas DataFrame\n", - "ct.set_output(transform='pandas')\n", - "encoded_features = ct.fit_transform(pumpkins)\n", - "encoded_features.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 70, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
ord__Item Sizecat__City Name_ATLANTAcat__City Name_BALTIMOREcat__City Name_BOSTONcat__City Name_CHICAGOcat__City Name_COLUMBIAcat__City Name_DALLAScat__City Name_DETROITcat__City Name_LOS ANGELEScat__City Name_MIAMI...cat__Origin_NEW JERSEYcat__Origin_NEW YORKcat__Origin_NORTH CAROLINAcat__Origin_OHIOcat__Origin_PENNSYLVANIAcat__Origin_TENNESSEEcat__Origin_TEXAScat__Origin_VERMONTcat__Origin_VIRGINIAColor
21.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
31.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.01.00
43.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
53.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
61.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
\n", - "

5 rows × 49 columns

\n", - "
" - ], - "text/plain": [ - " ord__Item Size cat__City Name_ATLANTA cat__City Name_BALTIMORE \n", - "2 1.0 0.0 1.0 \\\n", - "3 1.0 0.0 1.0 \n", - "4 3.0 0.0 1.0 \n", - "5 3.0 0.0 1.0 \n", - "6 1.0 0.0 1.0 \n", - "\n", - " cat__City Name_BOSTON cat__City Name_CHICAGO cat__City Name_COLUMBIA \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_DALLAS cat__City Name_DETROIT cat__City Name_LOS ANGELES \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_MIAMI ... cat__Origin_NEW JERSEY cat__Origin_NEW YORK \n", - "2 0.0 ... 0.0 0.0 \\\n", - "3 0.0 ... 0.0 0.0 \n", - "4 0.0 ... 0.0 0.0 \n", - "5 0.0 ... 0.0 0.0 \n", - "6 0.0 ... 0.0 0.0 \n", - "\n", - " cat__Origin_NORTH CAROLINA cat__Origin_OHIO cat__Origin_PENNSYLVANIA \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_TENNESSEE cat__Origin_TEXAS cat__Origin_VERMONT \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_VIRGINIA Color \n", - "2 0.0 0 \n", - "3 1.0 0 \n", - "4 0.0 0 \n", - "5 0.0 0 \n", - "6 0.0 0 \n", - "\n", - "[5 rows x 49 columns]" - ] - }, - "execution_count": 70, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from sklearn.preprocessing import LabelEncoder\n", - "# Encode the 'Color' column using label encoding\n", - "label_encoder = LabelEncoder()\n", - "encoded_label = label_encoder.fit_transform(pumpkins['Color'])\n", - "encoded_pumpkins = encoded_features.assign(Color=encoded_label)\n", - "encoded_pumpkins.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 71, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "['ORANGE', 'WHITE']" - ] - }, - "execution_count": 71, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Let's look at the mapping between the encoded values and the original values\n", - "list(label_encoder.inverse_transform([0, 1]))" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 81, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 81, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "palette = {\n", - " 'ORANGE': 'orange',\n", - " 'WHITE': 'wheat',\n", - "}\n", - "# We need the encoded Item Size column to use it as the x-axis values in the plot\n", - "pumpkins['Item Size'] = encoded_pumpkins['ord__Item Size']\n", - "\n", - "g = sns.catplot(\n", - " data=pumpkins,\n", - " x=\"Item Size\", y=\"Color\", row='Variety',\n", - " kind=\"box\", orient=\"h\",\n", - " sharex=False, margin_titles=True,\n", - " height=1.8, aspect=4, palette=palette,\n", - ")\n", - "# Defining axis labels \n", - "g.set(xlabel=\"Item Size\", ylabel=\"\").set(xlim=(0,6))\n", - "g.set_titles(row_template=\"{row_name}\")\n" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "import warnings\n", - "warnings.filterwarnings(action='ignore', category=UserWarning, module='seaborn')" - ] - }, - { - "cell_type": "code", - "execution_count": 37, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 37, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "# Suppressing warning message claiming that a portion of points cannot be placed into the plot due to the high number of data points\n", - "import warnings\n", - "warnings.filterwarnings(action='ignore', category=UserWarning, module='seaborn')\n", - "\n", - "palette = {\n", - " 0: 'orange',\n", - " 1: 'wheat'\n", - "}\n", - "sns.swarmplot(x=\"Color\", y=\"ord__Item Size\", hue=\"Color\", data=encoded_pumpkins, palette=palette)" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [ - "**Atenção**: Ignorar avisos NÃO é uma boa prática e deve ser evitado sempre que possível. Avisos geralmente contêm mensagens úteis que nos permitem melhorar nosso código e resolver um problema. \n", - "O motivo pelo qual estamos ignorando este aviso específico é para garantir a legibilidade do gráfico. Plotar todos os pontos de dados com um tamanho de marcador reduzido, mantendo a consistência com a paleta de cores, gera uma visualização pouco clara.\n" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 74, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "# X is the encoded features\n", - "X = encoded_pumpkins[encoded_pumpkins.columns.difference(['Color'])]\n", - "# y is the encoded label\n", - "y = encoded_pumpkins['Color']\n", - "\n", - "# Split the data into training and test sets\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)" - ] - }, - { - "cell_type": "code", - "execution_count": 75, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - " precision recall f1-score support\n", - "\n", - " 0 0.94 0.98 0.96 166\n", - " 1 0.85 0.67 0.75 33\n", - "\n", - " accuracy 0.92 199\n", - " macro avg 0.89 0.82 0.85 199\n", - "weighted avg 0.92 0.92 0.92 199\n", - "\n", - "Predicted labels: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0\n", - " 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0\n", - " 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0\n", - " 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0\n", - " 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1\n", - " 0 0 0 1 0 0 0 0 0 0 0 0 1 1]\n", - "F1-score: 0.7457627118644068\n" - ] - } - ], - "source": [ - "from sklearn.metrics import f1_score, classification_report \n", - "from sklearn.linear_model import LogisticRegression\n", - "\n", - "# Train a logistic regression model on the pumpkin dataset\n", - "model = LogisticRegression()\n", - "model.fit(X_train, y_train)\n", - "predictions = model.predict(X_test)\n", - "\n", - "# Evaluate the model and print the results\n", - "print(classification_report(y_test, predictions))\n", - "print('Predicted labels: ', predictions)\n", - "print('F1-score: ', f1_score(y_test, predictions))" - ] - }, - { - "cell_type": "code", - "execution_count": 76, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array([[162, 4],\n", - " [ 11, 22]])" - ] - }, - "execution_count": 76, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from sklearn.metrics import confusion_matrix\n", - "confusion_matrix(y_test, predictions)" - ] - }, - { - "cell_type": "code", - "execution_count": 77, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "from sklearn.metrics import roc_curve, roc_auc_score\n", - "import matplotlib\n", - "import matplotlib.pyplot as plt\n", - "%matplotlib inline\n", - "\n", - "y_scores = model.predict_proba(X_test)\n", - "# calculate ROC curve\n", - "fpr, tpr, thresholds = roc_curve(y_test, y_scores[:,1])\n", - "\n", - "# plot ROC curve\n", - "fig = plt.figure(figsize=(6, 6))\n", - "# Plot the diagonal 50% line\n", - "plt.plot([0, 1], [0, 1], 'k--')\n", - "# Plot the FPR and TPR achieved by our model\n", - "plt.plot(fpr, tpr)\n", - "plt.xlabel('False Positive Rate')\n", - "plt.ylabel('True Positive Rate')\n", - "plt.title('ROC Curve')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 78, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "0.9749908725812341\n" - ] - } - ], - "source": [ - "# Calculate AUC score\n", - "auc = roc_auc_score(y_test,y_scores[:,1])\n", - "print(auc)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.16" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "vscode": { - "interpreter": { - "hash": "949777d72b0d2535278d3dc13498b2535136f6dfe0678499012e853ee9abcab1" - } - }, - "coopTranslator": { - "original_hash": "ef50cc584e0b79412610cc7da15e1f86", - "translation_date": "2025-08-29T22:58:37+00:00", - "source_file": "2-Regression/4-Logistic/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/2-Regression/README.md b/translations/br/2-Regression/README.md deleted file mode 100644 index f783e746d..000000000 --- a/translations/br/2-Regression/README.md +++ /dev/null @@ -1,54 +0,0 @@ - -# Modelos de regressão para aprendizado de máquina -## Tópico regional: Modelos de regressão para preços de abóboras na América do Norte 🎃 - -Na América do Norte, as abóboras são frequentemente esculpidas em rostos assustadores para o Halloween. Vamos descobrir mais sobre esses vegetais fascinantes! - -![jack-o-lanterns](../../../translated_images/pt-BR/jack-o-lanterns.181c661a9212457d.webp) -> Foto de Beth Teutschmann no Unsplash - -## O que você vai aprender - -[![Introdução à Regressão](https://img.youtube.com/vi/5QnJtDad4iQ/0.jpg)](https://youtu.be/5QnJtDad4iQ "Vídeo de introdução à regressão - Clique para assistir!") -> 🎥 Clique na imagem acima para um vídeo rápido de introdução a esta lição - -As lições desta seção abordam os tipos de regressão no contexto do aprendizado de máquina. Os modelos de regressão podem ajudar a determinar o _relacionamento_ entre variáveis. Esse tipo de modelo pode prever valores como comprimento, temperatura ou idade, revelando assim relações entre variáveis enquanto analisa pontos de dados. - -Nesta série de lições, você descobrirá as diferenças entre regressão linear e logística, e quando deve preferir uma em vez da outra. - -[![ML para iniciantes - Introdução aos modelos de regressão para aprendizado de máquina](https://img.youtube.com/vi/XA3OaoW86R8/0.jpg)](https://youtu.be/XA3OaoW86R8 "ML para iniciantes - Introdução aos modelos de regressão para aprendizado de máquina") - -> 🎥 Clique na imagem acima para um vídeo curto apresentando os modelos de regressão. - -Neste grupo de lições, você será preparado para começar tarefas de aprendizado de máquina, incluindo a configuração do Visual Studio Code para gerenciar notebooks, o ambiente comum para cientistas de dados. Você descobrirá o Scikit-learn, uma biblioteca para aprendizado de máquina, e construirá seus primeiros modelos, com foco nos modelos de regressão neste capítulo. - -> Existem ferramentas úteis de baixo código que podem ajudá-lo a aprender sobre o trabalho com modelos de regressão. Experimente [Azure ML para esta tarefa](https://docs.microsoft.com/learn/modules/create-regression-model-azure-machine-learning-designer/?WT.mc_id=academic-77952-leestott) - -### Lições - -1. [Ferramentas do ofício](1-Tools/README.md) -2. [Gerenciando dados](2-Data/README.md) -3. [Regressão linear e polinomial](3-Linear/README.md) -4. [Regressão logística](4-Logistic/README.md) - ---- -### Créditos - -"ML com regressão" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper) - -♥️ Contribuidores do quiz incluem: [Muhammad Sakib Khan Inan](https://twitter.com/Sakibinan) e [Ornella Altunyan](https://twitter.com/ornelladotcom) - -O conjunto de dados de abóboras foi sugerido por [este projeto no Kaggle](https://www.kaggle.com/usda/a-year-of-pumpkin-prices) e seus dados são provenientes dos [Relatórios Padrão dos Mercados de Culturas Especiais](https://www.marketnews.usda.gov/mnp/fv-report-config-step1?type=termPrice) distribuídos pelo Departamento de Agricultura dos Estados Unidos. Adicionamos alguns pontos relacionados à cor com base na variedade para normalizar a distribuição. Esses dados estão em domínio público. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/3-Web-App/1-Web-App/README.md b/translations/br/3-Web-App/1-Web-App/README.md deleted file mode 100644 index c2560f060..000000000 --- a/translations/br/3-Web-App/1-Web-App/README.md +++ /dev/null @@ -1,359 +0,0 @@ - -# Construa um Aplicativo Web para Usar um Modelo de ML - -Nesta lição, você irá treinar um modelo de ML em um conjunto de dados que é fora deste mundo: _avistamentos de OVNIs ao longo do último século_, obtidos do banco de dados do NUFORC. - -Você aprenderá: - -- Como 'pickle' um modelo treinado -- Como usar esse modelo em um aplicativo Flask - -Continuaremos utilizando notebooks para limpar os dados e treinar nosso modelo, mas você pode levar o processo um passo adiante explorando o uso de um modelo "na prática", por assim dizer: em um aplicativo web. - -Para fazer isso, você precisa construir um aplicativo web usando Flask. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Construindo um aplicativo - -Existem várias maneiras de construir aplicativos web para consumir modelos de aprendizado de máquina. Sua arquitetura web pode influenciar a forma como seu modelo é treinado. Imagine que você está trabalhando em uma empresa onde o grupo de ciência de dados treinou um modelo que eles querem que você use em um aplicativo. - -### Considerações - -Há muitas perguntas que você precisa fazer: - -- **É um aplicativo web ou um aplicativo móvel?** Se você está construindo um aplicativo móvel ou precisa usar o modelo em um contexto de IoT, você pode usar [TensorFlow Lite](https://www.tensorflow.org/lite/) e utilizar o modelo em um aplicativo Android ou iOS. -- **Onde o modelo ficará armazenado?** Na nuvem ou localmente? -- **Suporte offline.** O aplicativo precisa funcionar offline? -- **Qual tecnologia foi usada para treinar o modelo?** A tecnologia escolhida pode influenciar as ferramentas que você precisa usar. - - **Usando TensorFlow.** Se você está treinando um modelo usando TensorFlow, por exemplo, esse ecossistema oferece a capacidade de converter um modelo TensorFlow para uso em um aplicativo web usando [TensorFlow.js](https://www.tensorflow.org/js/). - - **Usando PyTorch.** Se você está construindo um modelo usando uma biblioteca como [PyTorch](https://pytorch.org/), você tem a opção de exportá-lo no formato [ONNX](https://onnx.ai/) (Open Neural Network Exchange) para uso em aplicativos web JavaScript que podem usar o [Onnx Runtime](https://www.onnxruntime.ai/). Essa opção será explorada em uma lição futura para um modelo treinado com Scikit-learn. - - **Usando Lobe.ai ou Azure Custom Vision.** Se você está usando um sistema de ML SaaS (Software como Serviço) como [Lobe.ai](https://lobe.ai/) ou [Azure Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77952-leestott) para treinar um modelo, esse tipo de software oferece maneiras de exportar o modelo para várias plataformas, incluindo a construção de uma API personalizada para ser consultada na nuvem pelo seu aplicativo online. - -Você também tem a oportunidade de construir um aplicativo web Flask completo que seria capaz de treinar o modelo diretamente em um navegador web. Isso também pode ser feito usando TensorFlow.js em um contexto JavaScript. - -Para nossos propósitos, já que estamos trabalhando com notebooks baseados em Python, vamos explorar os passos necessários para exportar um modelo treinado de um notebook para um formato legível por um aplicativo web construído em Python. - -## Ferramenta - -Para esta tarefa, você precisa de duas ferramentas: Flask e Pickle, ambas executadas em Python. - -✅ O que é [Flask](https://palletsprojects.com/p/flask/)? Definido como um 'micro-framework' por seus criadores, Flask fornece os recursos básicos de frameworks web usando Python e um mecanismo de templates para construir páginas web. Confira [este módulo de aprendizado](https://docs.microsoft.com/learn/modules/python-flask-build-ai-web-app?WT.mc_id=academic-77952-leestott) para praticar a construção com Flask. - -✅ O que é [Pickle](https://docs.python.org/3/library/pickle.html)? Pickle 🥒 é um módulo Python que serializa e desserializa uma estrutura de objeto Python. Quando você 'pickle' um modelo, você serializa ou achata sua estrutura para uso na web. Cuidado: pickle não é intrinsecamente seguro, então tenha cuidado se for solicitado a 'despickle' um arquivo. Um arquivo pickled tem o sufixo `.pkl`. - -## Exercício - limpe seus dados - -Nesta lição, você usará dados de 80.000 avistamentos de OVNIs, coletados pelo [NUFORC](https://nuforc.org) (Centro Nacional de Relatórios de OVNIs). Esses dados têm algumas descrições interessantes de avistamentos de OVNIs, por exemplo: - -- **Descrição longa de exemplo.** "Um homem emerge de um feixe de luz que brilha em um campo gramado à noite e corre em direção ao estacionamento da Texas Instruments". -- **Descrição curta de exemplo.** "as luzes nos perseguiram". - -A planilha [ufos.csv](../../../../3-Web-App/1-Web-App/data/ufos.csv) inclui colunas sobre a `cidade`, `estado` e `país` onde o avistamento ocorreu, o `formato` do objeto e sua `latitude` e `longitude`. - -No [notebook](../../../../3-Web-App/1-Web-App/notebook.ipynb) em branco incluído nesta lição: - -1. Importe `pandas`, `matplotlib` e `numpy` como você fez em lições anteriores e importe a planilha de OVNIs. Você pode dar uma olhada em um conjunto de dados de amostra: - - ```python - import pandas as pd - import numpy as np - - ufos = pd.read_csv('./data/ufos.csv') - ufos.head() - ``` - -1. Converta os dados de OVNIs para um pequeno dataframe com títulos novos. Verifique os valores únicos no campo `Country`. - - ```python - ufos = pd.DataFrame({'Seconds': ufos['duration (seconds)'], 'Country': ufos['country'],'Latitude': ufos['latitude'],'Longitude': ufos['longitude']}) - - ufos.Country.unique() - ``` - -1. Agora, você pode reduzir a quantidade de dados com que precisamos lidar, descartando quaisquer valores nulos e importando apenas avistamentos entre 1-60 segundos: - - ```python - ufos.dropna(inplace=True) - - ufos = ufos[(ufos['Seconds'] >= 1) & (ufos['Seconds'] <= 60)] - - ufos.info() - ``` - -1. Importe a biblioteca `LabelEncoder` do Scikit-learn para converter os valores de texto dos países em números: - - ✅ LabelEncoder codifica dados alfabeticamente - - ```python - from sklearn.preprocessing import LabelEncoder - - ufos['Country'] = LabelEncoder().fit_transform(ufos['Country']) - - ufos.head() - ``` - - Seus dados devem se parecer com isto: - - ```output - Seconds Country Latitude Longitude - 2 20.0 3 53.200000 -2.916667 - 3 20.0 4 28.978333 -96.645833 - 14 30.0 4 35.823889 -80.253611 - 23 60.0 4 45.582778 -122.352222 - 24 3.0 3 51.783333 -0.783333 - ``` - -## Exercício - construa seu modelo - -Agora você pode se preparar para treinar um modelo dividindo os dados em grupos de treinamento e teste. - -1. Selecione as três características que você deseja treinar como seu vetor X, e o vetor y será o `Country`. Você quer ser capaz de inserir `Seconds`, `Latitude` e `Longitude` e obter um id de país como retorno. - - ```python - from sklearn.model_selection import train_test_split - - Selected_features = ['Seconds','Latitude','Longitude'] - - X = ufos[Selected_features] - y = ufos['Country'] - - X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) - ``` - -1. Treine seu modelo usando regressão logística: - - ```python - from sklearn.metrics import accuracy_score, classification_report - from sklearn.linear_model import LogisticRegression - model = LogisticRegression() - model.fit(X_train, y_train) - predictions = model.predict(X_test) - - print(classification_report(y_test, predictions)) - print('Predicted labels: ', predictions) - print('Accuracy: ', accuracy_score(y_test, predictions)) - ``` - -A precisão não é ruim **(cerca de 95%)**, o que não é surpreendente, já que `Country` e `Latitude/Longitude` estão correlacionados. - -O modelo que você criou não é muito revolucionário, já que você deveria ser capaz de inferir um `Country` a partir de sua `Latitude` e `Longitude`, mas é um bom exercício para tentar treinar a partir de dados brutos que você limpou, exportou e depois usou esse modelo em um aplicativo web. - -## Exercício - 'pickle' seu modelo - -Agora é hora de _pickle_ seu modelo! Você pode fazer isso em algumas linhas de código. Uma vez que ele esteja _pickled_, carregue seu modelo pickled e teste-o contra um array de dados de amostra contendo valores para segundos, latitude e longitude. - -```python -import pickle -model_filename = 'ufo-model.pkl' -pickle.dump(model, open(model_filename,'wb')) - -model = pickle.load(open('ufo-model.pkl','rb')) -print(model.predict([[50,44,-12]])) -``` - -O modelo retorna **'3'**, que é o código do país para o Reino Unido. Incrível! 👽 - -## Exercício - construa um aplicativo Flask - -Agora você pode construir um aplicativo Flask para chamar seu modelo e retornar resultados semelhantes, mas de uma maneira mais visualmente agradável. - -1. Comece criando uma pasta chamada **web-app** ao lado do arquivo _notebook.ipynb_ onde seu arquivo _ufo-model.pkl_ está localizado. - -1. Nessa pasta, crie mais três pastas: **static**, com uma pasta **css** dentro dela, e **templates**. Você deve ter os seguintes arquivos e diretórios: - - ```output - web-app/ - static/ - css/ - templates/ - notebook.ipynb - ufo-model.pkl - ``` - - ✅ Consulte a pasta de solução para ver o aplicativo finalizado - -1. O primeiro arquivo a ser criado na pasta _web-app_ é o arquivo **requirements.txt**. Como o _package.json_ em um aplicativo JavaScript, este arquivo lista as dependências necessárias para o aplicativo. No **requirements.txt** adicione as linhas: - - ```text - scikit-learn - pandas - numpy - flask - ``` - -1. Agora, execute este arquivo navegando até _web-app_: - - ```bash - cd web-app - ``` - -1. No seu terminal, digite `pip install` para instalar as bibliotecas listadas no _requirements.txt_: - - ```bash - pip install -r requirements.txt - ``` - -1. Agora, você está pronto para criar mais três arquivos para finalizar o aplicativo: - - 1. Crie **app.py** na raiz. - 2. Crie **index.html** no diretório _templates_. - 3. Crie **styles.css** no diretório _static/css_. - -1. Desenvolva o arquivo _styles.css_ com alguns estilos: - - ```css - body { - width: 100%; - height: 100%; - font-family: 'Helvetica'; - background: black; - color: #fff; - text-align: center; - letter-spacing: 1.4px; - font-size: 30px; - } - - input { - min-width: 150px; - } - - .grid { - width: 300px; - border: 1px solid #2d2d2d; - display: grid; - justify-content: center; - margin: 20px auto; - } - - .box { - color: #fff; - background: #2d2d2d; - padding: 12px; - display: inline-block; - } - ``` - -1. Em seguida, desenvolva o arquivo _index.html_: - - ```html - - - - - 🛸 UFO Appearance Prediction! 👽 - - - - -
- -
- -

According to the number of seconds, latitude and longitude, which country is likely to have reported seeing a UFO?

- -
- - - - -
- -

{{ prediction_text }}

- -
- -
- - - - ``` - - Observe o uso de templates neste arquivo. Note a sintaxe 'mustache' ao redor das variáveis que serão fornecidas pelo aplicativo, como o texto de previsão: `{{}}`. Há também um formulário que envia uma previsão para a rota `/predict`. - - Finalmente, você está pronto para construir o arquivo Python que dirige o consumo do modelo e a exibição das previsões: - -1. No `app.py` adicione: - - ```python - import numpy as np - from flask import Flask, request, render_template - import pickle - - app = Flask(__name__) - - model = pickle.load(open("./ufo-model.pkl", "rb")) - - - @app.route("/") - def home(): - return render_template("index.html") - - - @app.route("/predict", methods=["POST"]) - def predict(): - - int_features = [int(x) for x in request.form.values()] - final_features = [np.array(int_features)] - prediction = model.predict(final_features) - - output = prediction[0] - - countries = ["Australia", "Canada", "Germany", "UK", "US"] - - return render_template( - "index.html", prediction_text="Likely country: {}".format(countries[output]) - ) - - - if __name__ == "__main__": - app.run(debug=True) - ``` - - > 💡 Dica: quando você adiciona [`debug=True`](https://www.askpython.com/python-modules/flask/flask-debug-mode) ao executar o aplicativo web usando Flask, quaisquer alterações feitas no seu aplicativo serão refletidas imediatamente sem a necessidade de reiniciar o servidor. Atenção! Não habilite este modo em um aplicativo de produção. - -Se você executar `python app.py` ou `python3 app.py` - seu servidor web será iniciado localmente, e você poderá preencher um formulário curto para obter uma resposta à sua pergunta sobre onde os OVNIs foram avistados! - -Antes de fazer isso, dê uma olhada nas partes do `app.py`: - -1. Primeiro, as dependências são carregadas e o aplicativo é iniciado. -1. Em seguida, o modelo é importado. -1. Depois, o index.html é renderizado na rota inicial. - -Na rota `/predict`, várias coisas acontecem quando o formulário é enviado: - -1. As variáveis do formulário são coletadas e convertidas em um array numpy. Elas são então enviadas ao modelo e uma previsão é retornada. -2. Os países que queremos exibir são re-renderizados como texto legível a partir de seu código de país previsto, e esse valor é enviado de volta ao index.html para ser renderizado no template. - -Usar um modelo dessa forma, com Flask e um modelo pickled, é relativamente simples. O mais difícil é entender qual é o formato dos dados que devem ser enviados ao modelo para obter uma previsão. Isso depende de como o modelo foi treinado. Este modelo requer três pontos de dados para ser inserido e obter uma previsão. - -Em um ambiente profissional, você pode ver como é importante ter uma boa comunicação entre as pessoas que treinam o modelo e aquelas que o consomem em um aplicativo web ou móvel. No nosso caso, é apenas uma pessoa: você! - ---- - -## 🚀 Desafio - -Em vez de trabalhar em um notebook e importar o modelo para o aplicativo Flask, você poderia treinar o modelo diretamente dentro do aplicativo Flask! Tente converter seu código Python no notebook, talvez após limpar seus dados, para treinar o modelo dentro do aplicativo em uma rota chamada `train`. Quais são os prós e contras de seguir esse método? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Existem muitas maneiras de construir um aplicativo web para consumir modelos de ML. Faça uma lista das maneiras que você poderia usar JavaScript ou Python para construir um aplicativo web que aproveite o aprendizado de máquina. Considere a arquitetura: o modelo deve permanecer no aplicativo ou viver na nuvem? Se for o último caso, como você o acessaria? Desenhe um modelo arquitetural para uma solução de ML aplicada em um aplicativo web. - -## Tarefa - -[Experimente um modelo diferente](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/3-Web-App/1-Web-App/assignment.md b/translations/br/3-Web-App/1-Web-App/assignment.md deleted file mode 100644 index e227f8a0a..000000000 --- a/translations/br/3-Web-App/1-Web-App/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Experimente um modelo diferente - -## Instruções - -Agora que você criou um aplicativo web usando um modelo de Regressão treinado, utilize um dos modelos de uma lição anterior sobre Regressão para refazer este aplicativo web. Você pode manter o estilo ou projetá-lo de forma diferente para refletir os dados de abóbora. Certifique-se de alterar os inputs para refletir o método de treinamento do seu modelo. - -## Rubrica - -| Critérios | Exemplares | Adequados | Necessita Melhorias | -| -------------------------- | -------------------------------------------------------- | --------------------------------------------------------- | -------------------------------------- | -| | O aplicativo web funciona como esperado e está implantado na nuvem | O aplicativo web contém falhas ou apresenta resultados inesperados | O aplicativo web não funciona corretamente | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/3-Web-App/1-Web-App/notebook.ipynb b/translations/br/3-Web-App/1-Web-App/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/br/3-Web-App/1-Web-App/solution/notebook.ipynb b/translations/br/3-Web-App/1-Web-App/solution/notebook.ipynb deleted file mode 100644 index 303c919ac..000000000 --- a/translations/br/3-Web-App/1-Web-App/solution/notebook.ipynb +++ /dev/null @@ -1,267 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "5fa2e8f4584c78250ca9729b46562ceb", - "translation_date": "2025-08-29T23:40:42+00:00", - "source_file": "3-Web-App/1-Web-App/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " datetime city state country shape \\\n", - "0 10/10/1949 20:30 san marcos tx us cylinder \n", - "1 10/10/1949 21:00 lackland afb tx NaN light \n", - "2 10/10/1955 17:00 chester (uk/england) NaN gb circle \n", - "3 10/10/1956 21:00 edna tx us circle \n", - "4 10/10/1960 20:00 kaneohe hi us light \n", - "\n", - " duration (seconds) duration (hours/min) \\\n", - "0 2700.0 45 minutes \n", - "1 7200.0 1-2 hrs \n", - "2 20.0 20 seconds \n", - "3 20.0 1/2 hour \n", - "4 900.0 15 minutes \n", - "\n", - " comments date posted latitude \\\n", - "0 This event took place in early fall around 194... 4/27/2004 29.883056 \n", - "1 1949 Lackland AFB, TX. Lights racing acros... 12/16/2005 29.384210 \n", - "2 Green/Orange circular disc over Chester, En... 1/21/2008 53.200000 \n", - "3 My older brother and twin sister were leaving ... 1/17/2004 28.978333 \n", - "4 AS a Marine 1st Lt. flying an FJ4B fighter/att... 1/22/2004 21.418056 \n", - "\n", - " longitude \n", - "0 -97.941111 \n", - "1 -98.581082 \n", - "2 -2.916667 \n", - "3 -96.645833 \n", - "4 -157.803611 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
datetimecitystatecountryshapeduration (seconds)duration (hours/min)commentsdate postedlatitudelongitude
010/10/1949 20:30san marcostxuscylinder2700.045 minutesThis event took place in early fall around 194...4/27/200429.883056-97.941111
110/10/1949 21:00lackland afbtxNaNlight7200.01-2 hrs1949 Lackland AFB&#44 TX. Lights racing acros...12/16/200529.384210-98.581082
210/10/1955 17:00chester (uk/england)NaNgbcircle20.020 secondsGreen/Orange circular disc over Chester&#44 En...1/21/200853.200000-2.916667
310/10/1956 21:00ednatxuscircle20.01/2 hourMy older brother and twin sister were leaving ...1/17/200428.978333-96.645833
410/10/1960 20:00kaneohehiuslight900.015 minutesAS a Marine 1st Lt. flying an FJ4B fighter/att...1/22/200421.418056-157.803611
\n
" - }, - "metadata": {}, - "execution_count": 23 - } - ], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "\n", - "ufos = pd.read_csv('../data/ufos.csv')\n", - "ufos.head()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array(['us', nan, 'gb', 'ca', 'au', 'de'], dtype=object)" - ] - }, - "metadata": {}, - "execution_count": 24 - } - ], - "source": [ - "\n", - "ufos = pd.DataFrame({'Seconds': ufos['duration (seconds)'], 'Country': ufos['country'],'Latitude': ufos['latitude'],'Longitude': ufos['longitude']})\n", - "\n", - "ufos.Country.unique()\n", - "\n", - "# 0 au, 1 ca, 2 de, 3 gb, 4 us" - ] - }, - { - "cell_type": "code", - "execution_count": 25, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\nInt64Index: 25863 entries, 2 to 80330\nData columns (total 4 columns):\n # Column Non-Null Count Dtype \n--- ------ -------------- ----- \n 0 Seconds 25863 non-null float64\n 1 Country 25863 non-null object \n 2 Latitude 25863 non-null float64\n 3 Longitude 25863 non-null float64\ndtypes: float64(3), object(1)\nmemory usage: 1010.3+ KB\n" - ] - } - ], - "source": [ - "ufos.dropna(inplace=True)\n", - "\n", - "ufos = ufos[(ufos['Seconds'] >= 1) & (ufos['Seconds'] <= 60)]\n", - "\n", - "ufos.info()" - ] - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Seconds Country Latitude Longitude\n", - "2 20.0 3 53.200000 -2.916667\n", - "3 20.0 4 28.978333 -96.645833\n", - "14 30.0 4 35.823889 -80.253611\n", - "23 60.0 4 45.582778 -122.352222\n", - "24 3.0 3 51.783333 -0.783333" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
SecondsCountryLatitudeLongitude
220.0353.200000-2.916667
320.0428.978333-96.645833
1430.0435.823889-80.253611
2360.0445.582778-122.352222
243.0351.783333-0.783333
\n
" - }, - "metadata": {}, - "execution_count": 26 - } - ], - "source": [ - "from sklearn.preprocessing import LabelEncoder\n", - "\n", - "ufos['Country'] = LabelEncoder().fit_transform(ufos['Country'])\n", - "\n", - "ufos.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 27, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "\n", - "Selected_features = ['Seconds','Latitude','Longitude']\n", - "\n", - "X = ufos[Selected_features]\n", - "y = ufos['Country']\n", - "\n", - "\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 28, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/linear_model/logistic.py:432: FutureWarning: Default solver will be changed to 'lbfgs' in 0.22. Specify a solver to silence this warning.\n", - " FutureWarning)\n", - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/linear_model/logistic.py:469: FutureWarning: Default multi_class will be changed to 'auto' in 0.22. Specify the multi_class option to silence this warning.\n", - " \"this warning.\", FutureWarning)\n", - " precision recall f1-score support\n", - "\n", - " 0 1.00 1.00 1.00 41\n", - " 1 1.00 0.02 0.05 250\n", - " 2 0.00 0.00 0.00 8\n", - " 3 0.94 1.00 0.97 131\n", - " 4 0.95 1.00 0.97 4743\n", - "\n", - " accuracy 0.95 5173\n", - " macro avg 0.78 0.60 0.60 5173\n", - "weighted avg 0.95 0.95 0.93 5173\n", - "\n", - "Predicted labels: [4 4 4 ... 3 4 4]\n", - "Accuracy: 0.9512855209742895\n", - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/metrics/classification.py:1437: UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels with no predicted samples.\n", - " 'precision', 'predicted', average, warn_for)\n" - ] - } - ], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "from sklearn.metrics import accuracy_score, classification_report \n", - "from sklearn.linear_model import LogisticRegression\n", - "model = LogisticRegression()\n", - "model.fit(X_train, y_train)\n", - "predictions = model.predict(X_test)\n", - "\n", - "print(classification_report(y_test, predictions))\n", - "print('Predicted labels: ', predictions)\n", - "print('Accuracy: ', accuracy_score(y_test, predictions))\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 29, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[3]\n" - ] - } - ], - "source": [ - "import pickle\n", - "model_filename = 'ufo-model.pkl'\n", - "pickle.dump(model, open(model_filename,'wb'))\n", - "\n", - "model = pickle.load(open('ufo-model.pkl','rb'))\n", - "print(model.predict([[50,44,-12]]))\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/3-Web-App/README.md b/translations/br/3-Web-App/README.md deleted file mode 100644 index 6e69e4b2d..000000000 --- a/translations/br/3-Web-App/README.md +++ /dev/null @@ -1,35 +0,0 @@ - -# Construa um aplicativo web para usar seu modelo de ML - -Nesta seção do currículo, você será introduzido a um tópico aplicado de aprendizado de máquina: como salvar seu modelo Scikit-learn como um arquivo que pode ser usado para fazer previsões dentro de um aplicativo web. Depois que o modelo estiver salvo, você aprenderá como utilizá-lo em um aplicativo web construído com Flask. Primeiro, você criará um modelo usando alguns dados relacionados a avistamentos de OVNIs! Em seguida, você construirá um aplicativo web que permitirá inserir um número de segundos junto com valores de latitude e longitude para prever qual país relatou ter visto um OVNI. - -![Estacionamento de OVNIs](../../../translated_images/pt-BR/ufo.9e787f5161da9d4d.webp) - -Foto por Michael Herren no Unsplash - -## Aulas - -1. [Construa um Aplicativo Web](1-Web-App/README.md) - -## Créditos - -"Construa um Aplicativo Web" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper). - -♥️ Os questionários foram escritos por Rohan Raj. - -O conjunto de dados foi obtido de [Kaggle](https://www.kaggle.com/NUFORC/ufo-sightings). - -A arquitetura do aplicativo web foi sugerida em parte por [este artigo](https://towardsdatascience.com/how-to-easily-deploy-machine-learning-models-using-flask-b95af8fe34d4) e [este repositório](https://github.com/abhinavsagar/machine-learning-deployment) de Abhinav Sagar. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/1-Introduction/README.md b/translations/br/4-Classification/1-Introduction/README.md deleted file mode 100644 index c6085d99d..000000000 --- a/translations/br/4-Classification/1-Introduction/README.md +++ /dev/null @@ -1,313 +0,0 @@ - -# Introdução à classificação - -Nestas quatro lições, você explorará um dos focos fundamentais do aprendizado de máquina clássico - _classificação_. Vamos utilizar vários algoritmos de classificação com um conjunto de dados sobre as brilhantes culinárias da Ásia e da Índia. Espero que você esteja com fome! - -![só uma pitada!](../../../../4-Classification/1-Introduction/images/pinch.png) - -> Celebre as culinárias pan-asiáticas nestas lições! Imagem por [Jen Looper](https://twitter.com/jenlooper) - -Classificação é uma forma de [aprendizado supervisionado](https://wikipedia.org/wiki/Supervised_learning) que tem muito em comum com técnicas de regressão. Se o aprendizado de máquina é sobre prever valores ou nomes para coisas usando conjuntos de dados, então a classificação geralmente se divide em dois grupos: _classificação binária_ e _classificação multiclasse_. - -[![Introdução à classificação](https://img.youtube.com/vi/eg8DJYwdMyg/0.jpg)](https://youtu.be/eg8DJYwdMyg "Introdução à classificação") - -> 🎥 Clique na imagem acima para assistir a um vídeo: John Guttag do MIT apresenta a classificação - -Lembre-se: - -- **Regressão linear** ajudou você a prever relações entre variáveis e fazer previsões precisas sobre onde um novo ponto de dados se encaixaria em relação a essa linha. Por exemplo, você poderia prever _qual seria o preço de uma abóbora em setembro vs. dezembro_. -- **Regressão logística** ajudou você a descobrir "categorias binárias": neste ponto de preço, _essa abóbora é laranja ou não-laranja_? - -A classificação utiliza vários algoritmos para determinar outras formas de identificar o rótulo ou a classe de um ponto de dados. Vamos trabalhar com esses dados de culinária para ver se, ao observar um grupo de ingredientes, conseguimos determinar sua origem culinária. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../4-Classification/1-Introduction/solution/R/lesson_10.html) - -### Introdução - -A classificação é uma das atividades fundamentais do pesquisador de aprendizado de máquina e do cientista de dados. Desde a classificação básica de um valor binário ("este e-mail é spam ou não?"), até a classificação e segmentação complexas de imagens usando visão computacional, é sempre útil poder organizar dados em classes e fazer perguntas sobre eles. - -Para descrever o processo de forma mais científica, seu método de classificação cria um modelo preditivo que permite mapear a relação entre variáveis de entrada e variáveis de saída. - -![classificação binária vs. multiclasse](../../../../4-Classification/1-Introduction/images/binary-multiclass.png) - -> Problemas binários vs. multiclasse para algoritmos de classificação lidarem. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -Antes de começar o processo de limpar nossos dados, visualizá-los e prepará-los para nossas tarefas de aprendizado de máquina, vamos aprender um pouco sobre as várias formas de usar aprendizado de máquina para classificar dados. - -Derivada da [estatística](https://wikipedia.org/wiki/Statistical_classification), a classificação usando aprendizado de máquina clássico utiliza características, como `fumante`, `peso` e `idade`, para determinar a _probabilidade de desenvolver X doença_. Como uma técnica de aprendizado supervisionado semelhante aos exercícios de regressão que você realizou anteriormente, seus dados são rotulados e os algoritmos de aprendizado de máquina usam esses rótulos para classificar e prever classes (ou 'características') de um conjunto de dados e atribuí-las a um grupo ou resultado. - -✅ Tire um momento para imaginar um conjunto de dados sobre culinárias. O que um modelo multiclasse seria capaz de responder? O que um modelo binário seria capaz de responder? E se você quisesse determinar se uma determinada culinária provavelmente usaria feno-grego? E se você quisesse ver se, dado um presente de uma sacola de supermercado cheia de anis-estrelado, alcachofras, couve-flor e raiz-forte, você poderia criar um prato típico indiano? - -[![Cestas misteriosas malucas](https://img.youtube.com/vi/GuTeDbaNoEU/0.jpg)](https://youtu.be/GuTeDbaNoEU "Cestas misteriosas malucas") - -> 🎥 Clique na imagem acima para assistir a um vídeo. Todo o conceito do programa 'Chopped' é a 'cesta misteriosa', onde os chefs têm que fazer um prato com uma escolha aleatória de ingredientes. Certamente um modelo de aprendizado de máquina teria ajudado! - -## Olá 'classificador' - -A pergunta que queremos fazer sobre este conjunto de dados de culinária é, na verdade, uma **pergunta multiclasse**, já que temos várias possíveis culinárias nacionais para trabalhar. Dado um lote de ingredientes, a qual dessas muitas classes os dados se encaixarão? - -O Scikit-learn oferece vários algoritmos diferentes para classificar dados, dependendo do tipo de problema que você deseja resolver. Nas próximas duas lições, você aprenderá sobre alguns desses algoritmos. - -## Exercício - limpar e balancear seus dados - -A primeira tarefa, antes de começar este projeto, é limpar e **balancear** seus dados para obter melhores resultados. Comece com o arquivo em branco _notebook.ipynb_ na raiz desta pasta. - -A primeira coisa a instalar é o [imblearn](https://imbalanced-learn.org/stable/). Este é um pacote do Scikit-learn que permitirá que você balanceie melhor os dados (você aprenderá mais sobre essa tarefa em um minuto). - -1. Para instalar o `imblearn`, execute `pip install`, assim: - - ```python - pip install imblearn - ``` - -1. Importe os pacotes necessários para importar seus dados e visualizá-los, e também importe `SMOTE` do `imblearn`. - - ```python - import pandas as pd - import matplotlib.pyplot as plt - import matplotlib as mpl - import numpy as np - from imblearn.over_sampling import SMOTE - ``` - - Agora você está pronto para importar os dados. - -1. A próxima tarefa será importar os dados: - - ```python - df = pd.read_csv('../data/cuisines.csv') - ``` - - Usar `read_csv()` lerá o conteúdo do arquivo csv _cusines.csv_ e o colocará na variável `df`. - -1. Verifique o formato dos dados: - - ```python - df.head() - ``` - - As primeiras cinco linhas se parecem com isto: - - ```output - | | Unnamed: 0 | cuisine | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | - | --- | ---------- | ------- | ------ | -------- | ----- | ---------- | ----- | ------------ | ------- | -------- | --- | ------- | ----------- | ---------- | ----------------------- | ---- | ---- | --- | ----- | ------ | -------- | - | 0 | 65 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 1 | 66 | indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 2 | 67 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 3 | 68 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 4 | 69 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | - ``` - -1. Obtenha informações sobre esses dados chamando `info()`: - - ```python - df.info() - ``` - - Sua saída será semelhante a: - - ```output - - RangeIndex: 2448 entries, 0 to 2447 - Columns: 385 entries, Unnamed: 0 to zucchini - dtypes: int64(384), object(1) - memory usage: 7.2+ MB - ``` - -## Exercício - aprendendo sobre culinárias - -Agora o trabalho começa a ficar mais interessante. Vamos descobrir a distribuição dos dados por culinária. - -1. Plote os dados como barras chamando `barh()`: - - ```python - df.cuisine.value_counts().plot.barh() - ``` - - ![distribuição de dados de culinária](../../../../4-Classification/1-Introduction/images/cuisine-dist.png) - - Há um número finito de culinárias, mas a distribuição dos dados é desigual. Você pode corrigir isso! Antes de fazer isso, explore um pouco mais. - -1. Descubra quanto dado está disponível por culinária e imprima: - - ```python - thai_df = df[(df.cuisine == "thai")] - japanese_df = df[(df.cuisine == "japanese")] - chinese_df = df[(df.cuisine == "chinese")] - indian_df = df[(df.cuisine == "indian")] - korean_df = df[(df.cuisine == "korean")] - - print(f'thai df: {thai_df.shape}') - print(f'japanese df: {japanese_df.shape}') - print(f'chinese df: {chinese_df.shape}') - print(f'indian df: {indian_df.shape}') - print(f'korean df: {korean_df.shape}') - ``` - - A saída se parece com isto: - - ```output - thai df: (289, 385) - japanese df: (320, 385) - chinese df: (442, 385) - indian df: (598, 385) - korean df: (799, 385) - ``` - -## Descobrindo ingredientes - -Agora você pode se aprofundar nos dados e aprender quais são os ingredientes típicos por culinária. Você deve limpar dados recorrentes que criam confusão entre as culinárias, então vamos aprender sobre esse problema. - -1. Crie uma função `create_ingredient()` em Python para criar um dataframe de ingredientes. Esta função começará removendo uma coluna inútil e classificará os ingredientes por sua contagem: - - ```python - def create_ingredient_df(df): - ingredient_df = df.T.drop(['cuisine','Unnamed: 0']).sum(axis=1).to_frame('value') - ingredient_df = ingredient_df[(ingredient_df.T != 0).any()] - ingredient_df = ingredient_df.sort_values(by='value', ascending=False, - inplace=False) - return ingredient_df - ``` - - Agora você pode usar essa função para ter uma ideia dos dez ingredientes mais populares por culinária. - -1. Chame `create_ingredient()` e plote chamando `barh()`: - - ```python - thai_ingredient_df = create_ingredient_df(thai_df) - thai_ingredient_df.head(10).plot.barh() - ``` - - ![tailandesa](../../../../4-Classification/1-Introduction/images/thai.png) - -1. Faça o mesmo para os dados japoneses: - - ```python - japanese_ingredient_df = create_ingredient_df(japanese_df) - japanese_ingredient_df.head(10).plot.barh() - ``` - - ![japonesa](../../../../4-Classification/1-Introduction/images/japanese.png) - -1. Agora para os ingredientes chineses: - - ```python - chinese_ingredient_df = create_ingredient_df(chinese_df) - chinese_ingredient_df.head(10).plot.barh() - ``` - - ![chinesa](../../../../4-Classification/1-Introduction/images/chinese.png) - -1. Plote os ingredientes indianos: - - ```python - indian_ingredient_df = create_ingredient_df(indian_df) - indian_ingredient_df.head(10).plot.barh() - ``` - - ![indiana](../../../../4-Classification/1-Introduction/images/indian.png) - -1. Finalmente, plote os ingredientes coreanos: - - ```python - korean_ingredient_df = create_ingredient_df(korean_df) - korean_ingredient_df.head(10).plot.barh() - ``` - - ![coreana](../../../../4-Classification/1-Introduction/images/korean.png) - -1. Agora, remova os ingredientes mais comuns que criam confusão entre culinárias distintas, chamando `drop()`: - - Todo mundo ama arroz, alho e gengibre! - - ```python - feature_df= df.drop(['cuisine','Unnamed: 0','rice','garlic','ginger'], axis=1) - labels_df = df.cuisine #.unique() - feature_df.head() - ``` - -## Balancear o conjunto de dados - -Agora que você limpou os dados, use o [SMOTE](https://imbalanced-learn.org/dev/references/generated/imblearn.over_sampling.SMOTE.html) - "Técnica de Sobreamostragem de Minoria Sintética" - para balanceá-los. - -1. Chame `fit_resample()`, esta estratégia gera novas amostras por interpolação. - - ```python - oversample = SMOTE() - transformed_feature_df, transformed_label_df = oversample.fit_resample(feature_df, labels_df) - ``` - - Ao balancear seus dados, você terá melhores resultados ao classificá-los. Pense em uma classificação binária. Se a maior parte dos seus dados pertence a uma classe, um modelo de aprendizado de máquina vai prever essa classe com mais frequência, apenas porque há mais dados para ela. Balancear os dados corrige esse desequilíbrio. - -1. Agora você pode verificar os números de rótulos por ingrediente: - - ```python - print(f'new label count: {transformed_label_df.value_counts()}') - print(f'old label count: {df.cuisine.value_counts()}') - ``` - - Sua saída será semelhante a: - - ```output - new label count: korean 799 - chinese 799 - indian 799 - japanese 799 - thai 799 - Name: cuisine, dtype: int64 - old label count: korean 799 - indian 598 - chinese 442 - japanese 320 - thai 289 - Name: cuisine, dtype: int64 - ``` - - Os dados estão limpos, balanceados e muito deliciosos! - -1. O último passo é salvar seus dados balanceados, incluindo rótulos e características, em um novo dataframe que pode ser exportado para um arquivo: - - ```python - transformed_df = pd.concat([transformed_label_df,transformed_feature_df],axis=1, join='outer') - ``` - -1. Você pode dar mais uma olhada nos dados usando `transformed_df.head()` e `transformed_df.info()`. Salve uma cópia desses dados para uso em lições futuras: - - ```python - transformed_df.head() - transformed_df.info() - transformed_df.to_csv("../data/cleaned_cuisines.csv") - ``` - - Este novo CSV pode agora ser encontrado na pasta de dados raiz. - ---- - -## 🚀Desafio - -Este currículo contém vários conjuntos de dados interessantes. Explore as pastas `data` e veja se alguma contém conjuntos de dados que seriam apropriados para classificação binária ou multiclasse. Que perguntas você faria a esse conjunto de dados? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Explore a API do SMOTE. Para quais casos de uso ele é mais adequado? Que problemas ele resolve? - -## Tarefa - -[Explore métodos de classificação](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/1-Introduction/assignment.md b/translations/br/4-Classification/1-Introduction/assignment.md deleted file mode 100644 index 043ae8f3c..000000000 --- a/translations/br/4-Classification/1-Introduction/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Explore métodos de classificação - -## Instruções - -Na [documentação do Scikit-learn](https://scikit-learn.org/stable/supervised_learning.html), você encontrará uma grande lista de maneiras de classificar dados. Faça uma pequena caça ao tesouro nesses documentos: seu objetivo é procurar métodos de classificação e associar um conjunto de dados deste currículo, uma pergunta que você pode fazer sobre ele e uma técnica de classificação. Crie uma planilha ou tabela em um arquivo .doc e explique como o conjunto de dados funcionaria com o algoritmo de classificação. - -## Rubrica - -| Critérios | Exemplary | Adequate | Needs Improvement | -| --------- | ----------------------------------------------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------- | -| | um documento é apresentado com uma visão geral de 5 algoritmos juntamente com uma técnica de classificação. A visão geral é bem explicada e detalhada. | um documento é apresentado com uma visão geral de 3 algoritmos juntamente com uma técnica de classificação. A visão geral é bem explicada e detalhada. | um documento é apresentado com uma visão geral de menos de três algoritmos juntamente com uma técnica de classificação, e a visão geral não é bem explicada nem detalhada. | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/1-Introduction/notebook.ipynb b/translations/br/4-Classification/1-Introduction/notebook.ipynb deleted file mode 100644 index 16fc0c584..000000000 --- a/translations/br/4-Classification/1-Introduction/notebook.ipynb +++ /dev/null @@ -1,39 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "d544ef384b7ba73757d830a72372a7f2", - "translation_date": "2025-08-29T23:52:57+00:00", - "source_file": "4-Classification/1-Introduction/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/1-Introduction/solution/Julia/README.md b/translations/br/4-Classification/1-Introduction/solution/Julia/README.md deleted file mode 100644 index fbf44fa07..000000000 --- a/translations/br/4-Classification/1-Introduction/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb b/translations/br/4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb deleted file mode 100644 index 0b8b71f9f..000000000 --- a/translations/br/4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb +++ /dev/null @@ -1,723 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_10-R.ipynb", - "provenance": [], - "collapsed_sections": [] - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "2621e24705e8100893c9bf84e0fc8aef", - "translation_date": "2025-08-29T23:59:26+00:00", - "source_file": "4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Construir um modelo de classificação: Deliciosas culinárias asiáticas e indianas\n" - ], - "metadata": { - "id": "ItETB4tSFprR" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Introdução à classificação: Limpe, prepare e visualize seus dados\n", - "\n", - "Nestes quatro módulos, você explorará um dos focos fundamentais do aprendizado de máquina clássico - *classificação*. Vamos explorar o uso de vários algoritmos de classificação com um conjunto de dados sobre as brilhantes culinárias da Ásia e da Índia. Espero que você esteja com fome!\n", - "\n", - "

\n", - " \n", - "

Comemore as culinárias pan-asiáticas nestas lições! Imagem de Jen Looper
\n", - "\n", - "\n", - "\n", - "\n", - "Classificação é uma forma de [aprendizado supervisionado](https://wikipedia.org/wiki/Supervised_learning) que tem muito em comum com técnicas de regressão. Na classificação, você treina um modelo para prever a qual `categoria` um item pertence. Se o aprendizado de máquina é sobre prever valores ou nomes para coisas usando conjuntos de dados, então a classificação geralmente se divide em dois grupos: *classificação binária* e *classificação multiclasses*.\n", - "\n", - "Lembre-se:\n", - "\n", - "- **Regressão linear** ajudou você a prever relações entre variáveis e fazer previsões precisas sobre onde um novo ponto de dados se encaixaria em relação a essa linha. Por exemplo, você poderia prever valores numéricos como *qual seria o preço de uma abóbora em setembro vs. dezembro*.\n", - "\n", - "- **Regressão logística** ajudou você a descobrir \"categorias binárias\": neste ponto de preço, *essa abóbora é laranja ou não-laranja*?\n", - "\n", - "A classificação utiliza vários algoritmos para determinar outras formas de identificar o rótulo ou a classe de um ponto de dados. Vamos trabalhar com esses dados de culinária para ver se, ao observar um grupo de ingredientes, conseguimos determinar sua origem culinária.\n", - "\n", - "### [**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/19/)\n", - "\n", - "### **Introdução**\n", - "\n", - "A classificação é uma das atividades fundamentais do pesquisador de aprendizado de máquina e do cientista de dados. Desde a classificação básica de um valor binário (\"este e-mail é spam ou não?\") até a classificação e segmentação complexa de imagens usando visão computacional, é sempre útil ser capaz de organizar dados em classes e fazer perguntas sobre eles.\n", - "\n", - "Para descrever o processo de forma mais científica, seu método de classificação cria um modelo preditivo que permite mapear a relação entre variáveis de entrada e variáveis de saída.\n", - "\n", - "

\n", - " \n", - "

Problemas binários vs. multiclasses para algoritmos de classificação. Infográfico por Jen Looper
\n", - "\n", - "\n", - "\n", - "Antes de começar o processo de limpeza dos dados, visualizá-los e prepará-los para nossas tarefas de aprendizado de máquina, vamos aprender um pouco sobre as várias maneiras pelas quais o aprendizado de máquina pode ser usado para classificar dados.\n", - "\n", - "Derivada da [estatística](https://wikipedia.org/wiki/Statistical_classification), a classificação usando aprendizado de máquina clássico utiliza características, como `fumante`, `peso` e `idade`, para determinar a *probabilidade de desenvolver X doença*. Como uma técnica de aprendizado supervisionado semelhante aos exercícios de regressão que você realizou anteriormente, seus dados são rotulados e os algoritmos de aprendizado de máquina usam esses rótulos para classificar e prever classes (ou 'características') de um conjunto de dados e atribuí-las a um grupo ou resultado.\n", - "\n", - "✅ Tire um momento para imaginar um conjunto de dados sobre culinárias. O que um modelo multiclasses seria capaz de responder? O que um modelo binário seria capaz de responder? E se você quisesse determinar se uma determinada culinária provavelmente usa feno-grego? E se você quisesse ver se, dado um presente de uma sacola de compras cheia de anis-estrelado, alcachofras, couve-flor e raiz-forte, você poderia criar um prato típico indiano?\n", - "\n", - "### **Olá 'classificador'**\n", - "\n", - "A pergunta que queremos fazer sobre este conjunto de dados de culinária é, na verdade, uma questão **multiclasses**, já que temos várias possíveis culinárias nacionais para trabalhar. Dado um lote de ingredientes, a qual dessas muitas classes os dados se encaixam?\n", - "\n", - "O Tidymodels oferece vários algoritmos diferentes para classificar dados, dependendo do tipo de problema que você deseja resolver. Nas próximas duas lições, você aprenderá sobre alguns desses algoritmos.\n", - "\n", - "#### **Pré-requisito**\n", - "\n", - "Para esta lição, precisaremos dos seguintes pacotes para limpar, preparar e visualizar nossos dados:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizado de máquina.\n", - "\n", - "- `DataExplorer`: O [pacote DataExplorer](https://cran.r-project.org/web/packages/DataExplorer/vignettes/dataexplorer-intro.html) foi criado para simplificar e automatizar o processo de análise exploratória de dados (EDA) e a geração de relatórios.\n", - "\n", - "- `themis`: O [pacote themis](https://themis.tidymodels.org/) fornece etapas extras de receitas para lidar com dados desbalanceados.\n", - "\n", - "Você pode instalá-los com:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"DataExplorer\", \"here\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala para você caso estejam ausentes.\n" - ], - "metadata": { - "id": "ri5bQxZ-Fz_0" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\r\n", - "\r\n", - "pacman::p_load(tidyverse, tidymodels, DataExplorer, themis, here)" - ], - "outputs": [], - "metadata": { - "id": "KIPxa4elGAPI" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos carregar esses pacotes incríveis mais tarde e torná-los disponíveis na nossa sessão atual do R. (Isso é apenas para ilustração, `pacman::p_load()` já fez isso por você)\n" - ], - "metadata": { - "id": "YkKAxOJvGD4C" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Exercício - limpar e balancear seus dados\n", - "\n", - "A primeira tarefa, antes de começar este projeto, é limpar e **balancear** seus dados para obter melhores resultados.\n", - "\n", - "Vamos conhecer os dados! 🕵️\n" - ], - "metadata": { - "id": "PFkQDlk0GN5O" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Import data\r\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/4-Classification/data/cuisines.csv\")\r\n", - "\r\n", - "# View the first 5 rows\r\n", - "df %>% \r\n", - " slice_head(n = 5)\r\n" - ], - "outputs": [], - "metadata": { - "id": "Qccw7okxGT0S" - } - }, - { - "cell_type": "markdown", - "source": [ - "Interessante! Pelo que parece, a primeira coluna é um tipo de coluna `id`. Vamos obter um pouco mais de informações sobre os dados.\n" - ], - "metadata": { - "id": "XrWnlgSrGVmR" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Basic information about the data\r\n", - "df %>%\r\n", - " introduce()\r\n", - "\r\n", - "# Visualize basic information above\r\n", - "df %>% \r\n", - " plot_intro(ggtheme = theme_light())" - ], - "outputs": [], - "metadata": { - "id": "4UcGmxRxGieA" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir do resultado, podemos ver imediatamente que temos `2448` linhas, `385` colunas e `0` valores ausentes. Também temos 1 coluna discreta, *cuisine*.\n", - "\n", - "## Exercício - aprendendo sobre culinárias\n", - "\n", - "Agora o trabalho começa a ficar mais interessante. Vamos descobrir a distribuição dos dados por tipo de culinária.\n" - ], - "metadata": { - "id": "AaPubl__GmH5" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Count observations per cuisine\r\n", - "df %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(n)\r\n", - "\r\n", - "# Plot the distribution\r\n", - "theme_set(theme_light())\r\n", - "df %>% \r\n", - " count(cuisine) %>% \r\n", - " ggplot(mapping = aes(x = n, y = reorder(cuisine, -n))) +\r\n", - " geom_col(fill = \"midnightblue\", alpha = 0.7) +\r\n", - " ylab(\"cuisine\")" - ], - "outputs": [], - "metadata": { - "id": "FRsBVy5eGrrv" - } - }, - { - "cell_type": "markdown", - "source": [ - "Existem um número finito de culinárias, mas a distribuição dos dados é desigual. Você pode corrigir isso! Antes de fazer isso, explore um pouco mais.\n", - "\n", - "Em seguida, vamos atribuir cada culinária ao seu próprio tibble e descobrir quantos dados estão disponíveis (linhas, colunas) por culinária.\n", - "\n", - "> Um [tibble](https://tibble.tidyverse.org/) é uma versão moderna de um data frame.\n", - "\n", - "

\n", - " \n", - "

Ilustração por @allison_horst
\n" - ], - "metadata": { - "id": "vVvyDb1kG2in" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Create individual tibble for the cuisines\r\n", - "thai_df <- df %>% \r\n", - " filter(cuisine == \"thai\")\r\n", - "japanese_df <- df %>% \r\n", - " filter(cuisine == \"japanese\")\r\n", - "chinese_df <- df %>% \r\n", - " filter(cuisine == \"chinese\")\r\n", - "indian_df <- df %>% \r\n", - " filter(cuisine == \"indian\")\r\n", - "korean_df <- df %>% \r\n", - " filter(cuisine == \"korean\")\r\n", - "\r\n", - "\r\n", - "# Find out how much data is available per cuisine\r\n", - "cat(\" thai df:\", dim(thai_df), \"\\n\",\r\n", - " \"japanese df:\", dim(japanese_df), \"\\n\",\r\n", - " \"chinese_df:\", dim(chinese_df), \"\\n\",\r\n", - " \"indian_df:\", dim(indian_df), \"\\n\",\r\n", - " \"korean_df:\", dim(korean_df))" - ], - "outputs": [], - "metadata": { - "id": "0TvXUxD3G8Bk" - } - }, - { - "cell_type": "markdown", - "source": [ - "## **Exercício - Descobrindo os principais ingredientes por culinária usando dplyr**\n", - "\n", - "Agora você pode explorar mais profundamente os dados e descobrir quais são os ingredientes típicos de cada culinária. É importante limpar dados recorrentes que criam confusão entre as culinárias, então vamos aprender sobre esse problema.\n", - "\n", - "Crie uma função `create_ingredient()` em R que retorne um dataframe de ingredientes. Essa função começará eliminando uma coluna pouco útil e organizará os ingredientes por sua contagem.\n", - "\n", - "A estrutura básica de uma função em R é:\n", - "\n", - "`myFunction <- function(arglist){`\n", - "\n", - "**`...`**\n", - "\n", - "**`return`**`(value)`\n", - "\n", - "`}`\n", - "\n", - "Uma introdução prática às funções em R pode ser encontrada [aqui](https://skirmer.github.io/presentations/functions_with_r.html#1).\n", - "\n", - "Vamos direto ao ponto! Faremos uso dos [verbos do dplyr](https://dplyr.tidyverse.org/) que aprendemos em nossas lições anteriores. Para relembrar:\n", - "\n", - "- `dplyr::select()`: ajuda você a escolher quais **colunas** manter ou excluir.\n", - "\n", - "- `dplyr::pivot_longer()`: ajuda a \"alongar\" os dados, aumentando o número de linhas e diminuindo o número de colunas.\n", - "\n", - "- `dplyr::group_by()` e `dplyr::summarise()`: ajudam você a encontrar estatísticas resumidas para diferentes grupos e colocá-las em uma tabela organizada.\n", - "\n", - "- `dplyr::filter()`: cria um subconjunto dos dados contendo apenas as linhas que satisfazem suas condições.\n", - "\n", - "- `dplyr::mutate()`: ajuda você a criar ou modificar colunas.\n", - "\n", - "Confira este [tutorial *artístico* do learnr](https://allisonhorst.shinyapps.io/dplyr-learnr/#section-welcome) de Allison Horst, que apresenta algumas funções úteis de manipulação de dados no dplyr *(parte do Tidyverse)*.\n" - ], - "metadata": { - "id": "K3RF5bSCHC76" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Creates a functions that returns the top ingredients by class\r\n", - "\r\n", - "create_ingredient <- function(df){\r\n", - " \r\n", - " # Drop the id column which is the first colum\r\n", - " ingredient_df = df %>% select(-1) %>% \r\n", - " # Transpose data to a long format\r\n", - " pivot_longer(!cuisine, names_to = \"ingredients\", values_to = \"count\") %>% \r\n", - " # Find the top most ingredients for a particular cuisine\r\n", - " group_by(ingredients) %>% \r\n", - " summarise(n_instances = sum(count)) %>% \r\n", - " filter(n_instances != 0) %>% \r\n", - " # Arrange by descending order\r\n", - " arrange(desc(n_instances)) %>% \r\n", - " mutate(ingredients = factor(ingredients) %>% fct_inorder())\r\n", - " \r\n", - " \r\n", - " return(ingredient_df)\r\n", - "} # End of function" - ], - "outputs": [], - "metadata": { - "id": "uB_0JR82HTPa" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora podemos usar a função para ter uma ideia dos dez ingredientes mais populares por culinária. Vamos testá-la com `thai_df`.\n" - ], - "metadata": { - "id": "h9794WF8HWmc" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Call create_ingredient and display popular ingredients\r\n", - "thai_ingredient_df <- create_ingredient(df = thai_df)\r\n", - "\r\n", - "thai_ingredient_df %>% \r\n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "agQ-1HrcHaEA" - } - }, - { - "cell_type": "markdown", - "source": [ - "Na seção anterior, usamos `geom_col()`, vamos ver como você pode usar `geom_bar` também, para criar gráficos de barras. Use `?geom_bar` para leitura adicional.\n" - ], - "metadata": { - "id": "kHu9ffGjHdcX" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make a bar chart for popular thai cuisines\r\n", - "thai_ingredient_df %>% \r\n", - " slice_head(n = 10) %>% \r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"steelblue\") +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "fb3Bx_3DHj6e" - } - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "RHP_xgdkHnvM" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Japanese cuisines and make bar chart\r\n", - "create_ingredient(df = japanese_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"darkorange\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")\r\n" - ], - "outputs": [], - "metadata": { - "id": "019v8F0XHrRU" - } - }, - { - "cell_type": "markdown", - "source": [ - "E quanto às culinárias chinesas?\n" - ], - "metadata": { - "id": "iIGM7vO8Hu3v" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Chinese cuisines and make bar chart\r\n", - "create_ingredient(df = chinese_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"cyan4\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "lHd9_gd2HyzU" - } - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "ir8qyQbNH1c7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Indian cuisines and make bar chart\r\n", - "create_ingredient(df = indian_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"#041E42FF\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "ApukQtKjH5FO" - } - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "qv30cwY1H-FM" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Korean cuisines and make bar chart\r\n", - "create_ingredient(df = korean_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"#852419FF\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "lumgk9cHIBie" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir das visualizações de dados, agora podemos remover os ingredientes mais comuns que geram confusão entre diferentes culinárias, usando `dplyr::select()`.\n", - "\n", - "Todo mundo adora arroz, alho e gengibre!\n" - ], - "metadata": { - "id": "iO4veMXuIEta" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Drop id column, rice, garlic and ginger from our original data set\r\n", - "df_select <- df %>% \r\n", - " select(-c(1, rice, garlic, ginger))\r\n", - "\r\n", - "# Display new data set\r\n", - "df_select %>% \r\n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "iHJPiG6rIUcK" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Pré-processamento de dados usando recipes 👩‍🍳👨‍🍳 - Lidando com dados desbalanceados ⚖️\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "Dado que esta lição é sobre culinárias, precisamos colocar `recipes` em contexto.\n", - "\n", - "Tidymodels oferece mais um pacote interessante: `recipes` - um pacote para pré-processamento de dados.\n" - ], - "metadata": { - "id": "kkFd-JxdIaL6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos dar uma olhada novamente na distribuição das nossas culinárias.\n" - ], - "metadata": { - "id": "6l2ubtTPJAhY" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Distribution of cuisines\r\n", - "old_label_count <- df_select %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))\r\n", - "\r\n", - "old_label_count" - ], - "outputs": [], - "metadata": { - "id": "1e-E9cb7JDVi" - } - }, - { - "cell_type": "markdown", - "source": [ - "Como você pode ver, há uma distribuição bastante desigual no número de culinárias. Culinárias coreanas são quase 3 vezes mais numerosas que as culinárias tailandesas. Dados desequilibrados frequentemente têm efeitos negativos no desempenho do modelo. Pense em uma classificação binária. Se a maior parte dos seus dados pertence a uma classe, um modelo de aprendizado de máquina vai prever essa classe com mais frequência, simplesmente porque há mais dados para ela. Balancear os dados corrige qualquer desequilíbrio e ajuda a remover essa disparidade. Muitos modelos apresentam melhor desempenho quando o número de observações é igual e, por isso, tendem a ter dificuldades com dados desequilibrados.\n", - "\n", - "Existem basicamente duas maneiras de lidar com conjuntos de dados desequilibrados:\n", - "\n", - "- adicionar observações à classe minoritária: `Over-sampling`, por exemplo, usando um algoritmo SMOTE\n", - "\n", - "- remover observações da classe majoritária: `Under-sampling`\n", - "\n", - "Agora vamos demonstrar como lidar com conjuntos de dados desequilibrados usando uma `receita`. Uma receita pode ser vista como um plano que descreve quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para análise.\n" - ], - "metadata": { - "id": "soAw6826JKx9" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load themis package for dealing with imbalanced data\r\n", - "library(themis)\r\n", - "\r\n", - "# Create a recipe for preprocessing data\r\n", - "cuisines_recipe <- recipe(cuisine ~ ., data = df_select) %>% \r\n", - " step_smote(cuisine)\r\n", - "\r\n", - "cuisines_recipe" - ], - "outputs": [], - "metadata": { - "id": "HS41brUIJVJy" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos detalhar nossas etapas de pré-processamento.\n", - "\n", - "- A chamada para `recipe()` com uma fórmula informa à receita os *papéis* das variáveis usando os dados de `df_select` como referência. Por exemplo, a coluna `cuisine` foi atribuída ao papel de `outcome`, enquanto o restante das colunas foi atribuído ao papel de `predictor`.\n", - "\n", - "- [`step_smote(cuisine)`](https://themis.tidymodels.org/reference/step_smote.html) cria uma *especificação* de uma etapa da receita que gera sinteticamente novos exemplos da classe minoritária usando os vizinhos mais próximos desses casos.\n", - "\n", - "Agora, se quisermos ver os dados pré-processados, precisamos [**`prep()`**](https://recipes.tidymodels.org/reference/prep.html) e [**`bake()`**](https://recipes.tidymodels.org/reference/bake.html) nossa receita.\n", - "\n", - "`prep()`: estima os parâmetros necessários a partir de um conjunto de treinamento que podem ser aplicados posteriormente a outros conjuntos de dados.\n", - "\n", - "`bake()`: aplica uma receita preparada às operações em qualquer conjunto de dados.\n" - ], - "metadata": { - "id": "Yb-7t7XcJaC8" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Prep and bake the recipe\r\n", - "preprocessed_df <- cuisines_recipe %>% \r\n", - " prep() %>% \r\n", - " bake(new_data = NULL) %>% \r\n", - " relocate(cuisine)\r\n", - "\r\n", - "# Display data\r\n", - "preprocessed_df %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "# Quick summary stats\r\n", - "preprocessed_df %>% \r\n", - " introduce()" - ], - "outputs": [], - "metadata": { - "id": "9QhSgdpxJl44" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos agora verificar a distribuição de nossas culinárias e compará-las com os dados desequilibrados.\n" - ], - "metadata": { - "id": "dmidELh_LdV7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Distribution of cuisines\r\n", - "new_label_count <- preprocessed_df %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))\r\n", - "\r\n", - "list(new_label_count = new_label_count,\r\n", - " old_label_count = old_label_count)" - ], - "outputs": [], - "metadata": { - "id": "aSh23klBLwDz" - } - }, - { - "cell_type": "markdown", - "source": [ - "Yum! Os dados estão limpos, balanceados e muito deliciosos 😋!\n", - "\n", - "> Normalmente, uma receita é usada como um pré-processador para modelagem, onde define quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para a modelagem. Nesse caso, um `workflow()` é tipicamente usado (como já vimos em nossas aulas anteriores) em vez de estimar manualmente uma receita.\n", - ">\n", - "> Assim, você geralmente não precisa usar **`prep()`** e **`bake()`** em receitas quando utiliza o tidymodels, mas essas são funções úteis para ter em sua caixa de ferramentas para confirmar que as receitas estão fazendo o que você espera, como no nosso caso.\n", - ">\n", - "> Quando você usa **`bake()`** em uma receita preparada com **`new_data = NULL`**, você obtém de volta os dados que forneceu ao definir a receita, mas já processados pelas etapas de pré-processamento.\n", - "\n", - "Agora vamos salvar uma cópia desses dados para uso em aulas futuras:\n" - ], - "metadata": { - "id": "HEu80HZ8L7ae" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Save preprocessed data\r\n", - "write_csv(preprocessed_df, \"../../../data/cleaned_cuisines_R.csv\")" - ], - "outputs": [], - "metadata": { - "id": "cBmCbIgrMOI6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Este novo CSV agora pode ser encontrado na pasta raiz de dados.\n", - "\n", - "**🚀Desafio**\n", - "\n", - "Este currículo contém vários conjuntos de dados interessantes. Explore as pastas `data` e veja se alguma contém conjuntos de dados que seriam apropriados para classificação binária ou multi-classes. Que perguntas você faria sobre este conjunto de dados?\n", - "\n", - "## [**Quiz pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/20/)\n", - "\n", - "## **Revisão e Autoestudo**\n", - "\n", - "- Confira o [pacote themis](https://github.com/tidymodels/themis). Quais outras técnicas poderíamos usar para lidar com dados desbalanceados?\n", - "\n", - "- Site de referência dos modelos Tidy: [Tidy models](https://www.tidymodels.org/start/).\n", - "\n", - "- H. Wickham e G. Grolemund, [*R for Data Science: Visualize, Model, Transform, Tidy, and Import Data*](https://r4ds.had.co.nz/).\n", - "\n", - "#### AGRADECIMENTOS A:\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "[Cassie Breviu](https://www.twitter.com/cassieview) e [Jen Looper](https://www.twitter.com/jenlooper) por criarem a versão original em Python deste módulo ♥️\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "WQs5621pMGwf" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/1-Introduction/solution/notebook.ipynb b/translations/br/4-Classification/1-Introduction/solution/notebook.ipynb deleted file mode 100644 index b568c29bc..000000000 --- a/translations/br/4-Classification/1-Introduction/solution/notebook.ipynb +++ /dev/null @@ -1,707 +0,0 @@ -{ - "cells": [ - { - "source": [ - "# Deliciosas Culinárias Asiáticas e Indianas\n", - "\n", - "## Introdução\n", - "\n", - "A culinária asiática e indiana é conhecida por seus sabores ricos, ingredientes frescos e técnicas de preparo únicas. Este guia oferece uma visão geral de alguns pratos populares e dicas para prepará-los em casa.\n", - "\n", - "## Pratos Asiáticos Populares\n", - "\n", - "### Sushi\n", - "O sushi é um prato japonês que combina arroz temperado com vinagre e uma variedade de ingredientes, como peixe cru, vegetais e algas. É uma arte que exige prática, mas os resultados valem a pena.\n", - "\n", - "### Pad Thai\n", - "Pad Thai é um prato tailandês feito com macarrão de arroz, camarão ou frango, ovos, amendoim e molho de tamarindo. É uma combinação perfeita de sabores doces, azedos e salgados.\n", - "\n", - "### Dim Sum\n", - "Dim Sum é uma seleção de pequenos pratos chineses, geralmente servidos com chá. Inclui opções como bolinhos recheados, pãezinhos no vapor e rolinhos primavera.\n", - "\n", - "## Pratos Indianos Populares\n", - "\n", - "### Curry\n", - "Os curries indianos são conhecidos por suas misturas de especiarias, como cúrcuma, cominho e coentro. Eles podem ser feitos com vegetais, frango, carne ou frutos do mar.\n", - "\n", - "### Naan\n", - "Naan é um pão indiano macio e levemente tostado, geralmente servido como acompanhamento de curries. Pode ser simples ou recheado com alho, queijo ou outros ingredientes.\n", - "\n", - "### Biryani\n", - "Biryani é um prato de arroz aromático, preparado com especiarias, carne ou vegetais. É um prato único que combina sabores intensos e texturas variadas.\n", - "\n", - "## Dicas para Cozinhar em Casa\n", - "\n", - "- **Use ingredientes frescos:** A qualidade dos ingredientes faz toda a diferença no sabor final.\n", - "- **Experimente especiarias:** Não tenha medo de ajustar as especiarias ao seu gosto.\n", - "- **Pratique técnicas tradicionais:** Algumas receitas exigem métodos específicos, como cozinhar no vapor ou grelhar.\n", - "\n", - "## Conclusão\n", - "\n", - "Cozinhar pratos asiáticos e indianos em casa pode ser uma experiência gratificante e deliciosa. Com um pouco de prática e os ingredientes certos, você pode trazer os sabores autênticos dessas culinárias para sua mesa.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "Instale o Imblearn, que permitirá o SMOTE. Este é um pacote do Scikit-learn que ajuda a lidar com dados desbalanceados ao realizar classificação. (https://imbalanced-learn.org/stable/)\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: imblearn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.0)\n", - "Requirement already satisfied: imbalanced-learn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imblearn) (0.8.0)\n", - "Requirement already satisfied: numpy>=1.13.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (1.19.2)\n", - "Requirement already satisfied: scipy>=0.19.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (1.4.1)\n", - "Requirement already satisfied: scikit-learn>=0.24 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (0.24.2)\n", - "Requirement already satisfied: joblib>=0.11 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (0.16.0)\n", - "Requirement already satisfied: threadpoolctl>=2.0.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from scikit-learn>=0.24->imbalanced-learn->imblearn) (2.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install imblearn" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import matplotlib as mpl\n", - "import numpy as np\n", - "from imblearn.over_sampling import SMOTE" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "df = pd.read_csv('../../data/cuisines.csv')" - ] - }, - { - "source": [ - "Este conjunto de dados inclui 385 colunas indicando todos os tipos de ingredientes em várias culinárias de um conjunto específico de culinárias.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 65 indian 0 0 0 0 0 \n", - "1 66 indian 1 0 0 0 0 \n", - "2 67 indian 0 0 0 0 0 \n", - "3 68 indian 0 0 0 0 0 \n", - "4 69 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 385 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
065indian00000000...0000000000
166indian10000000...0000000000
267indian00000000...0000000000
368indian00000000...0000000000
469indian00000000...0000000010
\n

5 rows × 385 columns

\n
" - }, - "metadata": {}, - "execution_count": 4 - } - ], - "source": [ - "df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\nRangeIndex: 2448 entries, 0 to 2447\nColumns: 385 entries, Unnamed: 0 to zucchini\ndtypes: int64(384), object(1)\nmemory usage: 7.2+ MB\n" - ] - } - ], - "source": [ - "df.info()" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "korean 799\n", - "indian 598\n", - "chinese 442\n", - "japanese 320\n", - "thai 289\n", - "Name: cuisine, dtype: int64" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ], - "source": [ - "df.cuisine.value_counts()" - ] - }, - { - "source": [ - "Mostre as culinárias em um gráfico de barras\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 7 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAZEAAAD4CAYAAAAtrdtxAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAASY0lEQVR4nO3df7TldV3v8eerGZkRRoeAiXtE5UgNIkUCjlwQIzAiC7NscdcSbcmsfkxl5SXX0juuyzK9d3UvlXnpplajma0kMtCUhluImNcr8msGBmb4pZaTQCFQOYom0fi+f+zPkd14hpnzOWefvYfzfKy113z35/vde7/22fvMa3++3733SVUhSVKPbxt3AEnSgcsSkSR1s0QkSd0sEUlSN0tEktRt+bgDLKYjjjiipqenxx1Dkg4oW7dufbiq1sy2bkmVyPT0NFu2bBl3DEk6oCT5u72tc3eWJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqduS+sT69vt3Mb3xqnHH0ALZefG5444gLXnORCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd0sEUlSN0tEktRtIkokyaFJXtuWz0yyeY6X/29Jzh5NOknS3kxEiQCHAq/tvXBVvbmqPraAeSRJ+2FSSuRi4DuTbAN+E1iV5Iokdye5NEkAkrw5yc1JdiTZNDT+viTnjTG/JC1Jk1IiG4G/qaoTgTcAJwEXAscDxwCnt+3eUVUvrKrvAZ4KvGxfV5xkQ5ItSbbs/tqu0aSXpCVqUkpkTzdV1X1V9Q1gGzDdxs9KcmOS7cBLgO/e1xVV1aaqWldV65YdvHp0iSVpCZrUL2B8dGh5N7A8yUrgXcC6qro3yVuAleMIJ0kamJSZyFeAp+1jm5nCeDjJKsBjIJI0ZhMxE6mqf0xyXZIdwL8AX5xlmy8leTewA3gAuHmRY0qS9jARJQJQVa/ay/gvDS1fBFw0yzbrR5dMkrQ3k7I7S5J0ALJEJEndLBFJUjdLRJLUzRKRJHWbmHdnLYYTjlrNlovPHXcMSXrScCYiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6rZ83AEW0/b7dzG98apxx9CY7Lz43HFHkJ50nIlIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG77VSJJPj3qIJKkA89+lUhVvWjUQSRJB579nYk8kmRVkmuT3JJke5Ifa+umk9yd5NIkdyW5IsnBbd2bk9ycZEeSTUnSxj+R5NeT3JTkM0m+r40vS/Kb7TK3J/m5Nj6V5JNJtrXrmtn+nCTXt0yXJ1k1ih+SJGl2czkm8nXgFVV1MnAW8FszpQA8F3hXVT0P+DLw2jb+jqp6YVV9D/BU4GVD17e8qk4BLgR+tY39NLCrql4IvBD42STPAV4FXF1VJwLPB7YlOQK4CDi7ZdoCvH4ud16SND9z+dqTAP8jyRnAN4CjgCPbunur6rq2/H7gdcDbgLOSvBE4GDgMuAP4i7bdh9q/W4HptnwO8L1JzmvnVwNrgZuB9yZ5CvDhqtqW5PuB44HrWpcdBFz/LaGTDcAGgGVPXzOHuytJ2pe5lMirgTXAC6rqsSQ7gZVtXe2xbSVZCbwLWFdV9yZ5y9D2AI+2f3cP5Qjwy1V19Z433srrXOB9Sd4O/DNwTVWd/0Shq2oTsAlgxdTaPXNKkuZhLruzVgMPtgI5Czh6aN2zk5zWll8FfIrHC+PhdqziPPbtauAX2oyDJMcmOSTJ0cAXq+rdwHuAk4EbgNOTfFfb9pAkx87h/kiS5ml/ZyIFXAr8RZLtDI4/3D20/h7gF5O8F7gT+N2q+lqSdwM7gAcY7JLal/cw2LV1Szve8hDw48CZwBuSPAY8Arymqh5Ksh64LMmKdvmLgM/s532SJM1Tqp54D0+Sw4FbqurovayfBja3g+cTbcXU2pq64JJxx9CY+FXwUp8kW6tq3WzrnnB3VpJnMDhY/bZRBJMkHdiecHdWVf098ITHGapqJzDxsxBJ0sLzu7MkSd0sEUlSN0tEktRtLh82POCdcNRqtvgOHUlaMM5EJEndLBFJUjdLRJLUzRKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd0sEUlSN0tEktTNEpEkdbNEJEndLBFJUjdLRJLUzRKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd2WjzvAYtp+/y6mN1417hhSt50XnzvuCNK/40xEktTNEpEkdbNEJEndLBFJUjdLRJLUzRKRJHWzRCRJ3Ra0RJK8L8l5s4w/I8kVC3lbkqTxW5QPG1bV3wPfUi6SpAPbvGYiSV6T5PYktyX54zZ8RpJPJ/nbmVlJkukkO9ry+iQfSvJXST6b5DeGru+cJNcnuSXJ5UlWtfGLk9zZbuttbWxNkg8mubmdTp/PfZEkzV33TCTJdwMXAS+qqoeTHAa8HZgCXgwcB1wJzLYb60TgJOBR4J4kvwP8S7u+s6vqq0n+C/D6JO8EXgEcV1WV5NB2Hb8N/K+q+lSSZwNXA8+bJecGYAPAsqev6b27kqRZzGd31kuAy6vqYYCq+qckAB+uqm8AdyY5ci+XvbaqdgEkuRM4GjgUOB64rl3PQcD1wC7g68AfJNkMbG7XcTZwfNsW4OlJVlXVI8M3VFWbgE0AK6bW1jzuryRpD6M4JvLo0HL2Y5vdLUeAa6rq/D03TnIK8AMMjqv8EoMC+zbg1Kr6+kKEliTN3XyOiXwc+E9JDgdou7Pm4wbg9CTf1a7vkCTHtuMiq6vq/wC/Ajy/bf9R4JdnLpzkxHneviRpjrpnIlV1R5JfA/5vkt3ArfMJUlUPJVkPXJZkRRu+CPgK8JEkKxnMVl7f1r0OeGeS2xncj08CPz+fDJKkuUnV0jlMsGJqbU1dcMm4Y0jd/HsiGockW6tq3Wzr/MS6JKmbJSJJ6maJSJK6WSKSpG6WiCSp26J8AeOkOOGo1Wzx3S2StGCciUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6LR93gMW0/f5dTG+8atwxJM3RzovPHXcE7YUzEUlSN0tEktTNEpEkdbNEJEndLBFJUjdLRJLUbWQlkuTTc9z+zCSb2/LLk2wcTTJJ0kIZ2edEqupF87jslcCVCxhHkjQCo5yJPNL+PTPJJ5JckeTuJJcmSVv30jZ2C/ATQ5ddn+QdbflHk9yY5NYkH0tyZBt/S5L3tuv+2ySvG9V9kSTNbrGOiZwEXAgcDxwDnJ5kJfBu4EeBFwD/YS+X/RRwalWdBPwp8MahdccBPwScAvxqkqeMJr4kaTaL9bUnN1XVfQBJtgHTwCPA56vqs238/cCGWS77TOADSaaAg4DPD627qqoeBR5N8iBwJHDf8IWTbJi53mVPX7OQ90mSlrzFmok8OrS8m7mV1+8A76iqE4CfA1bO5XqralNVrauqdcsOXj2Hm5Uk7cs43+J7NzCd5Dvb+fP3st1q4P62fMHIU0mS9tvYSqSqvs5gN9NV7cD6g3vZ9C3A5Um2Ag8vUjxJ0n5IVY07w6JZMbW2pi64ZNwxJM2RXwU/Xkm2VtW62db5iXVJUjdLRJLUzRKRJHWzRCRJ3SwRSVK3xfrE+kQ44ajVbPFdHpK0YJyJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrotH3eAxbT9/l1Mb7xq3DEkaVHtvPjckV23MxFJUjdLRJLUzRKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1W9ASSTKdZMdCXqckaXJNxEwkyZL60KMkPVmMrESSHJPk1iTfl+QPk2xv589q69cnuTLJx4Fr29gbktyc5PYkbx26rg8n2ZrkjiQbhsYfSfJrSW5LckOSI0d1fyRJ32okJZLkucAHgfXAKUBV1QnA+cAfJVnZNj0ZOK+qvj/JOcDatv2JwAuSnNG2+6mqegGwDnhdksPb+CHADVX1fOCTwM/OkmVDki1Jtuz+2q5R3F1JWrJGUSJrgI8Ar66q24AXA+8HqKq7gb8Djm3bXlNV/9SWz2mnW4FbgOMYlAoMiuM24AbgWUPj/wpsbstbgek9w1TVpqpaV1Xrlh28eqHuoySJ0XwB4y7gCwzK4859bPvVoeUA/7Oqfn94gyRnAmcDp1XV15J8ApiZyTxWVdWWd7PEvlBSksZtFDORfwVeAbwmyauA/we8GiDJscCzgXtmudzVwE8lWdW2PSrJdwCrgX9uBXIccOoIMkuSOozklXtVfTXJy4BrgP8OnJBkO/BvwPqqejTJnpf5aJLnAde3dY8APwn8FfDzSe5iUD43jCKzJGnu8vjeoCe/FVNra+qCS8YdQ5IW1Xz/nkiSrVW1brZ1E/E5EUnSgckSkSR1s0QkSd0sEUlSN0tEktRtSX0474SjVrNlnu9SkCQ9zpmIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqtqT+KFWSrzD7n+adFEcAD487xBMw3/yYb37MNz/zyXd0Va2ZbcWS+u4s4J69/XWuSZBki/n6mW9+zDc/SzWfu7MkSd0sEUlSt6VWIpvGHWAfzDc/5psf883Pksy3pA6sS5IW1lKbiUiSFpAlIknqtmRKJMlLk9yT5HNJNo4pw3uTPJhkx9DYYUmuSfLZ9u+3t/Ek+d8t7+1JTl6EfM9K8tdJ7kxyR5L/PEkZk6xMclOS21q+t7bx5yS5seX4QJKD2viKdv5zbf30KPO121yW5NYkmycw284k25NsS7KljU3EY9tu89AkVyS5O8ldSU6blHxJntt+bjOnLye5cFLytdv8lfZ7sSPJZe33ZfTPv6p60p+AZcDfAMcABwG3AcePIccZwMnAjqGx3wA2tuWNwK+35R8B/hIIcCpw4yLkmwJObstPAz4DHD8pGdvtrGrLTwFubLf7Z8Ar2/jvAb/Qll8L/F5bfiXwgUX4Gb4e+BNgczs/Sdl2AkfsMTYRj227zT8CfqYtHwQcOkn5hnIuAx4Ajp6UfMBRwOeBpw4979YvxvNvUX7o4z4BpwFXD51/E/CmMWWZ5t+XyD3AVFueYvCBSIDfB86fbbtFzPoR4AcnMSNwMHAL8B8ZfAp3+Z6PNXA1cFpbXt62ywgzPRO4FngJsLn9BzIR2drt7ORbS2QiHltgdftPMJOYb49M5wDXTVI+BiVyL3BYez5tBn5oMZ5/S2V31swPeMZ9bWwSHFlV/9CWHwCObMtjzdymtycxeLU/MRnb7qJtwIPANQxmmF+qqn+bJcM387X1u4DDRxjvEuCNwDfa+cMnKBtAAR9NsjXJhjY2KY/tc4CHgD9suwPfk+SQCco37JXAZW15IvJV1f3A24AvAP/A4Pm0lUV4/i2VEjkg1OBlwdjfc51kFfBB4MKq+vLwunFnrKrdVXUig1f9pwDHjSvLsCQvAx6sqq3jzvIEXlxVJwM/DPxikjOGV475sV3OYFfv71bVScBXGewe+qZxP/cA2jGFlwOX77lunPnasZgfY1DGzwAOAV66GLe9VErkfuBZQ+ef2cYmwReTTAG0fx9s42PJnOQpDArk0qr60CRmBKiqLwF/zWCKfmiSme+BG87wzXxt/WrgH0cU6XTg5Ul2An/KYJfWb09INuCbr1apqgeBP2dQwpPy2N4H3FdVN7bzVzAolUnJN+OHgVuq6ovt/KTkOxv4fFU9VFWPAR9i8Jwc+fNvqZTIzcDa9k6FgxhMR68cc6YZVwIXtOULGByHmBl/TXuXx6nArqFp80gkCfAHwF1V9fZJy5hkTZJD2/JTGRyvuYtBmZy3l3wzuc8DPt5eLS64qnpTVT2zqqYZPL8+XlWvnoRsAEkOSfK0mWUG+/V3MCGPbVU9ANyb5Llt6AeAOycl35DzeXxX1kyOScj3BeDUJAe33+OZn9/on3+LcSBqEk4M3i3xGQb70P/rmDJcxmB/5WMMXnn9NIP9kNcCnwU+BhzWtg3wzpZ3O7BuEfK9mMF0/HZgWzv9yKRkBL4XuLXl2wG8uY0fA9wEfI7BboYVbXxlO/+5tv6YRXqcz+Txd2dNRLaW47Z2umPmd2BSHtt2mycCW9rj+2Hg2ycs3yEMXq2vHhqbpHxvBe5uvxt/DKxYjOefX3siSeq2VHZnSZJGwBKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd3+PxNFbW14TY8fAAAAAElFTkSuQmCC\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df.cuisine.value_counts().plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "thai df: (289, 385)\njapanese df: (320, 385)\nchinese df: (442, 385)\nindian df: (598, 385)\nkorean df: (799, 385)\n" - ] - } - ], - "source": [ - "\n", - "thai_df = df[(df.cuisine == \"thai\")]\n", - "japanese_df = df[(df.cuisine == \"japanese\")]\n", - "chinese_df = df[(df.cuisine == \"chinese\")]\n", - "indian_df = df[(df.cuisine == \"indian\")]\n", - "korean_df = df[(df.cuisine == \"korean\")]\n", - "\n", - "print(f'thai df: {thai_df.shape}')\n", - "print(f'japanese df: {japanese_df.shape}')\n", - "print(f'chinese df: {chinese_df.shape}')\n", - "print(f'indian df: {indian_df.shape}')\n", - "print(f'korean df: {korean_df.shape}')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "def create_ingredient_df(df):\n", - " # transpose df, drop cuisine and unnamed rows, sum the row to get total for ingredient and add value header to new df\n", - " ingredient_df = df.T.drop(['cuisine','Unnamed: 0']).sum(axis=1).to_frame('value')\n", - " # drop ingredients that have a 0 sum\n", - " ingredient_df = ingredient_df[(ingredient_df.T != 0).any()]\n", - " # sort df\n", - " ingredient_df = ingredient_df.sort_values(by='value', ascending=False, inplace=False)\n", - " return ingredient_df\n" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 10 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "thai_ingredient_df = create_ingredient_df(thai_df)\r\n", - "thai_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 11 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "japanese_ingredient_df = create_ingredient_df(japanese_df)\r\n", - "japanese_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 12 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "chinese_ingredient_df = create_ingredient_df(chinese_df)\r\n", - "chinese_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 13 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "indian_ingredient_df = create_ingredient_df(indian_df)\r\n", - "indian_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 14 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "korean_ingredient_df = create_ingredient_df(korean_df)\r\n", - "korean_ingredient_df.head(10).plot.barh()" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 15 - } - ], - "source": [ - "feature_df= df.drop(['cuisine','Unnamed: 0','rice','garlic','ginger'], axis=1)\n", - "labels_df = df.cuisine #.unique()\n", - "feature_df.head()\n" - ] - }, - { - "source": [ - "Equilibre os dados com oversampling SMOTE para a classe mais alta. Leia mais aqui: https://imbalanced-learn.org/dev/references/generated/imblearn.over_sampling.SMOTE.html\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [], - "source": [ - "oversample = SMOTE()\n", - "transformed_feature_df, transformed_label_df = oversample.fit_resample(feature_df, labels_df)" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "new label count: korean 799\nchinese 799\njapanese 799\nindian 799\nthai 799\nName: cuisine, dtype: int64\nold label count: korean 799\nindian 598\nchinese 442\njapanese 320\nthai 289\nName: cuisine, dtype: int64\n" - ] - } - ], - "source": [ - "print(f'new label count: {transformed_label_df.value_counts()}')\r\n", - "print(f'old label count: {df.cuisine.value_counts()}')" - ] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 18 - } - ], - "source": [ - "transformed_feature_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " cuisine almond angelica anise anise_seed apple apple_brandy \\\n", - "0 indian 0 0 0 0 0 0 \n", - "1 indian 1 0 0 0 0 0 \n", - "2 indian 0 0 0 0 0 0 \n", - "3 indian 0 0 0 0 0 0 \n", - "4 indian 0 0 0 0 0 0 \n", - "... ... ... ... ... ... ... ... \n", - "3990 thai 0 0 0 0 0 0 \n", - "3991 thai 0 0 0 0 0 0 \n", - "3992 thai 0 0 0 0 0 0 \n", - "3993 thai 0 0 0 0 0 0 \n", - "3994 thai 0 0 0 0 0 0 \n", - "\n", - " apricot armagnac artemisia ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "... ... ... ... ... ... ... ... \n", - "3990 0 0 0 ... 0 0 0 \n", - "3991 0 0 0 ... 0 0 0 \n", - "3992 0 0 0 ... 0 0 0 \n", - "3993 0 0 0 ... 0 0 0 \n", - "3994 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "... ... ... ... ... ... ... ... \n", - "3990 0 0 0 0 0 0 0 \n", - "3991 0 0 0 0 0 0 0 \n", - "3992 0 0 0 0 0 0 0 \n", - "3993 0 0 0 0 0 0 0 \n", - "3994 0 0 0 0 0 0 0 \n", - "\n", - "[3995 rows x 381 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisia...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
0indian000000000...0000000000
1indian100000000...0000000000
2indian000000000...0000000000
3indian000000000...0000000000
4indian000000000...0000000010
..................................................................
3990thai000000000...0000000000
3991thai000000000...0000000000
3992thai000000000...0000000000
3993thai000000000...0000000000
3994thai000000000...0000000000
\n

3995 rows × 381 columns

\n
" - }, - "metadata": {}, - "execution_count": 19 - } - ], - "source": [ - "# export transformed data to new df for classification\n", - "transformed_df = pd.concat([transformed_label_df,transformed_feature_df],axis=1, join='outer')\n", - "transformed_df" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\nRangeIndex: 3995 entries, 0 to 3994\nColumns: 381 entries, cuisine to zucchini\ndtypes: int64(380), object(1)\nmemory usage: 11.6+ MB\n" - ] - } - ], - "source": [ - "transformed_df.info()" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [], - "source": [ - "transformed_df.to_csv(\"../../data/cleaned_cuisines.csv\")" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "1da12ed6d238756959b8de9cac2a35a2", - "translation_date": "2025-08-29T23:54:14+00:00", - "source_file": "4-Classification/1-Introduction/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/br/4-Classification/2-Classifiers-1/README.md b/translations/br/4-Classification/2-Classifiers-1/README.md deleted file mode 100644 index f97be34bb..000000000 --- a/translations/br/4-Classification/2-Classifiers-1/README.md +++ /dev/null @@ -1,253 +0,0 @@ - -# Classificadores de culinária 1 - -Nesta lição, você usará o conjunto de dados que salvou na última lição, cheio de dados equilibrados e limpos sobre culinárias. - -Você usará este conjunto de dados com uma variedade de classificadores para _prever uma culinária nacional com base em um grupo de ingredientes_. Enquanto faz isso, aprenderá mais sobre algumas das maneiras pelas quais os algoritmos podem ser utilizados para tarefas de classificação. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) -# Preparação - -Assumindo que você completou [Lição 1](../1-Introduction/README.md), certifique-se de que um arquivo _cleaned_cuisines.csv_ exista na pasta raiz `/data` para estas quatro lições. - -## Exercício - prever uma culinária nacional - -1. Trabalhando na pasta _notebook.ipynb_ desta lição, importe esse arquivo junto com a biblioteca Pandas: - - ```python - import pandas as pd - cuisines_df = pd.read_csv("../data/cleaned_cuisines.csv") - cuisines_df.head() - ``` - - Os dados têm esta aparência: - -| | Unnamed: 0 | cuisine | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | -| --- | ---------- | ------- | ------ | -------- | ----- | ---------- | ----- | ------------ | ------- | -------- | --- | ------- | ----------- | ---------- | ----------------------- | ---- | ---- | --- | ----- | ------ | -------- | -| 0 | 0 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 1 | 1 | indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 2 | 2 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 3 | 3 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 4 | 4 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | - - -1. Agora, importe várias outras bibliotecas: - - ```python - from sklearn.linear_model import LogisticRegression - from sklearn.model_selection import train_test_split, cross_val_score - from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve - from sklearn.svm import SVC - import numpy as np - ``` - -1. Divida as coordenadas X e y em dois dataframes para treinamento. `cuisine` pode ser o dataframe de rótulos: - - ```python - cuisines_label_df = cuisines_df['cuisine'] - cuisines_label_df.head() - ``` - - Ele terá esta aparência: - - ```output - 0 indian - 1 indian - 2 indian - 3 indian - 4 indian - Name: cuisine, dtype: object - ``` - -1. Remova a coluna `Unnamed: 0` e a coluna `cuisine`, chamando `drop()`. Salve o restante dos dados como características treináveis: - - ```python - cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1) - cuisines_feature_df.head() - ``` - - Suas características terão esta aparência: - -| | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | artemisia | artichoke | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | -| ---: | -----: | -------: | ----: | ---------: | ----: | -----------: | ------: | -------: | --------: | --------: | ---: | ------: | ----------: | ---------: | ----------------------: | ---: | ---: | ---: | ----: | -----: | -------: | -| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | - -Agora você está pronto para treinar seu modelo! - -## Escolhendo seu classificador - -Agora que seus dados estão limpos e prontos para treinamento, você precisa decidir qual algoritmo usar para a tarefa. - -O Scikit-learn agrupa classificação sob Aprendizado Supervisionado, e nessa categoria você encontrará muitas maneiras de classificar. [A variedade](https://scikit-learn.org/stable/supervised_learning.html) pode parecer confusa à primeira vista. Os seguintes métodos incluem técnicas de classificação: - -- Modelos Lineares -- Máquinas de Vetores de Suporte -- Descida de Gradiente Estocástico -- Vizinhos Mais Próximos -- Processos Gaussianos -- Árvores de Decisão -- Métodos de Conjunto (voting Classifier) -- Algoritmos multiclasses e multioutput (classificação multiclasses e multilabel, classificação multiclasses-multioutput) - -> Você também pode usar [redes neurais para classificar dados](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), mas isso está fora do escopo desta lição. - -### Qual classificador escolher? - -Então, qual classificador você deve escolher? Muitas vezes, testar vários e procurar um bom resultado é uma maneira de avaliar. O Scikit-learn oferece uma [comparação lado a lado](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) em um conjunto de dados criado, comparando KNeighbors, SVC de duas maneiras, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB e QuadraticDiscrinationAnalysis, mostrando os resultados visualizados: - -![comparação de classificadores](../../../../4-Classification/2-Classifiers-1/images/comparison.png) -> Gráficos gerados na documentação do Scikit-learn - -> O AutoML resolve esse problema de forma prática ao executar essas comparações na nuvem, permitindo que você escolha o melhor algoritmo para seus dados. Experimente [aqui](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) - -### Uma abordagem melhor - -Uma maneira melhor do que adivinhar aleatoriamente, no entanto, é seguir as ideias deste [guia de referência de ML](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott) para download. Aqui, descobrimos que, para nosso problema multiclasses, temos algumas opções: - -![guia para problemas multiclasses](../../../../4-Classification/2-Classifiers-1/images/cheatsheet.png) -> Uma seção do Guia de Algoritmos da Microsoft, detalhando opções de classificação multiclasses - -✅ Baixe este guia, imprima e pendure na sua parede! - -### Raciocínio - -Vamos ver se conseguimos raciocinar sobre diferentes abordagens, dadas as restrições que temos: - -- **Redes neurais são muito pesadas**. Dado nosso conjunto de dados limpo, mas minimalista, e o fato de que estamos executando o treinamento localmente via notebooks, redes neurais são muito pesadas para esta tarefa. -- **Nenhum classificador de duas classes**. Não usamos um classificador de duas classes, então isso exclui o one-vs-all. -- **Árvore de decisão ou regressão logística podem funcionar**. Uma árvore de decisão pode funcionar, ou regressão logística para dados multiclasses. -- **Árvores de decisão impulsionadas multiclasses resolvem outro problema**. A árvore de decisão impulsionada multiclasses é mais adequada para tarefas não paramétricas, como tarefas projetadas para construir rankings, então não é útil para nós. - -### Usando Scikit-learn - -Usaremos o Scikit-learn para analisar nossos dados. No entanto, existem muitas maneiras de usar regressão logística no Scikit-learn. Veja os [parâmetros que podem ser passados](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). - -Basicamente, há dois parâmetros importantes - `multi_class` e `solver` - que precisamos especificar ao pedir ao Scikit-learn para realizar uma regressão logística. O valor de `multi_class` aplica um certo comportamento. O valor do solver define qual algoritmo usar. Nem todos os solvers podem ser combinados com todos os valores de `multi_class`. - -De acordo com a documentação, no caso multiclasses, o algoritmo de treinamento: - -- **Usa o esquema one-vs-rest (OvR)**, se a opção `multi_class` estiver configurada como `ovr` -- **Usa a perda de entropia cruzada**, se a opção `multi_class` estiver configurada como `multinomial`. (Atualmente, a opção `multinomial` é suportada apenas pelos solvers ‘lbfgs’, ‘sag’, ‘saga’ e ‘newton-cg’.) - -> 🎓 O 'esquema' aqui pode ser 'ovr' (one-vs-rest) ou 'multinomial'. Como a regressão logística foi projetada para suportar classificação binária, esses esquemas permitem que ela lide melhor com tarefas de classificação multiclasses. [fonte](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) - -> 🎓 O 'solver' é definido como "o algoritmo a ser usado no problema de otimização". [fonte](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). - -O Scikit-learn oferece esta tabela para explicar como os solvers lidam com diferentes desafios apresentados por diferentes tipos de estruturas de dados: - -![solvers](../../../../4-Classification/2-Classifiers-1/images/solvers.png) - -## Exercício - dividir os dados - -Podemos focar na regressão logística para nosso primeiro teste de treinamento, já que você aprendeu sobre ela recentemente em uma lição anterior. -Divida seus dados em grupos de treinamento e teste chamando `train_test_split()`: - -```python -X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) -``` - -## Exercício - aplicar regressão logística - -Como você está usando o caso multiclasses, precisa escolher qual _esquema_ usar e qual _solver_ configurar. Use LogisticRegression com uma configuração multiclasses e o solver **liblinear** para treinar. - -1. Crie uma regressão logística com `multi_class` configurado como `ovr` e o solver configurado como `liblinear`: - - ```python - lr = LogisticRegression(multi_class='ovr',solver='liblinear') - model = lr.fit(X_train, np.ravel(y_train)) - - accuracy = model.score(X_test, y_test) - print ("Accuracy is {}".format(accuracy)) - ``` - - ✅ Experimente um solver diferente, como `lbfgs`, que frequentemente é configurado como padrão -> Observação, use a função Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) para achatar seus dados quando necessário. -A precisão é boa em mais de **80%**! - -1. Você pode ver este modelo em ação testando uma linha de dados (#50): - - ```python - print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}') - print(f'cuisine: {y_test.iloc[50]}') - ``` - - O resultado é exibido: - - ```output - ingredients: Index(['cilantro', 'onion', 'pea', 'potato', 'tomato', 'vegetable_oil'], dtype='object') - cuisine: indian - ``` - - ✅ Experimente um número de linha diferente e verifique os resultados. - -1. Indo mais a fundo, você pode verificar a precisão desta previsão: - - ```python - test= X_test.iloc[50].values.reshape(-1, 1).T - proba = model.predict_proba(test) - classes = model.classes_ - resultdf = pd.DataFrame(data=proba, columns=classes) - - topPrediction = resultdf.T.sort_values(by=[0], ascending = [False]) - topPrediction.head() - ``` - - O resultado é exibido - culinária indiana é sua melhor aposta, com boa probabilidade: - - | | 0 | - | -------: | -------: | - | indian | 0.715851 | - | chinese | 0.229475 | - | japanese | 0.029763 | - | korean | 0.017277 | - | thai | 0.007634 | - - ✅ Você consegue explicar por que o modelo tem tanta certeza de que se trata de uma culinária indiana? - -1. Obtenha mais detalhes imprimindo um relatório de classificação, como você fez nas lições de regressão: - - ```python - y_pred = model.predict(X_test) - print(classification_report(y_test,y_pred)) - ``` - - | | precisão | recall | f1-score | suporte | - | ------------ | -------- | ------ | -------- | ------- | - | chinese | 0.73 | 0.71 | 0.72 | 229 | - | indian | 0.91 | 0.93 | 0.92 | 254 | - | japanese | 0.70 | 0.75 | 0.72 | 220 | - | korean | 0.86 | 0.76 | 0.81 | 242 | - | thai | 0.79 | 0.85 | 0.82 | 254 | - | accuracy | 0.80 | 1199 | | | - | macro avg | 0.80 | 0.80 | 0.80 | 1199 | - | weighted avg | 0.80 | 0.80 | 0.80 | 1199 | - -## 🚀Desafio - -Nesta lição, você usou seus dados limpos para construir um modelo de aprendizado de máquina que pode prever uma culinária nacional com base em uma série de ingredientes. Reserve um tempo para explorar as muitas opções que o Scikit-learn oferece para classificar dados. Aprofunde-se no conceito de 'solver' para entender o que acontece nos bastidores. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Aprofunde-se um pouco mais na matemática por trás da regressão logística nesta [lição](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf). -## Tarefa - -[Estude os solvers](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/2-Classifiers-1/assignment.md b/translations/br/4-Classification/2-Classifiers-1/assignment.md deleted file mode 100644 index 9359175f2..000000000 --- a/translations/br/4-Classification/2-Classifiers-1/assignment.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Estude os solucionadores -## Instruções - -Nesta lição, você aprendeu sobre os diversos solucionadores que combinam algoritmos com um processo de aprendizado de máquina para criar um modelo preciso. Revise os solucionadores listados na lição e escolha dois. Com suas próprias palavras, compare e contraste esses dois solucionadores. Que tipo de problema eles resolvem? Como eles trabalham com diferentes estruturas de dados? Por que você escolheria um em vez do outro? -## Rubrica - -| Critérios | Exemplary | Adequado | Precisa de Melhorias | -| --------- | ---------------------------------------------------------------------------------------------- | ------------------------------------------------ | ---------------------------- | -| | Um arquivo .doc é apresentado com dois parágrafos, um para cada solucionador, comparando-os de forma reflexiva. | Um arquivo .doc é apresentado com apenas um parágrafo | A tarefa está incompleta | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/2-Classifiers-1/notebook.ipynb b/translations/br/4-Classification/2-Classifiers-1/notebook.ipynb deleted file mode 100644 index 498a8190e..000000000 --- a/translations/br/4-Classification/2-Classifiers-1/notebook.ipynb +++ /dev/null @@ -1,41 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "68829b06b4dcd512d3327849191f4d7f", - "translation_date": "2025-08-29T23:41:00+00:00", - "source_file": "4-Classification/2-Classifiers-1/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Construir Modelos de Classificação\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/2-Classifiers-1/solution/Julia/README.md b/translations/br/4-Classification/2-Classifiers-1/solution/Julia/README.md deleted file mode 100644 index 20b7e185f..000000000 --- a/translations/br/4-Classification/2-Classifiers-1/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb b/translations/br/4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb deleted file mode 100644 index 79d9b67bb..000000000 --- a/translations/br/4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb +++ /dev/null @@ -1,1300 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_11-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "6ea6a5171b1b99b7b5a55f7469c048d2", - "translation_date": "2025-08-29T23:45:42+00:00", - "source_file": "4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Construir um modelo de classificação: Deliciosas culinárias asiáticas e indianas\n" - ], - "metadata": { - "id": "zs2woWv_HoE8" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Classificadores de culinária 1\n", - "\n", - "Nesta lição, exploraremos uma variedade de classificadores para *prever uma culinária nacional específica com base em um grupo de ingredientes.* Enquanto fazemos isso, aprenderemos mais sobre algumas das maneiras como os algoritmos podem ser utilizados em tarefas de classificação.\n", - "\n", - "### [**Quiz pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/21/)\n", - "\n", - "### **Preparação**\n", - "\n", - "Esta lição se baseia na nossa [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/4-Classification/1-Introduction/solution/lesson_10-R.ipynb), onde:\n", - "\n", - "- Fizemos uma introdução leve às classificações usando um conjunto de dados sobre todas as brilhantes culinárias da Ásia e Índia 😋.\n", - "\n", - "- Exploramos alguns [verbos do dplyr](https://dplyr.tidyverse.org/) para preparar e limpar nossos dados.\n", - "\n", - "- Criamos visualizações bonitas usando ggplot2.\n", - "\n", - "- Demonstramos como lidar com dados desbalanceados ao pré-processá-los usando [recipes](https://recipes.tidymodels.org/articles/Simple_Example.html).\n", - "\n", - "- Mostramos como `prep` e `bake` nossa receita para confirmar que ela funcionará como esperado.\n", - "\n", - "#### **Pré-requisito**\n", - "\n", - "Para esta lição, precisaremos dos seguintes pacotes para limpar, preparar e visualizar nossos dados:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O framework [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizado de máquina.\n", - "\n", - "- `themis`: O pacote [themis](https://themis.tidymodels.org/) fornece etapas extras de receitas para lidar com dados desbalanceados.\n", - "\n", - "- `nnet`: O pacote [nnet](https://cran.r-project.org/web/packages/nnet/nnet.pdf) fornece funções para estimar redes neurais feed-forward com uma única camada oculta e para modelos de regressão logística multinomial.\n", - "\n", - "Você pode instalá-los como:\n" - ], - "metadata": { - "id": "iDFOb3ebHwQC" - } - }, - { - "cell_type": "markdown", - "source": [ - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"DataExplorer\", \"here\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala caso estejam ausentes.\n" - ], - "metadata": { - "id": "4V85BGCjII7F" - } - }, - { - "cell_type": "code", - "execution_count": 2, - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\r\n", - "\r\n", - "pacman::p_load(tidyverse, tidymodels, themis, here)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "Loading required package: pacman\n", - "\n" - ] - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "an5NPyyKIKNR", - "outputId": "834d5e74-f4b8-49f9-8ab5-4c52ff2d7bc8" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 1. Divida os dados em conjuntos de treinamento e teste.\n", - "\n", - "Vamos começar escolhendo alguns passos da nossa lição anterior.\n", - "\n", - "### Remova os ingredientes mais comuns que geram confusão entre diferentes culinárias, usando `dplyr::select()`.\n", - "\n", - "Todo mundo adora arroz, alho e gengibre!\n" - ], - "metadata": { - "id": "0ax9GQLBINVv" - } - }, - { - "cell_type": "code", - "execution_count": 3, - "source": [ - "# Load the original cuisines data\r\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/4-Classification/data/cuisines.csv\")\r\n", - "\r\n", - "# Drop id column, rice, garlic and ginger from our original data set\r\n", - "df_select <- df %>% \r\n", - " select(-c(1, rice, garlic, ginger)) %>%\r\n", - " # Encode cuisine column as categorical\r\n", - " mutate(cuisine = factor(cuisine))\r\n", - "\r\n", - "# Display new data set\r\n", - "df_select %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "# Display distribution of cuisines\r\n", - "df_select %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "New names:\n", - "* `` -> ...1\n", - "\n", - "\u001b[1m\u001b[1mRows: \u001b[1m\u001b[22m\u001b[34m\u001b[34m2448\u001b[34m\u001b[39m \u001b[1m\u001b[1mColumns: \u001b[1m\u001b[22m\u001b[34m\u001b[34m385\u001b[34m\u001b[39m\n", - "\n", - "\u001b[36m──\u001b[39m \u001b[1m\u001b[1mColumn specification\u001b[1m\u001b[22m \u001b[36m────────────────────────────────────────────────────────\u001b[39m\n", - "\u001b[1mDelimiter:\u001b[22m \",\"\n", - "\u001b[31mchr\u001b[39m (1): cuisine\n", - "\u001b[32mdbl\u001b[39m (384): ...1, almond, angelica, anise, anise_seed, apple, apple_brandy, a...\n", - "\n", - "\n", - "\u001b[36mℹ\u001b[39m Use \u001b[30m\u001b[47m\u001b[30m\u001b[47m`spec()`\u001b[47m\u001b[30m\u001b[49m\u001b[39m to retrieve the full column specification for this data.\n", - "\u001b[36mℹ\u001b[39m Specify the column types or set \u001b[30m\u001b[47m\u001b[30m\u001b[47m`show_col_types = FALSE`\u001b[47m\u001b[30m\u001b[49m\u001b[39m to quiet this message.\n", - "\n" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine almond angelica anise anise_seed apple apple_brandy apricot armagnac\n", - "1 indian 0 0 0 0 0 0 0 0 \n", - "2 indian 1 0 0 0 0 0 0 0 \n", - "3 indian 0 0 0 0 0 0 0 0 \n", - "4 indian 0 0 0 0 0 0 0 0 \n", - "5 indian 0 0 0 0 0 0 0 0 \n", - " artemisia ⋯ whiskey white_bread white_wine whole_grain_wheat_flour wine wood\n", - "1 0 ⋯ 0 0 0 0 0 0 \n", - "2 0 ⋯ 0 0 0 0 0 0 \n", - "3 0 ⋯ 0 0 0 0 0 0 \n", - "4 0 ⋯ 0 0 0 0 0 0 \n", - "5 0 ⋯ 0 0 0 0 0 0 \n", - " yam yeast yogurt zucchini\n", - "1 0 0 0 0 \n", - "2 0 0 0 0 \n", - "3 0 0 0 0 \n", - "4 0 0 0 0 \n", - "5 0 0 1 0 " - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 381\n", - "\n", - "| cuisine <fct> | almond <dbl> | angelica <dbl> | anise <dbl> | anise_seed <dbl> | apple <dbl> | apple_brandy <dbl> | apricot <dbl> | armagnac <dbl> | artemisia <dbl> | ⋯ ⋯ | whiskey <dbl> | white_bread <dbl> | white_wine <dbl> | whole_grain_wheat_flour <dbl> | wine <dbl> | wood <dbl> | yam <dbl> | yeast <dbl> | yogurt <dbl> | zucchini <dbl> |\n", - "|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 381\n", - "\\begin{tabular}{lllllllllllllllllllll}\n", - " cuisine & almond & angelica & anise & anise\\_seed & apple & apple\\_brandy & apricot & armagnac & artemisia & ⋯ & whiskey & white\\_bread & white\\_wine & whole\\_grain\\_wheat\\_flour & wine & wood & yam & yeast & yogurt & zucchini\\\\\n", - " & & & & & & & & & & ⋯ & & & & & & & & & & \\\\\n", - "\\hline\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 381
cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiawhiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
<fct><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl>
indian0000000000000000000
indian1000000000000000000
indian0000000000000000000
indian0000000000000000000
indian0000000000000000010
\n" - ] - }, - "metadata": {} - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine n \n", - "1 korean 799\n", - "2 indian 598\n", - "3 chinese 442\n", - "4 japanese 320\n", - "5 thai 289" - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 2\n", - "\n", - "| cuisine <fct> | n <int> |\n", - "|---|---|\n", - "| korean | 799 |\n", - "| indian | 598 |\n", - "| chinese | 442 |\n", - "| japanese | 320 |\n", - "| thai | 289 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 2\n", - "\\begin{tabular}{ll}\n", - " cuisine & n\\\\\n", - " & \\\\\n", - "\\hline\n", - "\t korean & 799\\\\\n", - "\t indian & 598\\\\\n", - "\t chinese & 442\\\\\n", - "\t japanese & 320\\\\\n", - "\t thai & 289\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 2
cuisinen
<fct><int>
korean 799
indian 598
chinese 442
japanese320
thai 289
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 735 - }, - "id": "jhCrrH22IWVR", - "outputId": "d444a85c-1d8b-485f-bc4f-8be2e8f8217c" - } - }, - { - "cell_type": "markdown", - "source": [ - "Perfeito! Agora, é hora de dividir os dados de forma que 70% dos dados sejam destinados ao treinamento e 30% ao teste. Também aplicaremos uma técnica de `estratificação` ao dividir os dados para `manter a proporção de cada tipo de culinária` nos conjuntos de treinamento e validação.\n", - "\n", - "[rsample](https://rsample.tidymodels.org/), um pacote do Tidymodels, fornece infraestrutura para divisão e reamostragem de dados de forma eficiente:\n" - ], - "metadata": { - "id": "AYTjVyajIdny" - } - }, - { - "cell_type": "code", - "execution_count": 4, - "source": [ - "# Load the core Tidymodels packages into R session\r\n", - "library(tidymodels)\r\n", - "\r\n", - "# Create split specification\r\n", - "set.seed(2056)\r\n", - "cuisines_split <- initial_split(data = df_select,\r\n", - " strata = cuisine,\r\n", - " prop = 0.7)\r\n", - "\r\n", - "# Extract the data in each split\r\n", - "cuisines_train <- training(cuisines_split)\r\n", - "cuisines_test <- testing(cuisines_split)\r\n", - "\r\n", - "# Print the number of cases in each split\r\n", - "cat(\"Training cases: \", nrow(cuisines_train), \"\\n\",\r\n", - " \"Test cases: \", nrow(cuisines_test), sep = \"\")\r\n", - "\r\n", - "# Display the first few rows of the training set\r\n", - "cuisines_train %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "\r\n", - "# Display distribution of cuisines in the training set\r\n", - "cuisines_train %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Training cases: 1712\n", - "Test cases: 736" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine almond angelica anise anise_seed apple apple_brandy apricot armagnac\n", - "1 chinese 0 0 0 0 0 0 0 0 \n", - "2 chinese 0 0 0 0 0 0 0 0 \n", - "3 chinese 0 0 0 0 0 0 0 0 \n", - "4 chinese 0 0 0 0 0 0 0 0 \n", - "5 chinese 0 0 0 0 0 0 0 0 \n", - " artemisia ⋯ whiskey white_bread white_wine whole_grain_wheat_flour wine wood\n", - "1 0 ⋯ 0 0 0 0 1 0 \n", - "2 0 ⋯ 0 0 0 0 1 0 \n", - "3 0 ⋯ 0 0 0 0 0 0 \n", - "4 0 ⋯ 0 0 0 0 0 0 \n", - "5 0 ⋯ 0 0 0 0 0 0 \n", - " yam yeast yogurt zucchini\n", - "1 0 0 0 0 \n", - "2 0 0 0 0 \n", - "3 0 0 0 0 \n", - "4 0 0 0 0 \n", - "5 0 0 0 0 " - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 381\n", - "\n", - "| cuisine <fct> | almond <dbl> | angelica <dbl> | anise <dbl> | anise_seed <dbl> | apple <dbl> | apple_brandy <dbl> | apricot <dbl> | armagnac <dbl> | artemisia <dbl> | ⋯ ⋯ | whiskey <dbl> | white_bread <dbl> | white_wine <dbl> | whole_grain_wheat_flour <dbl> | wine <dbl> | wood <dbl> | yam <dbl> | yeast <dbl> | yogurt <dbl> | zucchini <dbl> |\n", - "|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 381\n", - "\\begin{tabular}{lllllllllllllllllllll}\n", - " cuisine & almond & angelica & anise & anise\\_seed & apple & apple\\_brandy & apricot & armagnac & artemisia & ⋯ & whiskey & white\\_bread & white\\_wine & whole\\_grain\\_wheat\\_flour & wine & wood & yam & yeast & yogurt & zucchini\\\\\n", - " & & & & & & & & & & ⋯ & & & & & & & & & & \\\\\n", - "\\hline\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 381
cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiawhiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
<fct><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl>
chinese0000000000000100000
chinese0000000000000100000
chinese0000000000000000000
chinese0000000000000000000
chinese0000000000000000000
\n" - ] - }, - "metadata": {} - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine n \n", - "1 korean 559\n", - "2 indian 418\n", - "3 chinese 309\n", - "4 japanese 224\n", - "5 thai 202" - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 2\n", - "\n", - "| cuisine <fct> | n <int> |\n", - "|---|---|\n", - "| korean | 559 |\n", - "| indian | 418 |\n", - "| chinese | 309 |\n", - "| japanese | 224 |\n", - "| thai | 202 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 2\n", - "\\begin{tabular}{ll}\n", - " cuisine & n\\\\\n", - " & \\\\\n", - "\\hline\n", - "\t korean & 559\\\\\n", - "\t indian & 418\\\\\n", - "\t chinese & 309\\\\\n", - "\t japanese & 224\\\\\n", - "\t thai & 202\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 2
cuisinen
<fct><int>
korean 559
indian 418
chinese 309
japanese224
thai 202
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 535 - }, - "id": "w5FWIkEiIjdN", - "outputId": "2e195fd9-1a8f-4b91-9573-cce5582242df" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 2. Lidando com dados desbalanceados\n", - "\n", - "Como você deve ter notado no conjunto de dados original, assim como no nosso conjunto de treinamento, há uma distribuição bastante desigual no número de tipos de culinária. Culinárias coreanas são *quase* 3 vezes mais numerosas que as culinárias tailandesas. Dados desbalanceados frequentemente têm efeitos negativos no desempenho do modelo. Muitos modelos apresentam melhor desempenho quando o número de observações é igual e, por isso, tendem a ter dificuldades com dados desbalanceados.\n", - "\n", - "Existem basicamente duas maneiras de lidar com conjuntos de dados desbalanceados:\n", - "\n", - "- adicionar observações à classe minoritária: `Over-sampling`, por exemplo, usando um algoritmo SMOTE, que gera novos exemplos da classe minoritária de forma sintética, utilizando os vizinhos mais próximos desses casos.\n", - "\n", - "- remover observações da classe majoritária: `Under-sampling`\n", - "\n", - "Na nossa lição anterior, demonstramos como lidar com conjuntos de dados desbalanceados usando um `recipe`. Um recipe pode ser pensado como um plano que descreve quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para análise. No nosso caso, queremos ter uma distribuição igual no número de nossas culinárias para o nosso `conjunto de treinamento`. Vamos direto ao ponto.\n" - ], - "metadata": { - "id": "daBi9qJNIwqW" - } - }, - { - "cell_type": "code", - "execution_count": 5, - "source": [ - "# Load themis package for dealing with imbalanced data\r\n", - "library(themis)\r\n", - "\r\n", - "# Create a recipe for preprocessing training data\r\n", - "cuisines_recipe <- recipe(cuisine ~ ., data = cuisines_train) %>% \r\n", - " step_smote(cuisine)\r\n", - "\r\n", - "# Print recipe\r\n", - "cuisines_recipe" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "Data Recipe\n", - "\n", - "Inputs:\n", - "\n", - " role #variables\n", - " outcome 1\n", - " predictor 380\n", - "\n", - "Operations:\n", - "\n", - "SMOTE based on cuisine" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 200 - }, - "id": "Az6LFBGxI1X0", - "outputId": "29d71d85-64b0-4e62-871e-bcd5398573b6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Você pode, é claro, confirmar (usando prep+bake) que a receita funcionará como esperado - todas as etiquetas de culinária terão `559` observações.\n", - "\n", - "Como usaremos essa receita como um pré-processador para modelagem, um `workflow()` fará todo o preparo e execução para nós, então não precisaremos estimar a receita manualmente.\n", - "\n", - "Agora estamos prontos para treinar um modelo 👩‍💻👨‍💻!\n", - "\n", - "## 3. Escolhendo seu classificador\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "NBL3PqIWJBBB" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora precisamos decidir qual algoritmo usar para a tarefa 🤔.\n", - "\n", - "No Tidymodels, o [`pacote parsnip`](https://parsnip.tidymodels.org/index.html) fornece uma interface consistente para trabalhar com modelos em diferentes engines (pacotes). Consulte a documentação do parsnip para explorar [tipos de modelos e engines](https://www.tidymodels.org/find/parsnip/#models) e seus correspondentes [argumentos de modelo](https://www.tidymodels.org/find/parsnip/#model-args). A variedade pode parecer bastante confusa à primeira vista. Por exemplo, os seguintes métodos incluem técnicas de classificação:\n", - "\n", - "- Modelos de Classificação Baseados em Regras C5.0\n", - "\n", - "- Modelos de Discriminante Flexível\n", - "\n", - "- Modelos de Discriminante Linear\n", - "\n", - "- Modelos de Discriminante Regularizado\n", - "\n", - "- Modelos de Regressão Logística\n", - "\n", - "- Modelos de Regressão Multinomial\n", - "\n", - "- Modelos de Naive Bayes\n", - "\n", - "- Máquinas de Vetores de Suporte (SVM)\n", - "\n", - "- Vizinhos Mais Próximos\n", - "\n", - "- Árvores de Decisão\n", - "\n", - "- Métodos de Ensemble\n", - "\n", - "- Redes Neurais\n", - "\n", - "E a lista continua!\n", - "\n", - "### **Qual classificador escolher?**\n", - "\n", - "Então, qual classificador você deve escolher? Muitas vezes, testar vários e procurar por um bom resultado é uma forma de experimentar.\n", - "\n", - "> O AutoML resolve esse problema de forma prática ao executar essas comparações na nuvem, permitindo que você escolha o melhor algoritmo para seus dados. Experimente [aqui](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott)\n", - "\n", - "Além disso, a escolha do classificador depende do nosso problema. Por exemplo, quando o resultado pode ser categorizado em `mais de duas classes`, como no nosso caso, você deve usar um `algoritmo de classificação multiclasse` em vez de `classificação binária.`\n", - "\n", - "### **Uma abordagem melhor**\n", - "\n", - "Uma abordagem melhor do que simplesmente adivinhar é seguir as ideias deste [guia de referência rápida de ML](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott), que pode ser baixado. Aqui, descobrimos que, para o nosso problema de classificação multiclasse, temos algumas opções:\n", - "\n", - "

\n", - " \n", - "

Uma seção do Guia de Algoritmos da Microsoft, detalhando opções de classificação multiclasse
\n" - ], - "metadata": { - "id": "a6DLAZ3vJZ14" - } - }, - { - "cell_type": "markdown", - "source": [ - "### **Raciocínio**\n", - "\n", - "Vamos analisar diferentes abordagens dadas as restrições que temos:\n", - "\n", - "- **Redes neurais profundas são muito pesadas**. Dado nosso conjunto de dados limpo, mas minimalista, e o fato de que estamos executando o treinamento localmente via notebooks, redes neurais profundas são muito pesadas para esta tarefa.\n", - "\n", - "- **Sem classificador de duas classes**. Não utilizamos um classificador de duas classes, o que elimina a abordagem um-contra-todos.\n", - "\n", - "- **Árvore de decisão ou regressão logística podem funcionar**. Uma árvore de decisão pode funcionar, ou regressão multinomial/regressão logística multiclasses para dados multiclasses.\n", - "\n", - "- **Árvores de decisão impulsionadas multiclasses resolvem outro problema**. A árvore de decisão impulsionada multiclasses é mais adequada para tarefas não paramétricas, como tarefas projetadas para construir rankings, então não é útil para nós.\n", - "\n", - "Além disso, normalmente antes de embarcar em modelos de aprendizado de máquina mais complexos, como métodos de ensemble, é uma boa ideia construir o modelo mais simples possível para ter uma ideia do que está acontecendo. Então, para esta lição, começaremos com um modelo de `regressão multinomial`.\n", - "\n", - "> Regressão logística é uma técnica usada quando a variável de resultado é categórica (ou nominal). Para regressão logística binária, o número de variáveis de resultado é dois, enquanto o número de variáveis de resultado para regressão logística multinomial é mais de dois. Veja [Métodos Avançados de Regressão](https://bookdown.org/chua/ber642_advanced_regression/multinomial-logistic-regression.html) para leitura adicional.\n", - "\n", - "## 4. Treinar e avaliar um modelo de regressão logística multinomial.\n", - "\n", - "No Tidymodels, `parsnip::multinom_reg()`, define um modelo que usa preditores lineares para prever dados multiclasses usando a distribuição multinomial. Veja `?multinom_reg()` para as diferentes formas/motores que você pode usar para ajustar este modelo.\n", - "\n", - "Neste exemplo, ajustaremos um modelo de regressão multinomial via o motor padrão [nnet](https://cran.r-project.org/web/packages/nnet/nnet.pdf).\n", - "\n", - "> Escolhi um valor para `penalty` meio que aleatoriamente. Existem maneiras melhores de escolher este valor, como usar `reamostragem` e `ajustar` o modelo, que discutiremos mais tarde.\n", - ">\n", - "> Veja [Tidymodels: Introdução](https://www.tidymodels.org/start/tuning/) caso queira aprender mais sobre como ajustar os hiperparâmetros do modelo.\n" - ], - "metadata": { - "id": "gWMsVcbBJemu" - } - }, - { - "cell_type": "code", - "execution_count": 6, - "source": [ - "# Create a multinomial regression model specification\r\n", - "mr_spec <- multinom_reg(penalty = 1) %>% \r\n", - " set_engine(\"nnet\", MaxNWts = 2086) %>% \r\n", - " set_mode(\"classification\")\r\n", - "\r\n", - "# Print model specification\r\n", - "mr_spec" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "Multinomial Regression Model Specification (classification)\n", - "\n", - "Main Arguments:\n", - " penalty = 1\n", - "\n", - "Engine-Specific Arguments:\n", - " MaxNWts = 2086\n", - "\n", - "Computational engine: nnet \n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 166 - }, - "id": "Wq_fcyQiJvfG", - "outputId": "c30449c7-3864-4be7-f810-72a003743e2d" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ótimo trabalho 🥳! Agora que temos uma receita e uma especificação de modelo, precisamos encontrar uma maneira de agrupá-los em um objeto que primeiro pré-processará os dados, depois ajustará o modelo nos dados pré-processados e também permitirá atividades de pós-processamento, se necessário. No Tidymodels, esse objeto conveniente é chamado de [`workflow`](https://workflows.tidymodels.org/) e organiza de forma prática os componentes do seu modelo! Isso é o que chamaríamos de *pipelines* em *Python*.\n", - "\n", - "Então, vamos reunir tudo em um workflow!📦\n" - ], - "metadata": { - "id": "NlSbzDfgJ0zh" - } - }, - { - "cell_type": "code", - "execution_count": 7, - "source": [ - "# Bundle recipe and model specification\r\n", - "mr_wf <- workflow() %>% \r\n", - " add_recipe(cuisines_recipe) %>% \r\n", - " add_model(mr_spec)\r\n", - "\r\n", - "# Print out workflow\r\n", - "mr_wf" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "══ Workflow ════════════════════════════════════════════════════════════════════\n", - "\u001b[3mPreprocessor:\u001b[23m Recipe\n", - "\u001b[3mModel:\u001b[23m multinom_reg()\n", - "\n", - "── Preprocessor ────────────────────────────────────────────────────────────────\n", - "1 Recipe Step\n", - "\n", - "• step_smote()\n", - "\n", - "── Model ───────────────────────────────────────────────────────────────────────\n", - "Multinomial Regression Model Specification (classification)\n", - "\n", - "Main Arguments:\n", - " penalty = 1\n", - "\n", - "Engine-Specific Arguments:\n", - " MaxNWts = 2086\n", - "\n", - "Computational engine: nnet \n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 333 - }, - "id": "Sc1TfPA4Ke3_", - "outputId": "82c70013-e431-4e7e-cef6-9fcf8aad4a6c" - } - }, - { - "cell_type": "markdown", - "source": [ - "Workflows 👌👌! Um **`workflow()`** pode ser ajustado de maneira muito semelhante a um modelo. Então, hora de treinar um modelo!\n" - ], - "metadata": { - "id": "TNQ8i85aKf9L" - } - }, - { - "cell_type": "code", - "execution_count": 8, - "source": [ - "# Train a multinomial regression model\n", - "mr_fit <- fit(object = mr_wf, data = cuisines_train)\n", - "\n", - "mr_fit" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "══ Workflow [trained] ══════════════════════════════════════════════════════════\n", - "\u001b[3mPreprocessor:\u001b[23m Recipe\n", - "\u001b[3mModel:\u001b[23m multinom_reg()\n", - "\n", - "── Preprocessor ────────────────────────────────────────────────────────────────\n", - "1 Recipe Step\n", - "\n", - "• step_smote()\n", - "\n", - "── Model ───────────────────────────────────────────────────────────────────────\n", - "Call:\n", - "nnet::multinom(formula = ..y ~ ., data = data, decay = ~1, MaxNWts = ~2086, \n", - " trace = FALSE)\n", - "\n", - "Coefficients:\n", - " (Intercept) almond angelica anise anise_seed apple\n", - "indian 0.19723325 0.2409661 0 -5.004955e-05 -0.1657635 -0.05769734\n", - "japanese 0.13961959 -0.6262400 0 -1.169155e-04 -0.4893596 -0.08585717\n", - "korean 0.22377347 -0.1833485 0 -5.560395e-05 -0.2489401 -0.15657804\n", - "thai -0.04336577 -0.6106258 0 4.903828e-04 -0.5782866 0.63451105\n", - " apple_brandy apricot armagnac artemisia artichoke asparagus\n", - "indian 0 0.37042636 0 -0.09122797 0 -0.27181970\n", - "japanese 0 0.28895643 0 -0.12651100 0 0.14054037\n", - "korean 0 -0.07981259 0 0.55756709 0 -0.66979948\n", - "thai 0 -0.33160904 0 -0.10725182 0 -0.02602152\n", - " avocado bacon baked_potato balm banana barley\n", - "indian -0.46624197 0.16008055 0 0 -0.2838796 0.2230625\n", - "japanese 0.90341344 0.02932727 0 0 -0.4142787 2.0953906\n", - "korean -0.06925382 -0.35804134 0 0 -0.2686963 -0.7233404\n", - "thai -0.21473955 -0.75594439 0 0 0.6784880 -0.4363320\n", - " bartlett_pear basil bay bean beech\n", - "indian 0 -0.7128756 0.1011587 -0.8777275 -0.0004380795\n", - "japanese 0 0.1288697 0.9425626 -0.2380748 0.3373437611\n", - "korean 0 -0.2445193 -0.4744318 -0.8957870 -0.0048784496\n", - "thai 0 1.5365848 0.1333256 0.2196970 -0.0113078024\n", - " beef beef_broth beef_liver beer beet\n", - "indian -0.7985278 0.2430186 -0.035598065 -0.002173738 0.01005813\n", - "japanese 0.2241875 -0.3653020 -0.139551027 0.128905553 0.04923911\n", - "korean 0.5366515 -0.6153237 0.213455197 -0.010828645 0.27325423\n", - "thai 0.1570012 -0.9364154 -0.008032213 -0.035063746 -0.28279823\n", - " bell_pepper bergamot berry bitter_orange black_bean\n", - "indian 0.49074330 0 0.58947607 0.191256164 -0.1945233\n", - "japanese 0.09074167 0 -0.25917977 -0.118915977 -0.3442400\n", - "korean -0.57876763 0 -0.07874180 -0.007729435 -0.5220672\n", - "thai 0.92554006 0 -0.07210196 -0.002983296 -0.4614426\n", - " black_currant black_mustard_seed_oil black_pepper black_raspberry\n", - "indian 0 0.38935801 -0.4453495 0\n", - "japanese 0 -0.05452887 -0.5440869 0\n", - "korean 0 -0.03929970 0.8025454 0\n", - "thai 0 -0.21498372 -0.9854806 0\n", - " black_sesame_seed black_tea blackberry blackberry_brandy\n", - "indian -0.2759246 0.3079977 0.191256164 0\n", - "japanese -0.6101687 -0.1671913 -0.118915977 0\n", - "korean 1.5197674 -0.3036261 -0.007729435 0\n", - "thai -0.1755656 -0.1487033 -0.002983296 0\n", - " blue_cheese blueberry bone_oil bourbon_whiskey brandy\n", - "indian 0 0.216164294 -0.2276744 0 0.22427587\n", - "japanese 0 -0.119186087 0.3913019 0 -0.15595599\n", - "korean 0 -0.007821986 0.2854487 0 -0.02562342\n", - "thai 0 -0.004947048 -0.0253658 0 -0.05715244\n", - "\n", - "...\n", - "and 308 more lines." - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 1000 - }, - "id": "GMbdfVmTKkJI", - "outputId": "adf9ebdf-d69d-4a64-e9fd-e06e5322292e" - } - }, - { - "cell_type": "markdown", - "source": [ - "Os resultados mostram os coeficientes que o modelo aprendeu durante o treinamento.\n", - "\n", - "### Avaliar o Modelo Treinado\n", - "\n", - "É hora de ver como o modelo se saiu 📏 avaliando-o em um conjunto de teste! Vamos começar fazendo previsões no conjunto de teste.\n" - ], - "metadata": { - "id": "tt2BfOxrKmcJ" - } - }, - { - "cell_type": "code", - "execution_count": 9, - "source": [ - "# Make predictions on the test set\n", - "results <- cuisines_test %>% select(cuisine) %>% \n", - " bind_cols(mr_fit %>% predict(new_data = cuisines_test))\n", - "\n", - "# Print out results\n", - "results %>% \n", - " slice_head(n = 5)" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine .pred_class\n", - "1 indian thai \n", - "2 indian indian \n", - "3 indian indian \n", - "4 indian indian \n", - "5 indian indian " - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 2\n", - "\n", - "| cuisine <fct> | .pred_class <fct> |\n", - "|---|---|\n", - "| indian | thai |\n", - "| indian | indian |\n", - "| indian | indian |\n", - "| indian | indian |\n", - "| indian | indian |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 2\n", - "\\begin{tabular}{ll}\n", - " cuisine & .pred\\_class\\\\\n", - " & \\\\\n", - "\\hline\n", - "\t indian & thai \\\\\n", - "\t indian & indian\\\\\n", - "\t indian & indian\\\\\n", - "\t indian & indian\\\\\n", - "\t indian & indian\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 2
cuisine.pred_class
<fct><fct>
indianthai
indianindian
indianindian
indianindian
indianindian
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 248 - }, - "id": "CqtckvtsKqax", - "outputId": "e57fe557-6a68-4217-fe82-173328c5436d" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho! No Tidymodels, avaliar o desempenho do modelo pode ser feito usando [yardstick](https://yardstick.tidymodels.org/) - um pacote usado para medir a eficácia dos modelos utilizando métricas de desempenho. Como fizemos na nossa aula de regressão logística, vamos começar calculando uma matriz de confusão.\n" - ], - "metadata": { - "id": "8w5N6XsBKss7" - } - }, - { - "cell_type": "code", - "execution_count": 10, - "source": [ - "# Confusion matrix for categorical data\n", - "conf_mat(data = results, truth = cuisine, estimate = .pred_class)\n" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " Truth\n", - "Prediction chinese indian japanese korean thai\n", - " chinese 83 1 8 15 10\n", - " indian 4 163 1 2 6\n", - " japanese 21 5 73 25 1\n", - " korean 15 0 11 191 0\n", - " thai 10 11 3 7 70" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 133 - }, - "id": "YvODvsLkK0iG", - "outputId": "bb69da84-1266-47ad-b174-d43b88ca2988" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ao lidar com várias classes, geralmente é mais intuitivo visualizar isso como um mapa de calor, assim:\n" - ], - "metadata": { - "id": "c0HfPL16Lr6U" - } - }, - { - "cell_type": "code", - "execution_count": 11, - "source": [ - "update_geom_defaults(geom = \"tile\", new = list(color = \"black\", alpha = 0.7))\n", - "# Visualize confusion matrix\n", - "results %>% \n", - " conf_mat(cuisine, .pred_class) %>% \n", - " autoplot(type = \"heatmap\")" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "plot without title" - ], - "image/png": "" - }, - "metadata": { - "image/png": { - "width": 420, - "height": 420 - } - } - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 436 - }, - "id": "HsAtwukyLsvt", - "outputId": "3032a224-a2c8-4270-b4f2-7bb620317400" - } - }, - { - "cell_type": "markdown", - "source": [ - "Os quadrados mais escuros no gráfico da matriz de confusão indicam um número elevado de casos, e você deve conseguir observar uma linha diagonal de quadrados mais escuros, indicando os casos em que o rótulo previsto e o rótulo real são os mesmos.\n", - "\n", - "Agora, vamos calcular as estatísticas resumidas para a matriz de confusão.\n" - ], - "metadata": { - "id": "oOJC87dkLwPr" - } - }, - { - "cell_type": "code", - "execution_count": 12, - "source": [ - "# Summary stats for confusion matrix\n", - "conf_mat(data = results, truth = cuisine, estimate = .pred_class) %>% \n", - "summary()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " .metric .estimator .estimate\n", - "1 accuracy multiclass 0.7880435\n", - "2 kap multiclass 0.7276583\n", - "3 sens macro 0.7780927\n", - "4 spec macro 0.9477598\n", - "5 ppv macro 0.7585583\n", - "6 npv macro 0.9460080\n", - "7 mcc multiclass 0.7292724\n", - "8 j_index macro 0.7258524\n", - "9 bal_accuracy macro 0.8629262\n", - "10 detection_prevalence macro 0.2000000\n", - "11 precision macro 0.7585583\n", - "12 recall macro 0.7780927\n", - "13 f_meas macro 0.7641862" - ], - "text/markdown": [ - "\n", - "A tibble: 13 × 3\n", - "\n", - "| .metric <chr> | .estimator <chr> | .estimate <dbl> |\n", - "|---|---|---|\n", - "| accuracy | multiclass | 0.7880435 |\n", - "| kap | multiclass | 0.7276583 |\n", - "| sens | macro | 0.7780927 |\n", - "| spec | macro | 0.9477598 |\n", - "| ppv | macro | 0.7585583 |\n", - "| npv | macro | 0.9460080 |\n", - "| mcc | multiclass | 0.7292724 |\n", - "| j_index | macro | 0.7258524 |\n", - "| bal_accuracy | macro | 0.8629262 |\n", - "| detection_prevalence | macro | 0.2000000 |\n", - "| precision | macro | 0.7585583 |\n", - "| recall | macro | 0.7780927 |\n", - "| f_meas | macro | 0.7641862 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 13 × 3\n", - "\\begin{tabular}{lll}\n", - " .metric & .estimator & .estimate\\\\\n", - " & & \\\\\n", - "\\hline\n", - "\t accuracy & multiclass & 0.7880435\\\\\n", - "\t kap & multiclass & 0.7276583\\\\\n", - "\t sens & macro & 0.7780927\\\\\n", - "\t spec & macro & 0.9477598\\\\\n", - "\t ppv & macro & 0.7585583\\\\\n", - "\t npv & macro & 0.9460080\\\\\n", - "\t mcc & multiclass & 0.7292724\\\\\n", - "\t j\\_index & macro & 0.7258524\\\\\n", - "\t bal\\_accuracy & macro & 0.8629262\\\\\n", - "\t detection\\_prevalence & macro & 0.2000000\\\\\n", - "\t precision & macro & 0.7585583\\\\\n", - "\t recall & macro & 0.7780927\\\\\n", - "\t f\\_meas & macro & 0.7641862\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 13 × 3
.metric.estimator.estimate
<chr><chr><dbl>
accuracy multiclass0.7880435
kap multiclass0.7276583
sens macro 0.7780927
spec macro 0.9477598
ppv macro 0.7585583
npv macro 0.9460080
mcc multiclass0.7292724
j_index macro 0.7258524
bal_accuracy macro 0.8629262
detection_prevalencemacro 0.2000000
precision macro 0.7585583
recall macro 0.7780927
f_meas macro 0.7641862
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 494 - }, - "id": "OYqetUyzL5Wz", - "outputId": "6a84d65e-113d-4281-dfc1-16e8b70f37e6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Se nos concentrarmos em algumas métricas como precisão, sensibilidade, ppv, não estamos indo mal para começar 🥳!\n", - "\n", - "## 4. Explorando Mais a Fundo\n", - "\n", - "Vamos fazer uma pergunta sutil: Quais critérios são usados para definir um tipo de culinária como o resultado previsto?\n", - "\n", - "Bem, algoritmos de aprendizado de máquina estatísticos, como regressão logística, são baseados em `probabilidade`; então, o que realmente é previsto por um classificador é uma distribuição de probabilidade sobre um conjunto de resultados possíveis. A classe com a maior probabilidade é então escolhida como o resultado mais provável para as observações fornecidas.\n", - "\n", - "Vamos ver isso em ação fazendo tanto previsões de classe rígidas quanto probabilidades.\n" - ], - "metadata": { - "id": "43t7vz8vMJtW" - } - }, - { - "cell_type": "code", - "execution_count": 13, - "source": [ - "# Make hard class prediction and probabilities\n", - "results_prob <- cuisines_test %>%\n", - " select(cuisine) %>% \n", - " bind_cols(mr_fit %>% predict(new_data = cuisines_test)) %>% \n", - " bind_cols(mr_fit %>% predict(new_data = cuisines_test, type = \"prob\"))\n", - "\n", - "# Print out results\n", - "results_prob %>% \n", - " slice_head(n = 5)" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine .pred_class .pred_chinese .pred_indian .pred_japanese .pred_korean\n", - "1 indian thai 1.551259e-03 0.4587877 5.988039e-04 2.428503e-04\n", - "2 indian indian 2.637133e-05 0.9999488 6.648651e-07 2.259993e-05\n", - "3 indian indian 1.049433e-03 0.9909982 1.060937e-03 1.644947e-05\n", - "4 indian indian 6.237482e-02 0.4763035 9.136702e-02 3.660913e-01\n", - "5 indian indian 1.431745e-02 0.9418551 2.945239e-02 8.721782e-03\n", - " .pred_thai \n", - "1 5.388194e-01\n", - "2 1.577948e-06\n", - "3 6.874989e-03\n", - "4 3.863391e-03\n", - "5 5.653283e-03" - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 7\n", - "\n", - "| cuisine <fct> | .pred_class <fct> | .pred_chinese <dbl> | .pred_indian <dbl> | .pred_japanese <dbl> | .pred_korean <dbl> | .pred_thai <dbl> |\n", - "|---|---|---|---|---|---|---|\n", - "| indian | thai | 1.551259e-03 | 0.4587877 | 5.988039e-04 | 2.428503e-04 | 5.388194e-01 |\n", - "| indian | indian | 2.637133e-05 | 0.9999488 | 6.648651e-07 | 2.259993e-05 | 1.577948e-06 |\n", - "| indian | indian | 1.049433e-03 | 0.9909982 | 1.060937e-03 | 1.644947e-05 | 6.874989e-03 |\n", - "| indian | indian | 6.237482e-02 | 0.4763035 | 9.136702e-02 | 3.660913e-01 | 3.863391e-03 |\n", - "| indian | indian | 1.431745e-02 | 0.9418551 | 2.945239e-02 | 8.721782e-03 | 5.653283e-03 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 7\n", - "\\begin{tabular}{lllllll}\n", - " cuisine & .pred\\_class & .pred\\_chinese & .pred\\_indian & .pred\\_japanese & .pred\\_korean & .pred\\_thai\\\\\n", - " & & & & & & \\\\\n", - "\\hline\n", - "\t indian & thai & 1.551259e-03 & 0.4587877 & 5.988039e-04 & 2.428503e-04 & 5.388194e-01\\\\\n", - "\t indian & indian & 2.637133e-05 & 0.9999488 & 6.648651e-07 & 2.259993e-05 & 1.577948e-06\\\\\n", - "\t indian & indian & 1.049433e-03 & 0.9909982 & 1.060937e-03 & 1.644947e-05 & 6.874989e-03\\\\\n", - "\t indian & indian & 6.237482e-02 & 0.4763035 & 9.136702e-02 & 3.660913e-01 & 3.863391e-03\\\\\n", - "\t indian & indian & 1.431745e-02 & 0.9418551 & 2.945239e-02 & 8.721782e-03 & 5.653283e-03\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 7
cuisine.pred_class.pred_chinese.pred_indian.pred_japanese.pred_korean.pred_thai
<fct><fct><dbl><dbl><dbl><dbl><dbl>
indianthai 1.551259e-030.45878775.988039e-042.428503e-045.388194e-01
indianindian2.637133e-050.99994886.648651e-072.259993e-051.577948e-06
indianindian1.049433e-030.99099821.060937e-031.644947e-056.874989e-03
indianindian6.237482e-020.47630359.136702e-023.660913e-013.863391e-03
indianindian1.431745e-020.94185512.945239e-028.721782e-035.653283e-03
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 248 - }, - "id": "xdKNs-ZPMTJL", - "outputId": "68f6ac5a-725a-4eff-9ea6-481fef00e008" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito melhor!\n", - "\n", - "✅ Você pode explicar por que o modelo tem tanta certeza de que a primeira observação é tailandesa?\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Nesta lição, você usou seus dados limpos para construir um modelo de aprendizado de máquina capaz de prever uma culinária nacional com base em uma série de ingredientes. Reserve um tempo para explorar as [muitas opções](https://www.tidymodels.org/find/parsnip/#models) que o Tidymodels oferece para classificar dados e [outras maneiras](https://parsnip.tidymodels.org/articles/articles/Examples.html#multinom_reg-models) de ajustar uma regressão multinomial.\n", - "\n", - "#### AGRADECIMENTOS A:\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "[Cassie Breviu](https://www.twitter.com/cassieview) e [Jen Looper](https://www.twitter.com/jenlooper) por criarem a versão original deste módulo em Python ♥️\n", - "\n", - "
\n", - "Eu até faria algumas piadas, mas não entendo muito de trocadilhos sobre comida 😅.\n", - "\n", - "
\n", - "\n", - "Feliz aprendizado,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Gold Microsoft Learn Student Ambassador.\n" - ], - "metadata": { - "id": "2tWVHMeLMYdM" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/2-Classifiers-1/solution/notebook.ipynb b/translations/br/4-Classification/2-Classifiers-1/solution/notebook.ipynb deleted file mode 100644 index aea8ed106..000000000 --- a/translations/br/4-Classification/2-Classifiers-1/solution/notebook.ipynb +++ /dev/null @@ -1,281 +0,0 @@ -{ - "cells": [ - { - "source": [ - "# Construir Modelos de Classificação\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 1 - } - ], - "source": [ - "import pandas as pd\n", - "cuisines_df = pd.read_csv(\"../../data/cleaned_cuisines.csv\")\n", - "cuisines_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.linear_model import LogisticRegression\n", - "from sklearn.model_selection import train_test_split, cross_val_score\n", - "from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve\n", - "from sklearn.svm import SVC\n", - "import numpy as np" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian\n", - "Name: cuisine, dtype: object" - ] - }, - "metadata": {}, - "execution_count": 3 - } - ], - "source": [ - "cuisines_label_df = cuisines_df['cuisine']\n", - "cuisines_label_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 4 - } - ], - "source": [ - "cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1)\n", - "cuisines_feature_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Accuracy is 0.8181818181818182\n" - ] - } - ], - "source": [ - "lr = LogisticRegression(multi_class='ovr',solver='liblinear')\n", - "model = lr.fit(X_train, np.ravel(y_train))\n", - "\n", - "accuracy = model.score(X_test, y_test)\n", - "print (\"Accuracy is {}\".format(accuracy))" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "ingredients: Index(['artemisia', 'black_pepper', 'mushroom', 'shiitake', 'soy_sauce',\n 'vegetable_oil'],\n dtype='object')\ncuisine: korean\n" - ] - } - ], - "source": [ - "# test an item\n", - "print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}')\n", - "print(f'cuisine: {y_test.iloc[50]}')" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " 0\n", - "korean 0.392231\n", - "chinese 0.372872\n", - "japanese 0.218825\n", - "thai 0.013427\n", - "indian 0.002645" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
0
korean0.392231
chinese0.372872
japanese0.218825
thai0.013427
indian0.002645
\n
" - }, - "metadata": {}, - "execution_count": 8 - } - ], - "source": [ - "#rehsape to 2d array and transpose\n", - "test= X_test.iloc[50].values.reshape(-1, 1).T\n", - "# predict with score\n", - "proba = model.predict_proba(test)\n", - "classes = model.classes_\n", - "# create df with classes and scores\n", - "resultdf = pd.DataFrame(data=proba, columns=classes)\n", - "\n", - "# create df to show results\n", - "topPrediction = resultdf.T.sort_values(by=[0], ascending = [False])\n", - "topPrediction.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " precision recall f1-score support\n\n chinese 0.75 0.73 0.74 223\n indian 0.93 0.88 0.90 255\n japanese 0.78 0.78 0.78 253\n korean 0.87 0.86 0.86 236\n thai 0.76 0.84 0.80 232\n\n accuracy 0.82 1199\n macro avg 0.82 0.82 0.82 1199\nweighted avg 0.82 0.82 0.82 1199\n\n" - ] - } - ], - "source": [ - "y_pred = model.predict(X_test)\r\n", - "print(classification_report(y_test,y_pred))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "9408506dd864f2b6e334c62f80c0cfcc", - "translation_date": "2025-08-29T23:41:17+00:00", - "source_file": "4-Classification/2-Classifiers-1/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/br/4-Classification/3-Classifiers-2/README.md b/translations/br/4-Classification/3-Classifiers-2/README.md deleted file mode 100644 index eb97d82b2..000000000 --- a/translations/br/4-Classification/3-Classifiers-2/README.md +++ /dev/null @@ -1,249 +0,0 @@ - -# Classificadores de culinária 2 - -Nesta segunda lição de classificação, você explorará mais maneiras de classificar dados numéricos. Você também aprenderá sobre as implicações de escolher um classificador em vez de outro. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Pré-requisito - -Assumimos que você completou as lições anteriores e possui um conjunto de dados limpo na sua pasta `data`, chamado _cleaned_cuisines.csv_, localizado na raiz desta pasta de 4 lições. - -### Preparação - -Carregamos seu arquivo _notebook.ipynb_ com o conjunto de dados limpo e o dividimos em dataframes X e y, prontos para o processo de construção do modelo. - -## Um mapa de classificação - -Anteriormente, você aprendeu sobre as várias opções disponíveis para classificar dados usando o guia de referência da Microsoft. O Scikit-learn oferece um guia semelhante, mas mais detalhado, que pode ajudar ainda mais a restringir seus estimadores (outro termo para classificadores): - -![Mapa de ML do Scikit-learn](../../../../4-Classification/3-Classifiers-2/images/map.png) -> Dica: [visite este mapa online](https://scikit-learn.org/stable/tutorial/machine_learning_map/) e clique nos caminhos para ler a documentação. - -### O plano - -Este mapa é muito útil quando você tem uma compreensão clara dos seus dados, pois pode 'percorrer' seus caminhos para tomar uma decisão: - -- Temos >50 amostras -- Queremos prever uma categoria -- Temos dados rotulados -- Temos menos de 100K amostras -- ✨ Podemos escolher um Linear SVC -- Se isso não funcionar, já que temos dados numéricos - - Podemos tentar um ✨ KNeighbors Classifier - - Se isso não funcionar, tentar ✨ SVC e ✨ Ensemble Classifiers - -Este é um caminho muito útil a seguir. - -## Exercício - dividir os dados - -Seguindo este caminho, devemos começar importando algumas bibliotecas para usar. - -1. Importe as bibliotecas necessárias: - - ```python - from sklearn.neighbors import KNeighborsClassifier - from sklearn.linear_model import LogisticRegression - from sklearn.svm import SVC - from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier - from sklearn.model_selection import train_test_split, cross_val_score - from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve - import numpy as np - ``` - -1. Divida seus dados de treinamento e teste: - - ```python - X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) - ``` - -## Classificador Linear SVC - -O agrupamento por Vetores de Suporte (SVC) é um membro da família de técnicas de ML chamada Máquinas de Vetores de Suporte (SVM). Neste método, você pode escolher um 'kernel' para decidir como agrupar os rótulos. O parâmetro 'C' refere-se à 'regularização', que regula a influência dos parâmetros. O kernel pode ser um dos [vários](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC); aqui o configuramos como 'linear' para garantir que utilizamos o Linear SVC. A probabilidade, por padrão, é 'false'; aqui a configuramos como 'true' para obter estimativas de probabilidade. Configuramos o estado aleatório como '0' para embaralhar os dados e obter probabilidades. - -### Exercício - aplicar um Linear SVC - -Comece criando um array de classificadores. Você adicionará progressivamente a este array enquanto testamos. - -1. Comece com um Linear SVC: - - ```python - C = 10 - # Create different classifiers. - classifiers = { - 'Linear SVC': SVC(kernel='linear', C=C, probability=True,random_state=0) - } - ``` - -2. Treine seu modelo usando o Linear SVC e imprima um relatório: - - ```python - n_classifiers = len(classifiers) - - for index, (name, classifier) in enumerate(classifiers.items()): - classifier.fit(X_train, np.ravel(y_train)) - - y_pred = classifier.predict(X_test) - accuracy = accuracy_score(y_test, y_pred) - print("Accuracy (train) for %s: %0.1f%% " % (name, accuracy * 100)) - print(classification_report(y_test,y_pred)) - ``` - - O resultado é muito bom: - - ```output - Accuracy (train) for Linear SVC: 78.6% - precision recall f1-score support - - chinese 0.71 0.67 0.69 242 - indian 0.88 0.86 0.87 234 - japanese 0.79 0.74 0.76 254 - korean 0.85 0.81 0.83 242 - thai 0.71 0.86 0.78 227 - - accuracy 0.79 1199 - macro avg 0.79 0.79 0.79 1199 - weighted avg 0.79 0.79 0.79 1199 - ``` - -## Classificador K-Neighbors - -K-Neighbors faz parte da família de métodos de ML chamada "neighbors", que pode ser usada tanto para aprendizado supervisionado quanto não supervisionado. Neste método, um número pré-definido de pontos é criado e os dados são agrupados ao redor desses pontos, de forma que rótulos generalizados possam ser previstos para os dados. - -### Exercício - aplicar o classificador K-Neighbors - -O classificador anterior foi bom e funcionou bem com os dados, mas talvez possamos obter uma melhor precisão. Tente um classificador K-Neighbors. - -1. Adicione uma linha ao seu array de classificadores (adicione uma vírgula após o item Linear SVC): - - ```python - 'KNN classifier': KNeighborsClassifier(C), - ``` - - O resultado é um pouco pior: - - ```output - Accuracy (train) for KNN classifier: 73.8% - precision recall f1-score support - - chinese 0.64 0.67 0.66 242 - indian 0.86 0.78 0.82 234 - japanese 0.66 0.83 0.74 254 - korean 0.94 0.58 0.72 242 - thai 0.71 0.82 0.76 227 - - accuracy 0.74 1199 - macro avg 0.76 0.74 0.74 1199 - weighted avg 0.76 0.74 0.74 1199 - ``` - - ✅ Saiba mais sobre [K-Neighbors](https://scikit-learn.org/stable/modules/neighbors.html#neighbors) - -## Classificador de Vetores de Suporte - -Classificadores de Vetores de Suporte fazem parte da família de [Máquinas de Vetores de Suporte](https://wikipedia.org/wiki/Support-vector_machine), que são usadas para tarefas de classificação e regressão. SVMs "mapeiam exemplos de treinamento para pontos no espaço" para maximizar a distância entre duas categorias. Dados subsequentes são mapeados neste espaço para que sua categoria possa ser prevista. - -### Exercício - aplicar um Classificador de Vetores de Suporte - -Vamos tentar obter uma precisão um pouco melhor com um Classificador de Vetores de Suporte. - -1. Adicione uma vírgula após o item K-Neighbors e, em seguida, adicione esta linha: - - ```python - 'SVC': SVC(), - ``` - - O resultado é muito bom! - - ```output - Accuracy (train) for SVC: 83.2% - precision recall f1-score support - - chinese 0.79 0.74 0.76 242 - indian 0.88 0.90 0.89 234 - japanese 0.87 0.81 0.84 254 - korean 0.91 0.82 0.86 242 - thai 0.74 0.90 0.81 227 - - accuracy 0.83 1199 - macro avg 0.84 0.83 0.83 1199 - weighted avg 0.84 0.83 0.83 1199 - ``` - - ✅ Saiba mais sobre [Vetores de Suporte](https://scikit-learn.org/stable/modules/svm.html#svm) - -## Classificadores Ensemble - -Vamos seguir o caminho até o final, mesmo que o teste anterior tenha sido muito bom. Vamos tentar alguns 'Classificadores Ensemble', especificamente Random Forest e AdaBoost: - -```python - 'RFST': RandomForestClassifier(n_estimators=100), - 'ADA': AdaBoostClassifier(n_estimators=100) -``` - -O resultado é muito bom, especialmente para Random Forest: - -```output -Accuracy (train) for RFST: 84.5% - precision recall f1-score support - - chinese 0.80 0.77 0.78 242 - indian 0.89 0.92 0.90 234 - japanese 0.86 0.84 0.85 254 - korean 0.88 0.83 0.85 242 - thai 0.80 0.87 0.83 227 - - accuracy 0.84 1199 - macro avg 0.85 0.85 0.84 1199 -weighted avg 0.85 0.84 0.84 1199 - -Accuracy (train) for ADA: 72.4% - precision recall f1-score support - - chinese 0.64 0.49 0.56 242 - indian 0.91 0.83 0.87 234 - japanese 0.68 0.69 0.69 254 - korean 0.73 0.79 0.76 242 - thai 0.67 0.83 0.74 227 - - accuracy 0.72 1199 - macro avg 0.73 0.73 0.72 1199 -weighted avg 0.73 0.72 0.72 1199 -``` - -✅ Saiba mais sobre [Classificadores Ensemble](https://scikit-learn.org/stable/modules/ensemble.html) - -Este método de aprendizado de máquina "combina as previsões de vários estimadores base" para melhorar a qualidade do modelo. No nosso exemplo, usamos Random Trees e AdaBoost. - -- [Random Forest](https://scikit-learn.org/stable/modules/ensemble.html#forest), um método de média, constrói uma 'floresta' de 'árvores de decisão' com elementos aleatórios para evitar overfitting. O parâmetro n_estimators é configurado para o número de árvores. - -- [AdaBoost](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html) ajusta um classificador a um conjunto de dados e, em seguida, ajusta cópias desse classificador ao mesmo conjunto de dados. Ele foca nos pesos dos itens classificados incorretamente e ajusta o ajuste para o próximo classificador corrigir. - ---- - -## 🚀Desafio - -Cada uma dessas técnicas possui um grande número de parâmetros que você pode ajustar. Pesquise os parâmetros padrão de cada uma e pense sobre o que ajustar esses parâmetros significaria para a qualidade do modelo. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Há muitos termos técnicos nestas lições, então reserve um momento para revisar [esta lista](https://docs.microsoft.com/dotnet/machine-learning/resources/glossary?WT.mc_id=academic-77952-leestott) de terminologia útil! - -## Tarefa - -[Exploração de parâmetros](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/3-Classifiers-2/assignment.md b/translations/br/4-Classification/3-Classifiers-2/assignment.md deleted file mode 100644 index 64eefc166..000000000 --- a/translations/br/4-Classification/3-Classifiers-2/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Brincando com Parâmetros - -## Instruções - -Existem muitos parâmetros que são definidos por padrão ao trabalhar com esses classificadores. O Intellisense no VS Code pode ajudar você a explorá-los. Adote uma das Técnicas de Classificação de ML desta lição e reentreine os modelos ajustando vários valores de parâmetros. Construa um notebook explicando por que algumas mudanças ajudam na qualidade do modelo, enquanto outras a prejudicam. Seja detalhado em sua resposta. - -## Rubrica - -| Critérios | Exemplar | Adequado | Precisa de Melhorias | -| --------- | --------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------- | ----------------------------- | -| | Um notebook é apresentado com um classificador totalmente construído, seus parâmetros ajustados e mudanças explicadas em caixas de texto | Um notebook é parcialmente apresentado ou mal explicado | Um notebook contém erros ou falhas | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/3-Classifiers-2/notebook.ipynb b/translations/br/4-Classification/3-Classifiers-2/notebook.ipynb deleted file mode 100644 index c828422dd..000000000 --- a/translations/br/4-Classification/3-Classifiers-2/notebook.ipynb +++ /dev/null @@ -1,163 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 9 - } - ], - "source": [ - "import pandas as pd\n", - "cuisines_df = pd.read_csv(\"../data/cleaned_cuisines.csv\")\n", - "cuisines_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian\n", - "Name: cuisine, dtype: object" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ], - "source": [ - "cuisines_label_df = cuisines_df['cuisine']\n", - "cuisines_label_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 11 - } - ], - "source": [ - "cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1)\n", - "cuisines_feature_df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "15a83277036572e0773229b5f21c1e12", - "translation_date": "2025-08-29T23:47:26+00:00", - "source_file": "4-Classification/3-Classifiers-2/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/br/4-Classification/3-Classifiers-2/solution/Julia/README.md b/translations/br/4-Classification/3-Classifiers-2/solution/Julia/README.md deleted file mode 100644 index c303f17bc..000000000 --- a/translations/br/4-Classification/3-Classifiers-2/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb b/translations/br/4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb deleted file mode 100644 index 96c315d98..000000000 --- a/translations/br/4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb +++ /dev/null @@ -1,650 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 0, - "metadata": { - "colab": { - "name": "lesson_12-R.ipynb", - "provenance": [], - "collapsed_sections": [] - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "fab50046ca413a38939d579f8432274f", - "translation_date": "2025-08-29T23:51:48+00:00", - "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "jsFutf_ygqSx" - }, - "source": [ - "# Construir um modelo de classificação: Deliciosas culinárias asiáticas e indianas\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "HD54bEefgtNO" - }, - "source": [ - "## Classificadores de culinária 2\n", - "\n", - "Nesta segunda lição de classificação, exploraremos `mais maneiras` de classificar dados categóricos. Também aprenderemos sobre as implicações de escolher um classificador em vez de outro.\n", - "\n", - "### [**Quiz pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", - "\n", - "### **Pré-requisitos**\n", - "\n", - "Assumimos que você completou as lições anteriores, já que continuaremos com alguns conceitos que aprendemos antes.\n", - "\n", - "Para esta lição, precisaremos dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é um [framework de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizado de máquina.\n", - "\n", - "- `themis`: O [pacote themis](https://themis.tidymodels.org/) fornece etapas extras de receitas para lidar com dados desbalanceados.\n", - "\n", - "Você pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala caso estejam ausentes.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "vZ57IuUxgyQt" - }, - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "z22M-pj4g07x" - }, - "source": [ - "## **1. Um mapa de classificação**\n", - "\n", - "Na nossa [lição anterior](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1), tentamos responder à pergunta: como escolher entre vários modelos? Em grande parte, isso depende das características dos dados e do tipo de problema que queremos resolver (por exemplo, classificação ou regressão?).\n", - "\n", - "Anteriormente, aprendemos sobre as várias opções disponíveis para classificar dados usando o guia da Microsoft. O framework de Machine Learning do Python, Scikit-learn, oferece um guia semelhante, mas mais detalhado, que pode ajudar ainda mais a restringir seus estimadores (outro termo para classificadores):\n", - "\n", - "

\n", - " \n", - "

\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "u1i3xRIVg7vG" - }, - "source": [ - "> Dica: [visite este mapa online](https://scikit-learn.org/stable/tutorial/machine_learning_map/) e clique ao longo do caminho para ler a documentação.\n", - ">\n", - "> O [site de referência do Tidymodels](https://www.tidymodels.org/find/parsnip/#models) também oferece uma excelente documentação sobre diferentes tipos de modelos.\n", - "\n", - "### **O plano** 🗺️\n", - "\n", - "Este mapa é muito útil quando você tem uma compreensão clara dos seus dados, pois pode 'caminhar' pelos seus caminhos até chegar a uma decisão:\n", - "\n", - "- Temos \\>50 amostras\n", - "\n", - "- Queremos prever uma categoria\n", - "\n", - "- Temos dados rotulados\n", - "\n", - "- Temos menos de 100K amostras\n", - "\n", - "- ✨ Podemos escolher um Linear SVC\n", - "\n", - "- Se isso não funcionar, já que temos dados numéricos\n", - "\n", - " - Podemos tentar um ✨ KNeighbors Classifier\n", - "\n", - " - Se isso não funcionar, tente ✨ SVC e ✨ Ensemble Classifiers\n", - "\n", - "Este é um caminho muito útil para seguir. Agora, vamos direto ao ponto usando o framework de modelagem [tidymodels](https://www.tidymodels.org/): uma coleção consistente e flexível de pacotes R desenvolvidos para incentivar boas práticas estatísticas 😊.\n", - "\n", - "## 2. Divida os dados e lide com o conjunto de dados desequilibrado.\n", - "\n", - "Nas nossas lições anteriores, aprendemos que havia um conjunto de ingredientes comuns entre nossas culinárias. Além disso, havia uma distribuição bastante desigual no número de culinárias.\n", - "\n", - "Vamos lidar com isso da seguinte forma:\n", - "\n", - "- Eliminando os ingredientes mais comuns que criam confusão entre culinárias distintas, usando `dplyr::select()`.\n", - "\n", - "- Usando uma `recipe` que pré-processa os dados para prepará-los para modelagem, aplicando um algoritmo de `over-sampling`.\n", - "\n", - "Já vimos isso na lição anterior, então deve ser tranquilo 🥳!\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "6tj_rN00hClA" - }, - "source": [ - "# Load the core Tidyverse and Tidymodels packages\n", - "library(tidyverse)\n", - "library(tidymodels)\n", - "\n", - "# Load the original cuisines data\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/4-Classification/data/cuisines.csv\")\n", - "\n", - "# Drop id column, rice, garlic and ginger from our original data set\n", - "df_select <- df %>% \n", - " select(-c(1, rice, garlic, ginger)) %>%\n", - " # Encode cuisine column as categorical\n", - " mutate(cuisine = factor(cuisine))\n", - "\n", - "\n", - "# Create data split specification\n", - "set.seed(2056)\n", - "cuisines_split <- initial_split(data = df_select,\n", - " strata = cuisine,\n", - " prop = 0.7)\n", - "\n", - "# Extract the data in each split\n", - "cuisines_train <- training(cuisines_split)\n", - "cuisines_test <- testing(cuisines_split)\n", - "\n", - "# Display distribution of cuisines in the training set\n", - "cuisines_train %>% \n", - " count(cuisine) %>% \n", - " arrange(desc(n))" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "zFin5yw3hHb1" - }, - "source": [ - "### Lidando com dados desbalanceados\n", - "\n", - "Dados desbalanceados frequentemente têm efeitos negativos no desempenho do modelo. Muitos modelos funcionam melhor quando o número de observações é igual e, por isso, tendem a ter dificuldades com dados desbalanceados.\n", - "\n", - "Existem basicamente duas maneiras de lidar com conjuntos de dados desbalanceados:\n", - "\n", - "- adicionar observações à classe minoritária: `Over-sampling`, por exemplo, usando um algoritmo SMOTE que gera novos exemplos sintéticos da classe minoritária utilizando os vizinhos mais próximos desses casos.\n", - "\n", - "- remover observações da classe majoritária: `Under-sampling`\n", - "\n", - "Na nossa aula anterior, demonstramos como lidar com conjuntos de dados desbalanceados usando um `recipe`. Um recipe pode ser pensado como um plano que descreve quais etapas devem ser aplicadas a um conjunto de dados para prepará-lo para análise. No nosso caso, queremos ter uma distribuição igual no número de nossas culinárias para o nosso `training set`. Vamos direto ao ponto.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "cRzTnHolhLWd" - }, - "source": [ - "# Load themis package for dealing with imbalanced data\n", - "library(themis)\n", - "\n", - "# Create a recipe for preprocessing training data\n", - "cuisines_recipe <- recipe(cuisine ~ ., data = cuisines_train) %>%\n", - " step_smote(cuisine) \n", - "\n", - "# Print recipe\n", - "cuisines_recipe" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "KxOQ2ORhhO81" - }, - "source": [ - "Agora estamos prontos para treinar modelos 👩‍💻👨‍💻!\n", - "\n", - "## 3. Além dos modelos de regressão multinomial\n", - "\n", - "Na nossa aula anterior, exploramos os modelos de regressão multinomial. Agora, vamos conhecer alguns modelos mais flexíveis para classificação.\n", - "\n", - "### Máquinas de Vetores de Suporte\n", - "\n", - "No contexto de classificação, `Máquinas de Vetores de Suporte` é uma técnica de aprendizado de máquina que busca encontrar um *hiperplano* que \"melhor\" separa as classes. Vamos observar um exemplo simples:\n", - "\n", - "

\n", - " \n", - "

https://commons.wikimedia.org/w/index.php?curid=22877598
\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "C4Wsd0vZhXYu" - }, - "source": [ - "H1~ não separa as classes. H2~ separa, mas apenas com uma margem pequena. H3~ as separa com a margem máxima.\n", - "\n", - "#### Classificador Linear de Vetores de Suporte\n", - "\n", - "O agrupamento por Vetores de Suporte (SVC) é um membro da família de técnicas de aprendizado de máquina baseadas em Máquinas de Vetores de Suporte. No SVC, o hiperplano é escolhido para separar corretamente `a maioria` das observações de treinamento, mas `pode classificar erroneamente` algumas observações. Ao permitir que alguns pontos fiquem do lado errado, o SVM se torna mais robusto a outliers, o que resulta em uma melhor generalização para novos dados. O parâmetro que regula essa violação é chamado de `cost`, que tem um valor padrão de 1 (veja `help(\"svm_poly\")`).\n", - "\n", - "Vamos criar um SVC linear definindo `degree = 1` em um modelo SVM polinomial.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "vJpp6nuChlBz" - }, - "source": [ - "# Make a linear SVC specification\n", - "svc_linear_spec <- svm_poly(degree = 1) %>% \n", - " set_engine(\"kernlab\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle specification and recipe into a worklow\n", - "svc_linear_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(svc_linear_spec)\n", - "\n", - "# Print out workflow\n", - "svc_linear_wf" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "rDs8cWNkhoqu" - }, - "source": [ - "Agora que capturamos as etapas de pré-processamento e a especificação do modelo em um *workflow*, podemos prosseguir para treinar o SVC linear e avaliar os resultados ao mesmo tempo. Para as métricas de desempenho, vamos criar um conjunto de métricas que avaliará: `accuracy`, `sensitivity`, `Positive Predicted Value` e `F Measure`.\n", - "\n", - "> `augment()` adicionará coluna(s) de previsões aos dados fornecidos.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "81wiqcwuhrnq" - }, - "source": [ - "# Train a linear SVC model\n", - "svc_linear_fit <- svc_linear_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "# Create a metric set\n", - "eval_metrics <- metric_set(ppv, sens, accuracy, f_meas)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "svc_linear_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "0UFQvHf-huo3" - }, - "source": [ - "#### Máquina de Vetores de Suporte\n", - "\n", - "A máquina de vetores de suporte (SVM) é uma extensão do classificador de vetores de suporte para acomodar um limite não linear entre as classes. Essencialmente, as SVMs utilizam o *truque do kernel* para ampliar o espaço de características e se adaptar a relações não lineares entre as classes. Uma função kernel popular e extremamente flexível usada pelas SVMs é a *função de base radial.* Vamos ver como ela se comporta com nossos dados.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "-KX4S8mzhzmp" - }, - "source": [ - "set.seed(2056)\n", - "\n", - "# Make an RBF SVM specification\n", - "svm_rbf_spec <- svm_rbf() %>% \n", - " set_engine(\"kernlab\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle specification and recipe into a worklow\n", - "svm_rbf_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(svm_rbf_spec)\n", - "\n", - "\n", - "# Train an RBF model\n", - "svm_rbf_fit <- svm_rbf_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "svm_rbf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "QBFSa7WSh4HQ" - }, - "source": [ - "Muito melhor 🤩!\n", - "\n", - "> ✅ Por favor, veja:\n", - ">\n", - "> - [*Support Vector Machines*](https://bradleyboehmke.github.io/HOML/svm.html), Hands-on Machine Learning with R\n", - ">\n", - "> - [*Support Vector Machines*](https://www.statlearning.com/), An Introduction to Statistical Learning with Applications in R\n", - ">\n", - "> para leitura adicional.\n", - "\n", - "### Classificadores de Vizinhos Mais Próximos\n", - "\n", - "O algoritmo *K*-nearest neighbor (KNN) prevê cada observação com base em sua *semelhança* com outras observações.\n", - "\n", - "Vamos ajustar um ao nosso conjunto de dados.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "k4BxxBcdh9Ka" - }, - "source": [ - "# Make a KNN specification\n", - "knn_spec <- nearest_neighbor() %>% \n", - " set_engine(\"kknn\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle recipe and model specification into a workflow\n", - "knn_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(knn_spec)\n", - "\n", - "# Train a boosted tree model\n", - "knn_wf_fit <- knn_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "knn_wf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "HaegQseriAcj" - }, - "source": [ - "Parece que este modelo não está apresentando um bom desempenho. Provavelmente, alterar os argumentos do modelo (veja `help(\"nearest_neighbor\")`) pode melhorar o desempenho do modelo. Certifique-se de testar isso.\n", - "\n", - "> ✅ Por favor, veja:\n", - ">\n", - "> - [Hands-on Machine Learning with R](https://bradleyboehmke.github.io/HOML/)\n", - ">\n", - "> - [An Introduction to Statistical Learning with Applications in R](https://www.statlearning.com/)\n", - ">\n", - "> para aprender mais sobre classificadores *K*-Nearest Neighbors.\n", - "\n", - "### Classificadores de conjunto\n", - "\n", - "Os algoritmos de conjunto funcionam combinando múltiplos estimadores base para produzir um modelo ideal, seja por:\n", - "\n", - "`bagging`: aplicando uma *função de média* a uma coleção de modelos base\n", - "\n", - "`boosting`: construindo uma sequência de modelos que se baseiam uns nos outros para melhorar o desempenho preditivo.\n", - "\n", - "Vamos começar experimentando um modelo de Random Forest, que constrói uma grande coleção de árvores de decisão e, em seguida, aplica uma função de média para obter um modelo geral melhor.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "49DPoVs6iK1M" - }, - "source": [ - "# Make a random forest specification\n", - "rf_spec <- rand_forest() %>% \n", - " set_engine(\"ranger\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle recipe and model specification into a workflow\n", - "rf_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(rf_spec)\n", - "\n", - "# Train a random forest model\n", - "rf_wf_fit <- rf_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "rf_wf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "RGVYwC_aiUWc" - }, - "source": [ - "Bom trabalho 👏!\n", - "\n", - "Vamos também experimentar com um modelo de Árvore Reforçada.\n", - "\n", - "A Árvore Reforçada define um método de conjunto que cria uma série de árvores de decisão sequenciais, onde cada árvore depende dos resultados das árvores anteriores, na tentativa de reduzir o erro de forma incremental. Ela foca nos pesos dos itens classificados incorretamente e ajusta o ajuste para o próximo classificador corrigir.\n", - "\n", - "Existem diferentes maneiras de ajustar este modelo (veja `help(\"boost_tree\")`). Neste exemplo, ajustaremos Árvores Reforçadas usando o mecanismo `xgboost`.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Py1YWo-micWs" - }, - "source": [ - "# Make a boosted tree specification\n", - "boost_spec <- boost_tree(trees = 200) %>% \n", - " set_engine(\"xgboost\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle recipe and model specification into a workflow\n", - "boost_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(boost_spec)\n", - "\n", - "# Train a boosted tree model\n", - "boost_wf_fit <- boost_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "boost_wf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "zNQnbuejigZM" - }, - "source": [ - "> ✅ Por favor, veja:\n", - ">\n", - "> - [Machine Learning for Social Scientists](https://cimentadaj.github.io/ml_socsci/tree-based-methods.html#random-forests)\n", - ">\n", - "> - [Hands-on Machine Learning with R](https://bradleyboehmke.github.io/HOML/)\n", - ">\n", - "> - [An Introduction to Statistical Learning with Applications in R](https://www.statlearning.com/)\n", - ">\n", - "> - - Explora o modelo AdaBoost, que é uma boa alternativa ao xgboost.\n", - ">\n", - "> para aprender mais sobre classificadores Ensemble.\n", - "\n", - "## 4. Extra - comparando múltiplos modelos\n", - "\n", - "Nós ajustamos um bom número de modelos neste laboratório 🙌. Pode se tornar cansativo ou trabalhoso criar muitos fluxos de trabalho a partir de diferentes conjuntos de pré-processadores e/ou especificações de modelos e, em seguida, calcular as métricas de desempenho uma por uma.\n", - "\n", - "Vamos ver se conseguimos resolver isso criando uma função que ajusta uma lista de fluxos de trabalho no conjunto de treinamento e, em seguida, retorna as métricas de desempenho com base no conjunto de teste. Vamos usar `map()` e `map_dfr()` do pacote [purrr](https://purrr.tidyverse.org/) para aplicar funções a cada elemento de uma lista.\n", - "\n", - "> As funções [`map()`](https://purrr.tidyverse.org/reference/map.html) permitem substituir muitos loops `for` por um código que é mais conciso e mais fácil de ler. O melhor lugar para aprender sobre as funções [`map()`](https://purrr.tidyverse.org/reference/map.html) é o [capítulo de iteração](http://r4ds.had.co.nz/iteration.html) em R for Data Science.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Qzb7LyZnimd2" - }, - "source": [ - "set.seed(2056)\n", - "\n", - "# Create a metric set\n", - "eval_metrics <- metric_set(ppv, sens, accuracy, f_meas)\n", - "\n", - "# Define a function that returns performance metrics\n", - "compare_models <- function(workflow_list, train_set, test_set){\n", - " \n", - " suppressWarnings(\n", - " # Fit each model to the train_set\n", - " map(workflow_list, fit, data = train_set) %>% \n", - " # Make predictions on the test set\n", - " map_dfr(augment, new_data = test_set, .id = \"model\") %>%\n", - " # Select desired columns\n", - " select(model, cuisine, .pred_class) %>% \n", - " # Evaluate model performance\n", - " group_by(model) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class) %>% \n", - " ungroup()\n", - " )\n", - " \n", - "} # End of function" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Fwa712sNisDA" - }, - "source": [] - }, - { - "cell_type": "code", - "metadata": { - "id": "3i4VJOi2iu-a" - }, - "source": [ - "# Make a list of workflows\n", - "workflow_list <- list(\n", - " \"svc\" = svc_linear_wf,\n", - " \"svm\" = svm_rbf_wf,\n", - " \"knn\" = knn_wf,\n", - " \"random_forest\" = rf_wf,\n", - " \"xgboost\" = boost_wf)\n", - "\n", - "# Call the function\n", - "set.seed(2056)\n", - "perf_metrics <- compare_models(workflow_list = workflow_list, train_set = cuisines_train, test_set = cuisines_test)\n", - "\n", - "# Print out performance metrics\n", - "perf_metrics %>% \n", - " group_by(.metric) %>% \n", - " arrange(desc(.estimate)) %>% \n", - " slice_head(n=7)\n", - "\n", - "# Compare accuracy\n", - "perf_metrics %>% \n", - " filter(.metric == \"accuracy\") %>% \n", - " arrange(desc(.estimate))\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "KuWK_lEli4nW" - }, - "source": [ - "O pacote [**workflowset**](https://workflowsets.tidymodels.org/) permite que os usuários criem e ajustem facilmente um grande número de modelos, mas é principalmente projetado para funcionar com técnicas de reamostragem, como `cross-validation` (validação cruzada), uma abordagem que ainda vamos abordar.\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Cada uma dessas técnicas possui um grande número de parâmetros que você pode ajustar, como, por exemplo, `cost` em SVMs, `neighbors` em KNN, `mtry` (Preditores Selecionados Aleatoriamente) em Random Forest.\n", - "\n", - "Pesquise os parâmetros padrão de cada uma e reflita sobre o que ajustar esses parâmetros significaria para a qualidade do modelo.\n", - "\n", - "Para saber mais sobre um modelo específico e seus parâmetros, use: `help(\"model\")`, por exemplo, `help(\"rand_forest\")`.\n", - "\n", - "> Na prática, geralmente *estimamos* os *melhores valores* para esses parâmetros treinando muitos modelos em um `conjunto de dados simulado` e medindo o desempenho de todos esses modelos. Esse processo é chamado de **tuning** (ajuste fino).\n", - "\n", - "### [**Quiz pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/24/)\n", - "\n", - "### **Revisão e Autoestudo**\n", - "\n", - "Há muitos termos técnicos nessas lições, então reserve um momento para revisar [esta lista](https://docs.microsoft.com/dotnet/machine-learning/resources/glossary?WT.mc_id=academic-77952-leestott) de terminologia útil!\n", - "\n", - "#### AGRADECIMENTOS A:\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "[Cassie Breviu](https://www.twitter.com/cassieview) e [Jen Looper](https://www.twitter.com/jenlooper) por criarem a versão original deste módulo em Python ♥️\n", - "\n", - "Bons estudos,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Embaixador Estudante Gold da Microsoft Learn.\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/3-Classifiers-2/solution/notebook.ipynb b/translations/br/4-Classification/3-Classifiers-2/solution/notebook.ipynb deleted file mode 100644 index c62ee20a9..000000000 --- a/translations/br/4-Classification/3-Classifiers-2/solution/notebook.ipynb +++ /dev/null @@ -1,302 +0,0 @@ -{ - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 1 - } - ], - "source": [ - "import pandas as pd\n", - "cuisines_df = pd.read_csv(\"../../data/cleaned_cuisines.csv\")\n", - "cuisines_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian\n", - "Name: cuisine, dtype: object" - ] - }, - "metadata": {}, - "execution_count": 2 - } - ], - "source": [ - "cuisines_label_df = cuisines_df['cuisine']\n", - "cuisines_label_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 3 - } - ], - "source": [ - "cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1)\n", - "cuisines_feature_df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Experimente diferentes classificadores\n" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.neighbors import KNeighborsClassifier\n", - "from sklearn.linear_model import LogisticRegression\n", - "from sklearn.svm import SVC\n", - "from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier\n", - "from sklearn.model_selection import train_test_split, cross_val_score\n", - "from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve\n", - "import numpy as np" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "\n", - "C = 10\n", - "# Create different classifiers.\n", - "classifiers = {\n", - " 'Linear SVC': SVC(kernel='linear', C=C, probability=True,random_state=0),\n", - " 'KNN classifier': KNeighborsClassifier(C),\n", - " 'SVC': SVC(),\n", - " 'RFST': RandomForestClassifier(n_estimators=100),\n", - " 'ADA': AdaBoostClassifier(n_estimators=100)\n", - " \n", - "}\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Accuracy (train) for Linear SVC: 76.4% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.64 0.66 0.65 242\n", - " indian 0.91 0.86 0.89 236\n", - " japanese 0.72 0.73 0.73 245\n", - " korean 0.83 0.75 0.79 234\n", - " thai 0.75 0.82 0.78 242\n", - "\n", - " accuracy 0.76 1199\n", - " macro avg 0.77 0.76 0.77 1199\n", - "weighted avg 0.77 0.76 0.77 1199\n", - "\n", - "Accuracy (train) for KNN classifier: 70.7% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.65 0.63 0.64 242\n", - " indian 0.84 0.81 0.82 236\n", - " japanese 0.60 0.81 0.69 245\n", - " korean 0.89 0.53 0.67 234\n", - " thai 0.69 0.75 0.72 242\n", - "\n", - " accuracy 0.71 1199\n", - " macro avg 0.73 0.71 0.71 1199\n", - "weighted avg 0.73 0.71 0.71 1199\n", - "\n", - "Accuracy (train) for SVC: 80.1% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.71 0.69 0.70 242\n", - " indian 0.92 0.92 0.92 236\n", - " japanese 0.77 0.78 0.77 245\n", - " korean 0.87 0.77 0.82 234\n", - " thai 0.75 0.86 0.80 242\n", - "\n", - " accuracy 0.80 1199\n", - " macro avg 0.80 0.80 0.80 1199\n", - "weighted avg 0.80 0.80 0.80 1199\n", - "\n", - "Accuracy (train) for RFST: 82.8% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.80 0.75 0.77 242\n", - " indian 0.90 0.91 0.90 236\n", - " japanese 0.82 0.78 0.80 245\n", - " korean 0.85 0.82 0.83 234\n", - " thai 0.78 0.89 0.83 242\n", - "\n", - " accuracy 0.83 1199\n", - " macro avg 0.83 0.83 0.83 1199\n", - "weighted avg 0.83 0.83 0.83 1199\n", - "\n", - "Accuracy (train) for ADA: 71.1% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.60 0.57 0.58 242\n", - " indian 0.87 0.84 0.86 236\n", - " japanese 0.71 0.60 0.65 245\n", - " korean 0.68 0.78 0.72 234\n", - " thai 0.70 0.78 0.74 242\n", - "\n", - " accuracy 0.71 1199\n", - " macro avg 0.71 0.71 0.71 1199\n", - "weighted avg 0.71 0.71 0.71 1199\n", - "\n" - ] - } - ], - "source": [ - "n_classifiers = len(classifiers)\n", - "\n", - "for index, (name, classifier) in enumerate(classifiers.items()):\n", - " classifier.fit(X_train, np.ravel(y_train))\n", - "\n", - " y_pred = classifier.predict(X_test)\n", - " accuracy = accuracy_score(y_test, y_pred)\n", - " print(\"Accuracy (train) for %s: %0.1f%% \" % (name, accuracy * 100))\n", - " print(classification_report(y_test,y_pred))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "7ea2b714669c823a596d986ba2d5739f", - "translation_date": "2025-08-29T23:47:48+00:00", - "source_file": "4-Classification/3-Classifiers-2/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/br/4-Classification/4-Applied/README.md b/translations/br/4-Classification/4-Applied/README.md deleted file mode 100644 index 675573548..000000000 --- a/translations/br/4-Classification/4-Applied/README.md +++ /dev/null @@ -1,329 +0,0 @@ - -# Construir um Aplicativo Web de Recomendação de Culinária - -Nesta lição, você irá construir um modelo de classificação usando algumas das técnicas aprendidas em lições anteriores e com o delicioso conjunto de dados de culinária utilizado ao longo desta série. Além disso, você criará um pequeno aplicativo web para usar um modelo salvo, aproveitando o runtime web do Onnx. - -Um dos usos práticos mais úteis do aprendizado de máquina é a construção de sistemas de recomendação, e você pode dar o primeiro passo nessa direção hoje! - -[![Apresentando este aplicativo web](https://img.youtube.com/vi/17wdM9AHMfg/0.jpg)](https://youtu.be/17wdM9AHMfg "ML Aplicado") - -> 🎥 Clique na imagem acima para assistir ao vídeo: Jen Looper constrói um aplicativo web usando dados de culinária classificados - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -Nesta lição, você aprenderá: - -- Como construir um modelo e salvá-lo como um modelo Onnx -- Como usar o Netron para inspecionar o modelo -- Como usar seu modelo em um aplicativo web para inferência - -## Construa seu modelo - -Construir sistemas de aprendizado de máquina aplicados é uma parte importante para aproveitar essas tecnologias em sistemas empresariais. Você pode usar modelos dentro de seus aplicativos web (e assim utilizá-los em um contexto offline, se necessário) usando Onnx. - -Em uma [lição anterior](../../3-Web-App/1-Web-App/README.md), você construiu um modelo de regressão sobre avistamentos de OVNIs, o "pickleou" e o utilizou em um aplicativo Flask. Embora essa arquitetura seja muito útil, trata-se de um aplicativo Python full-stack, e seus requisitos podem incluir o uso de um aplicativo JavaScript. - -Nesta lição, você pode construir um sistema básico baseado em JavaScript para inferência. Primeiro, no entanto, você precisa treinar um modelo e convertê-lo para uso com Onnx. - -## Exercício - treinar modelo de classificação - -Primeiro, treine um modelo de classificação usando o conjunto de dados de culinária limpo que utilizamos. - -1. Comece importando bibliotecas úteis: - - ```python - !pip install skl2onnx - import pandas as pd - ``` - - Você precisará de '[skl2onnx](https://onnx.ai/sklearn-onnx/)' para ajudar a converter seu modelo Scikit-learn para o formato Onnx. - -1. Em seguida, trabalhe com seus dados da mesma forma que fez em lições anteriores, lendo um arquivo CSV usando `read_csv()`: - - ```python - data = pd.read_csv('../data/cleaned_cuisines.csv') - data.head() - ``` - -1. Remova as duas primeiras colunas desnecessárias e salve os dados restantes como 'X': - - ```python - X = data.iloc[:,2:] - X.head() - ``` - -1. Salve os rótulos como 'y': - - ```python - y = data[['cuisine']] - y.head() - - ``` - -### Inicie a rotina de treinamento - -Usaremos a biblioteca 'SVC', que tem boa precisão. - -1. Importe as bibliotecas apropriadas do Scikit-learn: - - ```python - from sklearn.model_selection import train_test_split - from sklearn.svm import SVC - from sklearn.model_selection import cross_val_score - from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report - ``` - -1. Separe os conjuntos de treinamento e teste: - - ```python - X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3) - ``` - -1. Construa um modelo de classificação SVC como fez na lição anterior: - - ```python - model = SVC(kernel='linear', C=10, probability=True,random_state=0) - model.fit(X_train,y_train.values.ravel()) - ``` - -1. Agora, teste seu modelo chamando `predict()`: - - ```python - y_pred = model.predict(X_test) - ``` - -1. Imprima um relatório de classificação para verificar a qualidade do modelo: - - ```python - print(classification_report(y_test,y_pred)) - ``` - - Como vimos antes, a precisão é boa: - - ```output - precision recall f1-score support - - chinese 0.72 0.69 0.70 257 - indian 0.91 0.87 0.89 243 - japanese 0.79 0.77 0.78 239 - korean 0.83 0.79 0.81 236 - thai 0.72 0.84 0.78 224 - - accuracy 0.79 1199 - macro avg 0.79 0.79 0.79 1199 - weighted avg 0.79 0.79 0.79 1199 - ``` - -### Converta seu modelo para Onnx - -Certifique-se de fazer a conversão com o número correto de tensores. Este conjunto de dados possui 380 ingredientes listados, então você precisa anotar esse número em `FloatTensorType`: - -1. Converta usando um número de tensor de 380. - - ```python - from skl2onnx import convert_sklearn - from skl2onnx.common.data_types import FloatTensorType - - initial_type = [('float_input', FloatTensorType([None, 380]))] - options = {id(model): {'nocl': True, 'zipmap': False}} - ``` - -1. Crie o arquivo onx e salve como **model.onnx**: - - ```python - onx = convert_sklearn(model, initial_types=initial_type, options=options) - with open("./model.onnx", "wb") as f: - f.write(onx.SerializeToString()) - ``` - - > Nota: você pode passar [opções](https://onnx.ai/sklearn-onnx/parameterized.html) no seu script de conversão. Neste caso, passamos 'nocl' como True e 'zipmap' como False. Como este é um modelo de classificação, você tem a opção de remover ZipMap, que produz uma lista de dicionários (não necessário). `nocl` refere-se à inclusão de informações de classe no modelo. Reduza o tamanho do seu modelo configurando `nocl` como 'True'. - -Executar o notebook completo agora criará um modelo Onnx e o salvará nesta pasta. - -## Visualize seu modelo - -Modelos Onnx não são muito visíveis no Visual Studio Code, mas há um software gratuito muito bom que muitos pesquisadores utilizam para visualizar o modelo e garantir que ele foi construído corretamente. Baixe o [Netron](https://github.com/lutzroeder/Netron) e abra seu arquivo model.onnx. Você poderá ver seu modelo simples visualizado, com seus 380 inputs e o classificador listado: - -![Visualização no Netron](../../../../4-Classification/4-Applied/images/netron.png) - -Netron é uma ferramenta útil para visualizar seus modelos. - -Agora você está pronto para usar este modelo interessante em um aplicativo web. Vamos construir um aplicativo que será útil quando você olhar para sua geladeira e tentar descobrir quais combinações de ingredientes restantes podem ser usadas para cozinhar um prato específico, conforme determinado pelo seu modelo. - -## Construa um aplicativo web de recomendação - -Você pode usar seu modelo diretamente em um aplicativo web. Essa arquitetura também permite que você o execute localmente e até mesmo offline, se necessário. Comece criando um arquivo `index.html` na mesma pasta onde você armazenou seu arquivo `model.onnx`. - -1. Neste arquivo _index.html_, adicione a seguinte marcação: - - ```html - - -
- Cuisine Matcher -
- - ... - - - ``` - -1. Agora, dentro das tags `body`, adicione uma pequena marcação para mostrar uma lista de caixas de seleção refletindo alguns ingredientes: - - ```html -

Check your refrigerator. What can you create?

-
-
- - -
- -
- - -
- -
- - -
- -
- - -
- -
- - -
- -
- - -
- -
- - -
-
-
- -
- ``` - - Note que cada caixa de seleção recebe um valor. Isso reflete o índice onde o ingrediente é encontrado de acordo com o conjunto de dados. Por exemplo, maçã, nesta lista alfabética, ocupa a quinta coluna, então seu valor é '4', já que começamos a contar a partir de 0. Você pode consultar a [planilha de ingredientes](../../../../4-Classification/data/ingredient_indexes.csv) para descobrir o índice de um determinado ingrediente. - - Continuando seu trabalho no arquivo index.html, adicione um bloco de script onde o modelo é chamado após o fechamento final de ``. - -1. Primeiro, importe o [Onnx Runtime](https://www.onnxruntime.ai/): - - ```html - - ``` - - > Onnx Runtime é usado para permitir a execução de seus modelos Onnx em uma ampla gama de plataformas de hardware, incluindo otimizações e uma API para uso. - -1. Uma vez que o Runtime esteja configurado, você pode chamá-lo: - - ```html - - ``` - -Neste código, várias coisas estão acontecendo: - -1. Você criou um array de 380 valores possíveis (1 ou 0) para serem configurados e enviados ao modelo para inferência, dependendo de quais caixas de seleção de ingredientes estão marcadas. -2. Você criou um array de caixas de seleção e uma forma de determinar se elas foram marcadas em uma função `init` que é chamada quando o aplicativo inicia. Quando uma caixa de seleção é marcada, o array `ingredients` é alterado para refletir o ingrediente escolhido. -3. Você criou uma função `testCheckboxes` que verifica se alguma caixa de seleção foi marcada. -4. Você usa a função `startInference` quando o botão é pressionado e, se alguma caixa de seleção estiver marcada, inicia a inferência. -5. A rotina de inferência inclui: - 1. Configurar um carregamento assíncrono do modelo - 2. Criar uma estrutura de Tensor para enviar ao modelo - 3. Criar 'feeds' que refletem o input `float_input` que você criou ao treinar seu modelo (você pode usar o Netron para verificar esse nome) - 4. Enviar esses 'feeds' ao modelo e aguardar uma resposta - -## Teste seu aplicativo - -Abra uma sessão de terminal no Visual Studio Code na pasta onde seu arquivo index.html está localizado. Certifique-se de que você tenha o [http-server](https://www.npmjs.com/package/http-server) instalado globalmente e digite `http-server` no prompt. Um localhost deve abrir e você poderá visualizar seu aplicativo web. Verifique qual culinária é recomendada com base em vários ingredientes: - -![Aplicativo web de ingredientes](../../../../4-Classification/4-Applied/images/web-app.png) - -Parabéns, você criou um aplicativo web de 'recomendação' com alguns campos. Dedique algum tempo para expandir este sistema! - -## 🚀Desafio - -Seu aplicativo web é muito básico, então continue expandindo-o usando ingredientes e seus índices do [ingredient_indexes](../../../../4-Classification/data/ingredient_indexes.csv). Quais combinações de sabores funcionam para criar um prato típico de uma determinada nacionalidade? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Embora esta lição tenha apenas tocado na utilidade de criar um sistema de recomendação para ingredientes alimentares, esta área de aplicações de aprendizado de máquina é muito rica em exemplos. Leia mais sobre como esses sistemas são construídos: - -- https://www.sciencedirect.com/topics/computer-science/recommendation-engine -- https://www.technologyreview.com/2014/08/25/171547/the-ultimate-challenge-for-recommendation-engines/ -- https://www.technologyreview.com/2015/03/23/168831/everything-is-a-recommendation/ - -## Tarefa - -[Construa um novo sistema de recomendação](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/4-Applied/assignment.md b/translations/br/4-Classification/4-Applied/assignment.md deleted file mode 100644 index 3e4d88933..000000000 --- a/translations/br/4-Classification/4-Applied/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Construa um recomendador - -## Instruções - -Com base nos exercícios desta lição, você agora sabe como construir um aplicativo web em JavaScript usando o Onnx Runtime e um modelo Onnx convertido. Experimente criar um novo recomendador utilizando dados destas lições ou de outras fontes (dê os devidos créditos, por favor). Você pode criar, por exemplo, um recomendador de animais de estimação com base em diferentes atributos de personalidade, ou um recomendador de gêneros musicais baseado no humor de uma pessoa. Seja criativo! - -## Rubrica - -| Critério | Exemplário | Adequado | Precisa de Melhorias | -| --------- | ----------------------------------------------------------------------- | ------------------------------------- | --------------------------------- | -| | Um aplicativo web e um notebook são apresentados, ambos bem documentados e funcionando | Um dos dois está ausente ou com falhas | Ambos estão ausentes ou com falhas | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/4-Classification/4-Applied/notebook.ipynb b/translations/br/4-Classification/4-Applied/notebook.ipynb deleted file mode 100644 index cd80a38fb..000000000 --- a/translations/br/4-Classification/4-Applied/notebook.ipynb +++ /dev/null @@ -1,39 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 4, - "coopTranslator": { - "original_hash": "2f3e0d9e9ac5c301558fb8bf733ac0cb", - "translation_date": "2025-08-29T23:46:55+00:00", - "source_file": "4-Classification/4-Applied/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/4-Applied/solution/notebook.ipynb b/translations/br/4-Classification/4-Applied/solution/notebook.ipynb deleted file mode 100644 index eae35f6bc..000000000 --- a/translations/br/4-Classification/4-Applied/solution/notebook.ipynb +++ /dev/null @@ -1,290 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "49325d6dd12a3628fc64fa7ccb1a80ff", - "translation_date": "2025-08-29T23:47:11+00:00", - "source_file": "4-Classification/4-Applied/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 58, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: skl2onnx in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (1.8.0)\n", - "Requirement already satisfied: protobuf in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (3.8.0)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.19.2)\n", - "Requirement already satisfied: onnx>=1.2.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.9.0)\n", - "Requirement already satisfied: six in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from skl2onnx) (1.12.0)\n", - "Requirement already satisfied: onnxconverter-common<1.9,>=1.6.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.8.1)\n", - "Requirement already satisfied: scikit-learn>=0.19 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (0.24.2)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.4.1)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from protobuf->skl2onnx) (45.1.0)\n", - "Requirement already satisfied: typing-extensions>=3.6.2.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from onnx>=1.2.1->skl2onnx) (3.10.0.0)\n", - "Requirement already satisfied: threadpoolctl>=2.0.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from scikit-learn>=0.19->skl2onnx) (2.1.0)\n", - "Requirement already satisfied: joblib>=0.11 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from scikit-learn>=0.19->skl2onnx) (0.16.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "!pip install skl2onnx" - ] - }, - { - "cell_type": "code", - "execution_count": 59, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd \n" - ] - }, - { - "cell_type": "code", - "execution_count": 60, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 60 - } - ], - "source": [ - "data = pd.read_csv('../../data/cleaned_cuisines.csv')\n", - "data.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 61, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 61 - } - ], - "source": [ - "X = data.iloc[:,2:]\n", - "X.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 62, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " cuisine\n", - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
cuisine
0indian
1indian
2indian
3indian
4indian
\n
" - }, - "metadata": {}, - "execution_count": 62 - } - ], - "source": [ - "y = data[['cuisine']]\n", - "y.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 63, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "from sklearn.svm import SVC\n", - "from sklearn.model_selection import cross_val_score\n", - "from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report" - ] - }, - { - "cell_type": "code", - "execution_count": 64, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3)" - ] - }, - { - "cell_type": "code", - "execution_count": 65, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "SVC(C=10, kernel='linear', probability=True, random_state=0)" - ] - }, - "metadata": {}, - "execution_count": 65 - } - ], - "source": [ - "model = SVC(kernel='linear', C=10, probability=True,random_state=0)\n", - "model.fit(X_train,y_train.values.ravel())\n" - ] - }, - { - "cell_type": "code", - "execution_count": 66, - "metadata": {}, - "outputs": [], - "source": [ - "y_pred = model.predict(X_test)" - ] - }, - { - "cell_type": "code", - "execution_count": 67, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " precision recall f1-score support\n\n chinese 0.72 0.70 0.71 236\n indian 0.91 0.88 0.89 243\n japanese 0.80 0.75 0.77 240\n korean 0.80 0.81 0.81 230\n thai 0.76 0.85 0.80 250\n\n accuracy 0.80 1199\n macro avg 0.80 0.80 0.80 1199\nweighted avg 0.80 0.80 0.80 1199\n\n" - ] - } - ], - "source": [ - "print(classification_report(y_test,y_pred))" - ] - }, - { - "cell_type": "code", - "execution_count": 68, - "metadata": {}, - "outputs": [], - "source": [ - "from skl2onnx import convert_sklearn\n", - "from skl2onnx.common.data_types import FloatTensorType\n", - "\n", - "initial_type = [('float_input', FloatTensorType([None, 380]))]\n", - "options = {id(model): {'nocl': True, 'zipmap': False}}\n", - "onx = convert_sklearn(model, initial_types=initial_type, options=options)\n", - "with open(\"./model.onnx\", \"wb\") as f:\n", - " f.write(onx.SerializeToString())\n", - "\n", - "\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/4-Classification/README.md b/translations/br/4-Classification/README.md deleted file mode 100644 index a5e6bf6ce..000000000 --- a/translations/br/4-Classification/README.md +++ /dev/null @@ -1,41 +0,0 @@ - -# Começando com classificação - -## Tópico regional: Deliciosas culinárias asiáticas e indianas 🍜 - -Na Ásia e na Índia, as tradições culinárias são extremamente diversas e muito deliciosas! Vamos analisar dados sobre culinárias regionais para tentar entender seus ingredientes. - -![Vendedor de comida tailandesa](../../../translated_images/pt-BR/thai-food.c47a7a7f9f05c218.webp) -> Foto por Lisheng Chang no Unsplash - -## O que você vai aprender - -Nesta seção, você irá expandir seus estudos anteriores sobre Regressão e aprender sobre outros classificadores que podem ser usados para entender melhor os dados. - -> Existem ferramentas úteis de baixo código que podem ajudar você a aprender a trabalhar com modelos de classificação. Experimente [Azure ML para esta tarefa](https://docs.microsoft.com/learn/modules/create-classification-model-azure-machine-learning-designer/?WT.mc_id=academic-77952-leestott) - -## Aulas - -1. [Introdução à classificação](1-Introduction/README.md) -2. [Mais classificadores](2-Classifiers-1/README.md) -3. [Outros classificadores](3-Classifiers-2/README.md) -4. [ML aplicado: crie um aplicativo web](4-Applied/README.md) - -## Créditos - -"Começando com classificação" foi escrito com ♥️ por [Cassie Breviu](https://www.twitter.com/cassiebreviu) e [Jen Looper](https://www.twitter.com/jenlooper) - -O conjunto de dados sobre deliciosas culinárias foi obtido de [Kaggle](https://www.kaggle.com/hoandan/asian-and-indian-cuisines). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/1-Visualize/README.md b/translations/br/5-Clustering/1-Visualize/README.md deleted file mode 100644 index c2cb1de49..000000000 --- a/translations/br/5-Clustering/1-Visualize/README.md +++ /dev/null @@ -1,347 +0,0 @@ - -# Introdução à clusterização - -Clusterização é um tipo de [Aprendizado Não Supervisionado](https://wikipedia.org/wiki/Aprendizado_n%C3%A3o_supervisionado) que parte do pressuposto de que um conjunto de dados não está rotulado ou que suas entradas não estão associadas a saídas predefinidas. Ele utiliza diversos algoritmos para analisar dados não rotulados e fornecer agrupamentos com base nos padrões identificados nos dados. - -[![No One Like You por PSquare](https://img.youtube.com/vi/ty2advRiWJM/0.jpg)](https://youtu.be/ty2advRiWJM "No One Like You por PSquare") - -> 🎥 Clique na imagem acima para assistir ao vídeo. Enquanto estuda aprendizado de máquina com clusterização, aproveite algumas faixas de Dance Hall nigeriano - esta é uma música muito bem avaliada de 2014 por PSquare. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Introdução - -[Clusterização](https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-30164-8_124) é muito útil para exploração de dados. Vamos ver se ela pode ajudar a descobrir tendências e padrões no modo como o público nigeriano consome música. - -✅ Reserve um minuto para pensar sobre os usos da clusterização. Na vida real, clusterização acontece sempre que você tem uma pilha de roupas e precisa separar as peças de cada membro da família 🧦👕👖🩲. Em ciência de dados, clusterização ocorre ao tentar analisar as preferências de um usuário ou determinar as características de qualquer conjunto de dados não rotulado. De certa forma, clusterização ajuda a dar sentido ao caos, como uma gaveta de meias. - -[![Introdução ao ML](https://img.youtube.com/vi/esmzYhuFnds/0.jpg)](https://youtu.be/esmzYhuFnds "Introdução à Clusterização") - -> 🎥 Clique na imagem acima para assistir ao vídeo: John Guttag do MIT apresenta clusterização. - -No ambiente profissional, clusterização pode ser usada para determinar coisas como segmentação de mercado, identificando quais faixas etárias compram quais itens, por exemplo. Outro uso seria a detecção de anomalias, talvez para identificar fraudes em um conjunto de dados de transações com cartão de crédito. Ou você pode usar clusterização para identificar tumores em um lote de exames médicos. - -✅ Pense por um minuto sobre como você pode ter encontrado clusterização 'na prática', em um ambiente bancário, de e-commerce ou de negócios. - -> 🎓 Curiosamente, a análise de clusters teve origem nos campos de Antropologia e Psicologia na década de 1930. Consegue imaginar como ela pode ter sido usada? - -Alternativamente, você poderia usá-la para agrupar resultados de busca - por links de compras, imagens ou avaliações, por exemplo. Clusterização é útil quando você tem um grande conjunto de dados que deseja reduzir e sobre o qual quer realizar uma análise mais detalhada. Assim, a técnica pode ser usada para aprender sobre os dados antes de construir outros modelos. - -✅ Uma vez que seus dados estejam organizados em clusters, você pode atribuir a eles um Id de cluster. Essa técnica pode ser útil para preservar a privacidade de um conjunto de dados; você pode se referir a um ponto de dados pelo seu Id de cluster, em vez de usar dados identificáveis mais reveladores. Consegue pensar em outros motivos para usar um Id de cluster em vez de outros elementos do cluster para identificá-lo? - -Aprofunde seu entendimento sobre técnicas de clusterização neste [módulo de aprendizado](https://docs.microsoft.com/learn/modules/train-evaluate-cluster-models?WT.mc_id=academic-77952-leestott). - -## Começando com clusterização - -[Scikit-learn oferece uma ampla variedade](https://scikit-learn.org/stable/modules/clustering.html) de métodos para realizar clusterização. O tipo que você escolher dependerá do seu caso de uso. De acordo com a documentação, cada método tem diferentes benefícios. Aqui está uma tabela simplificada dos métodos suportados pelo Scikit-learn e seus casos de uso apropriados: - -| Nome do método | Caso de uso | -| :---------------------------- | :-------------------------------------------------------------------- | -| K-Means | propósito geral, indutivo | -| Propagação de afinidade | muitos clusters desiguais, indutivo | -| Mean-shift | muitos clusters desiguais, indutivo | -| Clusterização espectral | poucos clusters iguais, transdutivo | -| Clusterização hierárquica Ward| muitos clusters restritos, transdutivo | -| Clusterização aglomerativa | muitos clusters restritos, distâncias não euclidianas, transdutivo | -| DBSCAN | geometria não plana, clusters desiguais, transdutivo | -| OPTICS | geometria não plana, clusters desiguais com densidade variável, transdutivo | -| Misturas Gaussianas | geometria plana, indutivo | -| BIRCH | grande conjunto de dados com outliers, indutivo | - -> 🎓 Como criamos clusters tem muito a ver com como agrupamos os pontos de dados. Vamos explorar alguns vocabulários: -> -> 🎓 ['Transdutivo' vs. 'indutivo'](https://wikipedia.org/wiki/Transduction_(machine_learning)) -> -> Inferência transdutiva é derivada de casos de treinamento observados que mapeiam para casos de teste específicos. Inferência indutiva é derivada de casos de treinamento que mapeiam para regras gerais que só então são aplicadas aos casos de teste. -> -> Um exemplo: Imagine que você tem um conjunto de dados parcialmente rotulado. Alguns itens são 'discos', outros 'CDs', e alguns estão em branco. Sua tarefa é fornecer rótulos para os itens em branco. Se você escolher uma abordagem indutiva, treinaria um modelo procurando por 'discos' e 'CDs' e aplicaria esses rótulos aos dados não rotulados. Essa abordagem teria dificuldade em classificar itens que na verdade são 'fitas cassete'. Uma abordagem transdutiva, por outro lado, lida com esses dados desconhecidos de forma mais eficaz, agrupando itens semelhantes e aplicando um rótulo ao grupo. Nesse caso, os clusters poderiam refletir 'coisas musicais redondas' e 'coisas musicais quadradas'. -> -> 🎓 ['Geometria não plana' vs. 'plana'](https://datascience.stackexchange.com/questions/52260/terminology-flat-geometry-in-the-context-of-clustering) -> -> Derivado da terminologia matemática, geometria não plana vs. plana refere-se à medida de distâncias entre pontos por métodos geométricos 'planos' ([Euclidianos](https://wikipedia.org/wiki/Geometria_euclidiana)) ou 'não planos' (não Euclidianos). -> ->'Plana' neste contexto refere-se à geometria Euclidiana (partes da qual são ensinadas como 'geometria plana'), e 'não plana' refere-se à geometria não Euclidiana. O que a geometria tem a ver com aprendizado de máquina? Bem, como dois campos enraizados na matemática, deve haver uma maneira comum de medir distâncias entre pontos em clusters, e isso pode ser feito de forma 'plana' ou 'não plana', dependendo da natureza dos dados. [Distâncias Euclidianas](https://wikipedia.org/wiki/Dist%C3%A2ncia_euclidiana) são medidas como o comprimento de um segmento de linha entre dois pontos. [Distâncias não Euclidianas](https://wikipedia.org/wiki/Geometria_n%C3%A3o_euclidiana) são medidas ao longo de uma curva. Se seus dados, visualizados, parecem não existir em um plano, você pode precisar usar um algoritmo especializado para lidar com eles. -> -![Infográfico Geometria Plana vs Não Plana](../../../../5-Clustering/1-Visualize/images/flat-nonflat.png) -> Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) -> -> 🎓 ['Distâncias'](https://web.stanford.edu/class/cs345a/slides/12-clustering.pdf) -> -> Clusters são definidos por sua matriz de distâncias, ou seja, as distâncias entre pontos. Essa distância pode ser medida de algumas maneiras. Clusters Euclidianos são definidos pela média dos valores dos pontos e contêm um 'centroide' ou ponto central. As distâncias são medidas pela distância até esse centroide. Distâncias não Euclidianas referem-se a 'clustroids', o ponto mais próximo de outros pontos. Clustroids, por sua vez, podem ser definidos de várias maneiras. -> -> 🎓 ['Restrito'](https://wikipedia.org/wiki/Constrained_clustering) -> -> [Clusterização Restrita](https://web.cs.ucdavis.edu/~davidson/Publications/ICDMTutorial.pdf) introduz aprendizado 'semi-supervisionado' neste método não supervisionado. As relações entre pontos são marcadas como 'não pode vincular' ou 'deve vincular', então algumas regras são impostas ao conjunto de dados. -> ->Um exemplo: Se um algoritmo é liberado em um lote de dados não rotulados ou semi-rotulados, os clusters que ele produz podem ser de baixa qualidade. No exemplo acima, os clusters podem agrupar 'coisas musicais redondas', 'coisas musicais quadradas', 'coisas triangulares' e 'biscoitos'. Se forem dadas algumas restrições ou regras para seguir ("o item deve ser feito de plástico", "o item precisa ser capaz de produzir música"), isso pode ajudar a 'restringir' o algoritmo a fazer escolhas melhores. -> -> 🎓 'Densidade' -> -> Dados que são 'ruidosos' são considerados 'densos'. As distâncias entre pontos em cada um de seus clusters podem, ao serem examinadas, ser mais ou menos densas, ou 'aglomeradas', e assim esses dados precisam ser analisados com o método de clusterização apropriado. [Este artigo](https://www.kdnuggets.com/2020/02/understanding-density-based-clustering.html) demonstra a diferença entre usar clusterização K-Means vs. algoritmos HDBSCAN para explorar um conjunto de dados ruidoso com densidade de cluster desigual. - -## Algoritmos de clusterização - -Existem mais de 100 algoritmos de clusterização, e seu uso depende da natureza dos dados em questão. Vamos discutir alguns dos principais: - -- **Clusterização hierárquica**. Se um objeto é classificado por sua proximidade a um objeto próximo, em vez de um mais distante, os clusters são formados com base na distância de seus membros para outros objetos. A clusterização aglomerativa do Scikit-learn é hierárquica. - - ![Infográfico Clusterização Hierárquica](../../../../5-Clustering/1-Visualize/images/hierarchical.png) - > Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -- **Clusterização por centroide**. Este algoritmo popular requer a escolha de 'k', ou o número de clusters a serem formados, após o qual o algoritmo determina o ponto central de um cluster e reúne dados ao redor desse ponto. [Clusterização K-means](https://wikipedia.org/wiki/K-means_clustering) é uma versão popular de clusterização por centroide. O centro é determinado pela média mais próxima, daí o nome. A distância quadrada do cluster é minimizada. - - ![Infográfico Clusterização por Centroide](../../../../5-Clustering/1-Visualize/images/centroid.png) - > Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -- **Clusterização baseada em distribuição**. Baseada em modelagem estatística, a clusterização baseada em distribuição foca em determinar a probabilidade de um ponto de dados pertencer a um cluster e atribuí-lo de acordo. Métodos de mistura Gaussianas pertencem a este tipo. - -- **Clusterização baseada em densidade**. Pontos de dados são atribuídos a clusters com base em sua densidade, ou seu agrupamento ao redor uns dos outros. Pontos de dados distantes do grupo são considerados outliers ou ruídos. DBSCAN, Mean-shift e OPTICS pertencem a este tipo de clusterização. - -- **Clusterização baseada em grade**. Para conjuntos de dados multidimensionais, uma grade é criada e os dados são divididos entre as células da grade, criando assim clusters. - -## Exercício - agrupe seus dados - -Clusterização como técnica é muito auxiliada por uma boa visualização, então vamos começar visualizando nossos dados musicais. Este exercício nos ajudará a decidir qual dos métodos de clusterização devemos usar de forma mais eficaz para a natureza desses dados. - -1. Abra o arquivo [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/notebook.ipynb) nesta pasta. - -1. Importe o pacote `Seaborn` para uma boa visualização de dados. - - ```python - !pip install seaborn - ``` - -1. Adicione os dados das músicas do arquivo [_nigerian-songs.csv_](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/data/nigerian-songs.csv). Carregue um dataframe com alguns dados sobre as músicas. Prepare-se para explorar esses dados importando as bibliotecas e exibindo os dados: - - ```python - import matplotlib.pyplot as plt - import pandas as pd - - df = pd.read_csv("../data/nigerian-songs.csv") - df.head() - ``` - - Verifique as primeiras linhas de dados: - - | | nome | álbum | artista | gênero_principal_artista | data_lançamento | duração | popularidade | dançabilidade | acústica | energia | instrumentalidade | vivacidade | volume | discurso | tempo | assinatura_tempo | - | --- | ------------------------ | ---------------------------- | ------------------- | ------------------------ | ---------------- | ------- | ------------ | ------------- | -------- | ------- | ----------------- | ---------- | ------ | -------- | ------- | ---------------- | - | 0 | Sparky | Mandy & The Jungle | Cruel Santino | r&b alternativo | 2019 | 144000 | 48 | 0.666 | 0.851 | 0.42 | 0.534 | 0.11 | -6.699 | 0.0829 | 133.015 | 5 | - | 1 | shuga rush | EVERYTHING YOU HEARD IS TRUE | Odunsi (The Engine) | afropop | 2020 | 89488 | 30 | 0.71 | 0.0822 | 0.683 | 0.000169 | 0.101 | -5.64 | 0.36 | 129.993 | 3 | -| 2 | LITT! | LITT! | AYLØ | indie r&b | 2018 | 207758 | 40 | 0.836 | 0.272 | 0.564 | 0.000537 | 0.11 | -7.127 | 0.0424 | 130.005 | 4 | -| 3 | Confident / Feeling Cool | Enjoy Your Life | Lady Donli | nigerian pop | 2019 | 175135 | 14 | 0.894 | 0.798 | 0.611 | 0.000187 | 0.0964 | -4.961 | 0.113 | 111.087 | 4 | -| 4 | wanted you | rare. | Odunsi (The Engine) | afropop | 2018 | 152049 | 25 | 0.702 | 0.116 | 0.833 | 0.91 | 0.348 | -6.044 | 0.0447 | 105.115 | 4 | - -1. Obtenha algumas informações sobre o dataframe, chamando `info()`: - - ```python - df.info() - ``` - - A saída será semelhante a: - - ```output - - RangeIndex: 530 entries, 0 to 529 - Data columns (total 16 columns): - # Column Non-Null Count Dtype - --- ------ -------------- ----- - 0 name 530 non-null object - 1 album 530 non-null object - 2 artist 530 non-null object - 3 artist_top_genre 530 non-null object - 4 release_date 530 non-null int64 - 5 length 530 non-null int64 - 6 popularity 530 non-null int64 - 7 danceability 530 non-null float64 - 8 acousticness 530 non-null float64 - 9 energy 530 non-null float64 - 10 instrumentalness 530 non-null float64 - 11 liveness 530 non-null float64 - 12 loudness 530 non-null float64 - 13 speechiness 530 non-null float64 - 14 tempo 530 non-null float64 - 15 time_signature 530 non-null int64 - dtypes: float64(8), int64(4), object(4) - memory usage: 66.4+ KB - ``` - -1. Verifique novamente se há valores nulos, chamando `isnull()` e verificando se a soma é 0: - - ```python - df.isnull().sum() - ``` - - Tudo certo: - - ```output - name 0 - album 0 - artist 0 - artist_top_genre 0 - release_date 0 - length 0 - popularity 0 - danceability 0 - acousticness 0 - energy 0 - instrumentalness 0 - liveness 0 - loudness 0 - speechiness 0 - tempo 0 - time_signature 0 - dtype: int64 - ``` - -1. Descreva os dados: - - ```python - df.describe() - ``` - - | | release_date | length | popularity | danceability | acousticness | energy | instrumentalness | liveness | loudness | speechiness | tempo | time_signature | - | ----- | ------------ | ----------- | ---------- | ------------ | ------------ | -------- | ---------------- | -------- | --------- | ----------- | ---------- | -------------- | - | count | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | - | mean | 2015.390566 | 222298.1698 | 17.507547 | 0.741619 | 0.265412 | 0.760623 | 0.016305 | 0.147308 | -4.953011 | 0.130748 | 116.487864 | 3.986792 | - | std | 3.131688 | 39696.82226 | 18.992212 | 0.117522 | 0.208342 | 0.148533 | 0.090321 | 0.123588 | 2.464186 | 0.092939 | 23.518601 | 0.333701 | - | min | 1998 | 89488 | 0 | 0.255 | 0.000665 | 0.111 | 0 | 0.0283 | -19.362 | 0.0278 | 61.695 | 3 | - | 25% | 2014 | 199305 | 0 | 0.681 | 0.089525 | 0.669 | 0 | 0.07565 | -6.29875 | 0.0591 | 102.96125 | 4 | - | 50% | 2016 | 218509 | 13 | 0.761 | 0.2205 | 0.7845 | 0.000004 | 0.1035 | -4.5585 | 0.09795 | 112.7145 | 4 | - | 75% | 2017 | 242098.5 | 31 | 0.8295 | 0.403 | 0.87575 | 0.000234 | 0.164 | -3.331 | 0.177 | 125.03925 | 4 | - | max | 2020 | 511738 | 73 | 0.966 | 0.954 | 0.995 | 0.91 | 0.811 | 0.582 | 0.514 | 206.007 | 5 | - -> 🤔 Se estamos trabalhando com clustering, um método não supervisionado que não requer dados rotulados, por que estamos mostrando esses dados com rótulos? Na fase de exploração de dados, eles são úteis, mas não são necessários para os algoritmos de clustering funcionarem. Você poderia simplesmente remover os cabeçalhos das colunas e se referir aos dados pelo número da coluna. - -Observe os valores gerais dos dados. Note que a popularidade pode ser '0', o que indica músicas que não têm classificação. Vamos remover esses valores em breve. - -1. Use um gráfico de barras para descobrir os gêneros mais populares: - - ```python - import seaborn as sns - - top = df['artist_top_genre'].value_counts() - plt.figure(figsize=(10,7)) - sns.barplot(x=top[:5].index,y=top[:5].values) - plt.xticks(rotation=45) - plt.title('Top genres',color = 'blue') - ``` - - ![most popular](../../../../5-Clustering/1-Visualize/images/popular.png) - -✅ Se você quiser ver mais valores principais, altere o top `[:5]` para um valor maior ou remova-o para ver todos. - -Note que, quando o gênero principal é descrito como 'Missing', isso significa que o Spotify não o classificou, então vamos eliminá-lo. - -1. Elimine os dados ausentes filtrando-os: - - ```python - df = df[df['artist_top_genre'] != 'Missing'] - top = df['artist_top_genre'].value_counts() - plt.figure(figsize=(10,7)) - sns.barplot(x=top.index,y=top.values) - plt.xticks(rotation=45) - plt.title('Top genres',color = 'blue') - ``` - - Agora verifique novamente os gêneros: - - ![most popular](../../../../5-Clustering/1-Visualize/images/all-genres.png) - -1. De longe, os três principais gêneros dominam este conjunto de dados. Vamos nos concentrar em `afro dancehall`, `afropop` e `nigerian pop`, além de filtrar o conjunto de dados para remover qualquer coisa com valor de popularidade 0 (o que significa que não foi classificado com uma popularidade no conjunto de dados e pode ser considerado ruído para nossos propósitos): - - ```python - df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')] - df = df[(df['popularity'] > 0)] - top = df['artist_top_genre'].value_counts() - plt.figure(figsize=(10,7)) - sns.barplot(x=top.index,y=top.values) - plt.xticks(rotation=45) - plt.title('Top genres',color = 'blue') - ``` - -1. Faça um teste rápido para ver se os dados têm alguma correlação particularmente forte: - - ```python - corrmat = df.corr(numeric_only=True) - f, ax = plt.subplots(figsize=(12, 9)) - sns.heatmap(corrmat, vmax=.8, square=True) - ``` - - ![correlations](../../../../5-Clustering/1-Visualize/images/correlation.png) - - A única correlação forte é entre `energy` e `loudness`, o que não é muito surpreendente, dado que músicas altas geralmente são bastante energéticas. Fora isso, as correlações são relativamente fracas. Será interessante ver o que um algoritmo de clustering pode fazer com esses dados. - - > 🎓 Note que correlação não implica causalidade! Temos prova de correlação, mas nenhuma prova de causalidade. Um [site divertido](https://tylervigen.com/spurious-correlations) tem alguns visuais que enfatizam esse ponto. - -Há alguma convergência neste conjunto de dados em torno da popularidade percebida de uma música e sua capacidade de dança? Um FacetGrid mostra que há círculos concêntricos que se alinham, independentemente do gênero. Será que os gostos nigerianos convergem em um certo nível de capacidade de dança para este gênero? - -✅ Experimente diferentes pontos de dados (energia, loudness, speechiness) e mais ou diferentes gêneros musicais. O que você pode descobrir? Dê uma olhada na tabela `df.describe()` para ver a distribuição geral dos pontos de dados. - -### Exercício - distribuição de dados - -Esses três gêneros são significativamente diferentes na percepção de sua capacidade de dança, com base em sua popularidade? - -1. Examine a distribuição de dados dos nossos três principais gêneros para popularidade e capacidade de dança ao longo de um eixo x e y dado. - - ```python - sns.set_theme(style="ticks") - - g = sns.jointplot( - data=df, - x="popularity", y="danceability", hue="artist_top_genre", - kind="kde", - ) - ``` - - Você pode descobrir círculos concêntricos em torno de um ponto geral de convergência, mostrando a distribuição dos pontos. - - > 🎓 Note que este exemplo usa um gráfico KDE (Kernel Density Estimate) que representa os dados usando uma curva de densidade de probabilidade contínua. Isso nos permite interpretar os dados ao trabalhar com múltiplas distribuições. - - Em geral, os três gêneros se alinham vagamente em termos de sua popularidade e capacidade de dança. Determinar clusters nesses dados vagamente alinhados será um desafio: - - ![distribution](../../../../5-Clustering/1-Visualize/images/distribution.png) - -1. Crie um gráfico de dispersão: - - ```python - sns.FacetGrid(df, hue="artist_top_genre", height=5) \ - .map(plt.scatter, "popularity", "danceability") \ - .add_legend() - ``` - - Um gráfico de dispersão dos mesmos eixos mostra um padrão semelhante de convergência. - - ![Facetgrid](../../../../5-Clustering/1-Visualize/images/facetgrid.png) - -Em geral, para clustering, você pode usar gráficos de dispersão para mostrar clusters de dados, então dominar esse tipo de visualização é muito útil. Na próxima lição, usaremos esses dados filtrados e aplicaremos o clustering k-means para descobrir grupos nesses dados que parecem se sobrepor de maneiras interessantes. - ---- - -## 🚀Desafio - -Em preparação para a próxima lição, faça um gráfico sobre os vários algoritmos de clustering que você pode descobrir e usar em um ambiente de produção. Que tipos de problemas o clustering está tentando resolver? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Antes de aplicar algoritmos de clustering, como aprendemos, é uma boa ideia entender a natureza do seu conjunto de dados. Leia mais sobre este tópico [aqui](https://www.kdnuggets.com/2019/10/right-clustering-algorithm.html) - -[Este artigo útil](https://www.freecodecamp.org/news/8-clustering-algorithms-in-machine-learning-that-all-data-scientists-should-know/) explica as diferentes maneiras como vários algoritmos de clustering se comportam, dados diferentes formatos de dados. - -## Tarefa - -[Pesquise outras visualizações para clustering](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/1-Visualize/assignment.md b/translations/br/5-Clustering/1-Visualize/assignment.md deleted file mode 100644 index 51e57a4cd..000000000 --- a/translations/br/5-Clustering/1-Visualize/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Pesquise outras visualizações para agrupamento - -## Instruções - -Nesta lição, você trabalhou com algumas técnicas de visualização para entender como plotar seus dados em preparação para agrupá-los. Os gráficos de dispersão, em particular, são úteis para encontrar grupos de objetos. Pesquise diferentes maneiras e bibliotecas para criar gráficos de dispersão e documente seu trabalho em um notebook. Você pode usar os dados desta lição, de outras lições ou dados que você mesmo encontrar (por favor, credite a fonte, no entanto, em seu notebook). Plote alguns dados usando gráficos de dispersão e explique o que você descobriu. - -## Rubrica - -| Critério | Exemplar | Adequado | Precisa Melhorar | -| -------- | ------------------------------------------------------------- | ---------------------------------------------------------------------------------------- | ----------------------------------- | -| | Um notebook é apresentado com cinco gráficos de dispersão bem documentados | Um notebook é apresentado com menos de cinco gráficos de dispersão e é menos bem documentado | Um notebook incompleto é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/1-Visualize/notebook.ipynb b/translations/br/5-Clustering/1-Visualize/notebook.ipynb deleted file mode 100644 index b22e8827c..000000000 --- a/translations/br/5-Clustering/1-Visualize/notebook.ipynb +++ /dev/null @@ -1,50 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.3" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python383jvsc74a57bd0e134e05457d34029b6460cd73bbf1ed73f339b5b6d98c95be70b69eba114fe95", - "display_name": "Python 3.8.3 64-bit (conda)" - }, - "coopTranslator": { - "original_hash": "40e0707e96b3e1899a912776006264f9", - "translation_date": "2025-08-29T23:25:24+00:00", - "source_file": "5-Clustering/1-Visualize/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/5-Clustering/1-Visualize/solution/Julia/README.md b/translations/br/5-Clustering/1-Visualize/solution/Julia/README.md deleted file mode 100644 index 0b413b665..000000000 --- a/translations/br/5-Clustering/1-Visualize/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb b/translations/br/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb deleted file mode 100644 index 8796db237..000000000 --- a/translations/br/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb +++ /dev/null @@ -1,499 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "source": [ - "## **Música Nigeriana extraída do Spotify - uma análise**\n", - "\n", - "Clustering é um tipo de [Aprendizado Não Supervisionado](https://wikipedia.org/wiki/Aprendizado_n%C3%A3o_supervisionado) que presume que um conjunto de dados não possui rótulos ou que suas entradas não estão associadas a saídas predefinidas. Ele utiliza vários algoritmos para organizar dados não rotulados e fornecer agrupamentos com base em padrões identificados nos dados.\n", - "\n", - "[**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/27/)\n", - "\n", - "### **Introdução**\n", - "\n", - "[Clustering](https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-30164-8_124) é muito útil para a exploração de dados. Vamos ver se ele pode ajudar a descobrir tendências e padrões no modo como o público nigeriano consome música.\n", - "\n", - "> ✅ Reserve um minuto para pensar sobre os usos do clustering. Na vida real, o clustering acontece sempre que você tem uma pilha de roupas para lavar e precisa separar as peças de cada membro da família 🧦👕👖🩲. Na ciência de dados, o clustering ocorre ao tentar analisar as preferências de um usuário ou determinar as características de um conjunto de dados não rotulado. O clustering, de certa forma, ajuda a dar sentido ao caos, como organizar uma gaveta de meias.\n", - "\n", - "Em um ambiente profissional, o clustering pode ser usado para determinar coisas como segmentação de mercado, identificando, por exemplo, quais faixas etárias compram determinados itens. Outro uso seria a detecção de anomalias, talvez para identificar fraudes em um conjunto de dados de transações com cartão de crédito. Ou você poderia usar o clustering para identificar tumores em um lote de exames médicos.\n", - "\n", - "✅ Pense por um minuto sobre como você já encontrou clustering \"no mundo real\", em um banco, e-commerce ou ambiente de negócios.\n", - "\n", - "> 🎓 Curiosamente, a análise de clusters teve origem nos campos da Antropologia e Psicologia na década de 1930. Você consegue imaginar como ela pode ter sido usada?\n", - "\n", - "Alternativamente, você poderia usá-lo para agrupar resultados de busca - por links de compras, imagens ou avaliações, por exemplo. O clustering é útil quando você tem um grande conjunto de dados que deseja reduzir e no qual deseja realizar uma análise mais detalhada. Assim, a técnica pode ser usada para aprender sobre os dados antes de construir outros modelos.\n", - "\n", - "✅ Depois que seus dados são organizados em clusters, você atribui a eles um Id de cluster. Essa técnica pode ser útil para preservar a privacidade de um conjunto de dados; você pode se referir a um ponto de dados pelo Id do cluster, em vez de usar dados identificáveis mais reveladores. Consegue pensar em outros motivos para usar um Id de cluster em vez de outros elementos do cluster para identificá-lo?\n", - "\n", - "### Começando com clustering\n", - "\n", - "> 🎓 A forma como criamos clusters tem muito a ver com a maneira como agrupamos os pontos de dados. Vamos explorar alguns conceitos:\n", - ">\n", - "> 🎓 ['Transdutivo' vs. 'indutivo'](https://wikipedia.org/wiki/Transduction_(machine_learning))\n", - ">\n", - "> A inferência transdutiva é derivada de casos de treinamento observados que mapeiam para casos de teste específicos. A inferência indutiva é derivada de casos de treinamento que mapeiam para regras gerais, que só então são aplicadas aos casos de teste.\n", - ">\n", - "> Um exemplo: Imagine que você tem um conjunto de dados parcialmente rotulado. Alguns itens são 'discos', outros 'CDs' e alguns estão em branco. Sua tarefa é fornecer rótulos para os itens em branco. Se você escolher uma abordagem indutiva, treinaria um modelo procurando por 'discos' e 'CDs' e aplicaria esses rótulos aos dados não rotulados. Essa abordagem teria dificuldade em classificar itens que na verdade são 'fitas cassete'. Uma abordagem transdutiva, por outro lado, lida com esses dados desconhecidos de forma mais eficaz, agrupando itens semelhantes e, em seguida, aplicando um rótulo ao grupo. Nesse caso, os clusters poderiam refletir 'coisas musicais redondas' e 'coisas musicais quadradas'.\n", - ">\n", - "> 🎓 ['Geometria não plana' vs. 'plana'](https://datascience.stackexchange.com/questions/52260/terminology-flat-geometry-in-the-context-of-clustering)\n", - ">\n", - "> Derivado da terminologia matemática, geometria não plana vs. plana refere-se à medição de distâncias entre pontos por métodos geométricos 'planos' ([Euclidianos](https://wikipedia.org/wiki/Geometria_euclidiana)) ou 'não planos' (não Euclidianos).\n", - ">\n", - "> 'Plana', neste contexto, refere-se à geometria Euclidiana (partes da qual são ensinadas como geometria 'plana'), enquanto 'não plana' refere-se à geometria não Euclidiana. O que a geometria tem a ver com aprendizado de máquina? Bem, como ambos os campos têm raízes na matemática, deve haver uma maneira comum de medir distâncias entre pontos em clusters, e isso pode ser feito de forma 'plana' ou 'não plana', dependendo da natureza dos dados. [Distâncias Euclidianas](https://wikipedia.org/wiki/Dist%C3%A2ncia_euclidiana) são medidas como o comprimento de um segmento de linha entre dois pontos. [Distâncias não Euclidianas](https://wikipedia.org/wiki/Geometria_n%C3%A3o_euclidiana) são medidas ao longo de uma curva. Se seus dados, quando visualizados, parecem não existir em um plano, você pode precisar usar um algoritmo especializado para lidar com eles.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "> 🎓 ['Distâncias'](https://web.stanford.edu/class/cs345a/slides/12-clustering.pdf)\n", - ">\n", - "> Clusters são definidos por sua matriz de distâncias, ou seja, as distâncias entre pontos. Essa distância pode ser medida de algumas maneiras. Clusters Euclidianos são definidos pela média dos valores dos pontos e contêm um 'centróide' ou ponto central. As distâncias são, portanto, medidas pela distância até esse centróide. Distâncias não Euclidianas referem-se a 'clustroids', o ponto mais próximo de outros pontos. Clustroids, por sua vez, podem ser definidos de várias maneiras.\n", - ">\n", - "> 🎓 ['Com restrições'](https://wikipedia.org/wiki/Constrained_clustering)\n", - ">\n", - "> [Clustering com restrições](https://web.cs.ucdavis.edu/~davidson/Publications/ICDMTutorial.pdf) introduz aprendizado 'semi-supervisionado' neste método não supervisionado. As relações entre pontos são marcadas como 'não pode vincular' ou 'deve vincular', de modo que algumas regras são impostas ao conjunto de dados.\n", - ">\n", - "> Um exemplo: Se um algoritmo é liberado em um lote de dados não rotulados ou semi-rotulados, os clusters que ele produz podem ser de baixa qualidade. No exemplo acima, os clusters podem agrupar 'coisas musicais redondas', 'coisas musicais quadradas', 'coisas triangulares' e 'biscoitos'. Se forem dadas algumas restrições ou regras a serem seguidas (\"o item deve ser feito de plástico\", \"o item precisa ser capaz de produzir música\"), isso pode ajudar a 'restringir' o algoritmo para fazer escolhas melhores.\n", - ">\n", - "> 🎓 'Densidade'\n", - ">\n", - "> Dados que são 'ruidosos' são considerados 'densos'. As distâncias entre pontos em cada um de seus clusters podem, ao serem examinadas, ser mais ou menos densas, ou 'aglomeradas', e, portanto, esses dados precisam ser analisados com o método de clustering apropriado. [Este artigo](https://www.kdnuggets.com/2020/02/understanding-density-based-clustering.html) demonstra a diferença entre usar clustering K-Means e algoritmos HDBSCAN para explorar um conjunto de dados ruidoso com densidade de cluster desigual.\n", - "\n", - "Aprofunde seu entendimento sobre técnicas de clustering neste [módulo de aprendizado](https://docs.microsoft.com/learn/modules/train-evaluate-cluster-models?WT.mc_id=academic-77952-leestott)\n", - "\n", - "### **Algoritmos de clustering**\n", - "\n", - "Existem mais de 100 algoritmos de clustering, e seu uso depende da natureza dos dados em questão. Vamos discutir alguns dos principais:\n", - "\n", - "- **Clustering hierárquico**. Se um objeto é classificado por sua proximidade com um objeto próximo, em vez de um mais distante, os clusters são formados com base na distância de seus membros para outros objetos. O clustering hierárquico é caracterizado pela combinação repetida de dois clusters.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "- **Clustering por centróides**. Este algoritmo popular exige a escolha de 'k', ou o número de clusters a serem formados, após o qual o algoritmo determina o ponto central de um cluster e reúne dados ao redor desse ponto. [Clustering K-means](https://wikipedia.org/wiki/K-means_clustering) é uma versão popular do clustering por centróides, que separa um conjunto de dados em K grupos predefinidos. O centro é determinado pela média mais próxima, daí o nome. A distância quadrada do cluster é minimizada.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "- **Clustering baseado em distribuição**. Baseado em modelagem estatística, o clustering baseado em distribuição foca em determinar a probabilidade de um ponto de dados pertencer a um cluster e atribuí-lo de acordo.\n", - "\n", - "- **Clustering baseado em densidade**. Pontos de dados são atribuídos a clusters com base em sua densidade, ou seu agrupamento em torno uns dos outros. Pontos de dados distantes do grupo são considerados outliers ou ruídos. DBSCAN, Mean-shift e OPTICS pertencem a esse tipo de clustering.\n", - "\n", - "- **Clustering baseado em grade**. Para conjuntos de dados multidimensionais, uma grade é criada e os dados são divididos entre as células da grade, criando assim clusters.\n", - "\n", - "A melhor maneira de aprender sobre clustering é experimentando você mesmo, e é isso que você fará neste exercício.\n", - "\n", - "Vamos precisar de alguns pacotes para concluir este módulo. Você pode instalá-los com: `install.packages(c('tidyverse', 'tidymodels', 'DataExplorer', 'summarytools', 'plotly', 'paletteer', 'corrplot', 'patchwork'))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala para você caso algum esteja faltando.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\r\n", - "\r\n", - "pacman::p_load('tidyverse', 'tidymodels', 'DataExplorer', 'summarytools', 'plotly', 'paletteer', 'corrplot', 'patchwork')\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "## Exercício - agrupe seus dados\n", - "\n", - "A técnica de agrupamento é muito beneficiada por uma visualização adequada, então vamos começar visualizando nossos dados de música. Este exercício nos ajudará a decidir qual dos métodos de agrupamento devemos usar de forma mais eficaz para a natureza desses dados.\n", - "\n", - "Vamos começar importando os dados.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the core tidyverse and make it available in your current R session\r\n", - "library(tidyverse)\r\n", - "\r\n", - "# Import the data into a tibble\r\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/5-Clustering/data/nigerian-songs.csv\")\r\n", - "\r\n", - "# View the first 5 rows of the data set\r\n", - "df %>% \r\n", - " slice_head(n = 5)\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Às vezes, podemos querer um pouco mais de informação sobre nossos dados. Podemos observar os `dados` e `sua estrutura` usando a função [*glimpse()*](https://pillar.r-lib.org/reference/glimpse.html):\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Glimpse into the data set\r\n", - "df %>% \r\n", - " glimpse()\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho!💪\n", - "\n", - "Podemos observar que `glimpse()` fornece o número total de linhas (observações) e colunas (variáveis), seguido pelas primeiras entradas de cada variável em uma linha após o nome da variável. Além disso, o *tipo de dado* da variável é exibido logo após o nome da variável dentro de `< >`.\n", - "\n", - "`DataExplorer::introduce()` pode resumir essas informações de forma organizada:\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Describe basic information for our data\r\n", - "df %>% \r\n", - " introduce()\r\n", - "\r\n", - "# A visual display of the same\r\n", - "df %>% \r\n", - " plot_intro()\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Incrível! Acabamos de aprender que nossos dados não possuem valores ausentes.\n", - "\n", - "Enquanto estamos nisso, podemos explorar estatísticas comuns de tendência central (por exemplo, [média](https://en.wikipedia.org/wiki/Arithmetic_mean) e [mediana](https://en.wikipedia.org/wiki/Median)) e medidas de dispersão (por exemplo, [desvio padrão](https://en.wikipedia.org/wiki/Standard_deviation)) usando `summarytools::descr()`\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Describe common statistics\r\n", - "df %>% \r\n", - " descr(stats = \"common\")\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vamos analisar os valores gerais dos dados. Observe que a popularidade pode ser `0`, o que indica músicas que não possuem classificação. Vamos remover esses casos em breve.\n", - "\n", - "> 🤔 Se estamos trabalhando com clustering, um método não supervisionado que não exige dados rotulados, por que estamos mostrando esses dados com rótulos? Na fase de exploração dos dados, eles são úteis, mas não são necessários para que os algoritmos de clustering funcionem.\n", - "\n", - "### 1. Explorar gêneros populares\n", - "\n", - "Vamos descobrir quais são os gêneros mais populares 🎶 contando o número de vezes que eles aparecem.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Popular genres\r\n", - "top_genres <- df %>% \r\n", - " count(artist_top_genre, sort = TRUE) %>% \r\n", - "# Encode to categorical and reorder the according to count\r\n", - " mutate(artist_top_genre = factor(artist_top_genre) %>% fct_inorder())\r\n", - "\r\n", - "# Print the top genres\r\n", - "top_genres\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Isso foi bem! Dizem que uma imagem vale mais que mil linhas de um data frame (na verdade, ninguém nunca diz isso 😅). Mas você entendeu a ideia, certo?\n", - "\n", - "Uma maneira de visualizar dados categóricos (variáveis de texto ou fator) é usando gráficos de barras. Vamos criar um gráfico de barras com os 10 principais gêneros:\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Change the default gray theme\r\n", - "theme_set(theme_light())\r\n", - "\r\n", - "# Visualize popular genres\r\n", - "top_genres %>%\r\n", - " slice(1:10) %>% \r\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\r\n", - " fill = artist_top_genre)) +\r\n", - " geom_col(alpha = 0.8) +\r\n", - " paletteer::scale_fill_paletteer_d(\"rcartocolor::Vivid\") +\r\n", - " ggtitle(\"Top genres\") +\r\n", - " theme(plot.title = element_text(hjust = 0.5),\r\n", - " # Rotates the X markers (so we can read them)\r\n", - " axis.text.x = element_text(angle = 90))\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Agora ficou muito mais fácil identificar que temos gêneros `missing` 🧐!\n", - "\n", - "> Uma boa visualização mostrará coisas que você não esperava ou levantará novas questões sobre os dados - Hadley Wickham e Garrett Grolemund, [R For Data Science](https://r4ds.had.co.nz/introduction.html)\n", - "\n", - "Observe que, quando o gênero principal é descrito como `Missing`, isso significa que o Spotify não o classificou, então vamos eliminá-lo.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Visualize popular genres\r\n", - "top_genres %>%\r\n", - " filter(artist_top_genre != \"Missing\") %>% \r\n", - " slice(1:10) %>% \r\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\r\n", - " fill = artist_top_genre)) +\r\n", - " geom_col(alpha = 0.8) +\r\n", - " paletteer::scale_fill_paletteer_d(\"rcartocolor::Vivid\") +\r\n", - " ggtitle(\"Top genres\") +\r\n", - " theme(plot.title = element_text(hjust = 0.5),\r\n", - " # Rotates the X markers (so we can read them)\r\n", - " axis.text.x = element_text(angle = 90))\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "A partir da pequena exploração de dados, aprendemos que os três principais gêneros dominam este conjunto de dados. Vamos nos concentrar em `afro dancehall`, `afropop` e `nigerian pop`, além de filtrar o conjunto de dados para remover qualquer coisa com um valor de popularidade igual a 0 (o que significa que não foi classificado com uma popularidade no conjunto de dados e pode ser considerado como ruído para nossos propósitos):\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "nigerian_songs <- df %>% \r\n", - " # Concentrate on top 3 genres\r\n", - " filter(artist_top_genre %in% c(\"afro dancehall\", \"afropop\",\"nigerian pop\")) %>% \r\n", - " # Remove unclassified observations\r\n", - " filter(popularity != 0)\r\n", - "\r\n", - "\r\n", - "\r\n", - "# Visualize popular genres\r\n", - "nigerian_songs %>%\r\n", - " count(artist_top_genre) %>%\r\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\r\n", - " fill = artist_top_genre)) +\r\n", - " geom_col(alpha = 0.8) +\r\n", - " paletteer::scale_fill_paletteer_d(\"ggsci::category10_d3\") +\r\n", - " ggtitle(\"Top genres\") +\r\n", - " theme(plot.title = element_text(hjust = 0.5))\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vamos verificar se há alguma relação linear aparente entre as variáveis numéricas em nosso conjunto de dados. Essa relação é quantificada matematicamente pelo [estatístico de correlação](https://en.wikipedia.org/wiki/Correlation).\n", - "\n", - "O estatístico de correlação é um valor entre -1 e 1 que indica a força de uma relação. Valores acima de 0 indicam uma correlação *positiva* (valores altos de uma variável tendem a coincidir com valores altos da outra), enquanto valores abaixo de 0 indicam uma correlação *negativa* (valores altos de uma variável tendem a coincidir com valores baixos da outra).\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Narrow down to numeric variables and fid correlation\r\n", - "corr_mat <- nigerian_songs %>% \r\n", - " select(where(is.numeric)) %>% \r\n", - " cor()\r\n", - "\r\n", - "# Visualize correlation matrix\r\n", - "corrplot(corr_mat, order = 'AOE', col = c('white', 'black'), bg = 'gold2') \r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Os dados não são fortemente correlacionados, exceto entre `energy` e `loudness`, o que faz sentido, já que músicas altas geralmente são bem energéticas. `Popularity` tem uma correspondência com `release date`, o que também faz sentido, pois músicas mais recentes provavelmente são mais populares. Comprimento e energia parecem ter uma correlação também.\n", - "\n", - "Será interessante ver o que um algoritmo de clusterização pode fazer com esses dados!\n", - "\n", - "> 🎓 Observe que correlação não implica causalidade! Temos prova de correlação, mas nenhuma prova de causalidade. Um [site divertido](https://tylervigen.com/spurious-correlations) tem algumas visualizações que enfatizam esse ponto.\n", - "\n", - "### 2. Explorar a distribuição dos dados\n", - "\n", - "Vamos fazer algumas perguntas mais sutis. Os gêneros são significativamente diferentes na percepção de sua dançabilidade, com base em sua popularidade? Vamos examinar a distribuição dos dados dos nossos três principais gêneros em relação à popularidade e dançabilidade ao longo de um eixo x e y usando [gráficos de densidade](https://www.khanacademy.org/math/ap-statistics/density-curves-normal-distribution-ap/density-curves/v/density-curves).\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Perform 2D kernel density estimation\r\n", - "density_estimate_2d <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = popularity, y = danceability, color = artist_top_genre)) +\r\n", - " geom_density_2d(bins = 5, size = 1) +\r\n", - " paletteer::scale_color_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " xlim(-20, 80) +\r\n", - " ylim(0, 1.2)\r\n", - "\r\n", - "# Density plot based on the popularity\r\n", - "density_estimate_pop <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = popularity, fill = artist_top_genre, color = artist_top_genre)) +\r\n", - " geom_density(size = 1, alpha = 0.5) +\r\n", - " paletteer::scale_fill_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " paletteer::scale_color_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " theme(legend.position = \"none\")\r\n", - "\r\n", - "# Density plot based on the danceability\r\n", - "density_estimate_dance <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = danceability, fill = artist_top_genre, color = artist_top_genre)) +\r\n", - " geom_density(size = 1, alpha = 0.5) +\r\n", - " paletteer::scale_fill_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " paletteer::scale_color_paletteer_d(\"RSkittleBrewer::wildberry\")\r\n", - "\r\n", - "\r\n", - "# Patch everything together\r\n", - "library(patchwork)\r\n", - "density_estimate_2d / (density_estimate_pop + density_estimate_dance)\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vemos que há círculos concêntricos que se alinham, independentemente do gênero. Será que os gostos nigerianos convergem em um certo nível de dançabilidade para este gênero?\n", - "\n", - "De modo geral, os três gêneros se alinham em termos de popularidade e dançabilidade. Determinar agrupamentos nesses dados vagamente alinhados será um desafio. Vamos ver se um gráfico de dispersão pode ajudar nisso.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# A scatter plot of popularity and danceability\r\n", - "scatter_plot <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = popularity, y = danceability, color = artist_top_genre, shape = artist_top_genre)) +\r\n", - " geom_point(size = 2, alpha = 0.8) +\r\n", - " paletteer::scale_color_paletteer_d(\"futurevisions::mars\")\r\n", - "\r\n", - "# Add a touch of interactivity\r\n", - "ggplotly(scatter_plot)\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Um gráfico de dispersão dos mesmos eixos mostra um padrão semelhante de convergência.\n", - "\n", - "De modo geral, para agrupamento, você pode usar gráficos de dispersão para mostrar clusters de dados, então dominar esse tipo de visualização é muito útil. Na próxima lição, vamos pegar esses dados filtrados e usar o agrupamento k-means para descobrir grupos nesses dados que parecem se sobrepor de maneiras interessantes.\n", - "\n", - "## **🚀 Desafio**\n", - "\n", - "Em preparação para a próxima lição, crie um gráfico sobre os vários algoritmos de agrupamento que você pode descobrir e usar em um ambiente de produção. Que tipos de problemas o agrupamento está tentando resolver?\n", - "\n", - "## [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/28/)\n", - "\n", - "## **Revisão e Autoestudo**\n", - "\n", - "Antes de aplicar algoritmos de agrupamento, como aprendemos, é uma boa ideia entender a natureza do seu conjunto de dados. Leia mais sobre este tópico [aqui](https://www.kdnuggets.com/2019/10/right-clustering-algorithm.html)\n", - "\n", - "Aprofunde seu entendimento sobre técnicas de agrupamento:\n", - "\n", - "- [Treine e avalie modelos de agrupamento usando Tidymodels e amigos](https://rpubs.com/eR_ic/clustering)\n", - "\n", - "- Bradley Boehmke & Brandon Greenwell, [*Hands-On Machine Learning with R*](https://bradleyboehmke.github.io/HOML/)*.*\n", - "\n", - "## **Tarefa**\n", - "\n", - "[Pesquise outras visualizações para agrupamento](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/assignment.md)\n", - "\n", - "## AGRADECIMENTOS A:\n", - "\n", - "[Jen Looper](https://www.twitter.com/jenlooper) por criar a versão original em Python deste módulo ♥️\n", - "\n", - "[`Dasani Madipalli`](https://twitter.com/dasani_decoded) por criar as ilustrações incríveis que tornam os conceitos de aprendizado de máquina mais interpretáveis e fáceis de entender.\n", - "\n", - "Feliz aprendizado,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Gold Microsoft Learn Student Ambassador.\n" - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "anaconda-cloud": "", - "kernelspec": { - "display_name": "R", - "language": "R", - "name": "ir" - }, - "language_info": { - "codemirror_mode": "r", - "file_extension": ".r", - "mimetype": "text/x-r-source", - "name": "R", - "pygments_lexer": "r", - "version": "3.4.1" - }, - "coopTranslator": { - "original_hash": "99c36449cad3708a435f6798cfa39972", - "translation_date": "2025-08-29T23:31:07+00:00", - "source_file": "5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/br/5-Clustering/1-Visualize/solution/notebook.ipynb b/translations/br/5-Clustering/1-Visualize/solution/notebook.ipynb deleted file mode 100644 index 23501d7a7..000000000 --- a/translations/br/5-Clustering/1-Visualize/solution/notebook.ipynb +++ /dev/null @@ -1,874 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Defaulting to user installation because normal site-packages is not writeable\n", - "Requirement already satisfied: seaborn in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (0.11.2)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (3.5.0)\n", - "Requirement already satisfied: numpy>=1.15 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (1.21.4)\n", - "Requirement already satisfied: pandas>=0.23 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (1.3.4)\n", - "Requirement already satisfied: scipy>=1.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (1.7.2)\n", - "Requirement already satisfied: fonttools>=4.22.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (4.28.1)\n", - "Requirement already satisfied: pyparsing>=2.2.1 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (2.4.7)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (1.3.2)\n", - "Requirement already satisfied: pillow>=6.2.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (8.4.0)\n", - "Requirement already satisfied: cycler>=0.10 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (0.11.0)\n", - "Requirement already satisfied: packaging>=20.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (21.2)\n", - "Requirement already satisfied: setuptools-scm>=4 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (6.3.2)\n", - "Requirement already satisfied: python-dateutil>=2.7 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (2.8.2)\n", - "Requirement already satisfied: pytz>=2017.3 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from pandas>=0.23->seaborn) (2021.3)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from python-dateutil>=2.7->matplotlib>=2.2->seaborn) (1.16.0)\n", - "Requirement already satisfied: tomli>=1.0.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from setuptools-scm>=4->matplotlib>=2.2->seaborn) (1.2.2)\n", - "Requirement already satisfied: setuptools in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from setuptools-scm>=4->matplotlib>=2.2->seaborn) (59.1.1)\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "!pip install seaborn" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import pandas as pd" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n", - "
" - ], - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ] - }, - "execution_count": 4, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df = pd.read_csv(\"../../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Obter informações sobre o dataframe\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "\n", - "RangeIndex: 530 entries, 0 to 529\n", - "Data columns (total 16 columns):\n", - " # Column Non-Null Count Dtype \n", - "--- ------ -------------- ----- \n", - " 0 name 530 non-null object \n", - " 1 album 530 non-null object \n", - " 2 artist 530 non-null object \n", - " 3 artist_top_genre 530 non-null object \n", - " 4 release_date 530 non-null int64 \n", - " 5 length 530 non-null int64 \n", - " 6 popularity 530 non-null int64 \n", - " 7 danceability 530 non-null float64\n", - " 8 acousticness 530 non-null float64\n", - " 9 energy 530 non-null float64\n", - " 10 instrumentalness 530 non-null float64\n", - " 11 liveness 530 non-null float64\n", - " 12 loudness 530 non-null float64\n", - " 13 speechiness 530 non-null float64\n", - " 14 tempo 530 non-null float64\n", - " 15 time_signature 530 non-null int64 \n", - "dtypes: float64(8), int64(4), object(4)\n", - "memory usage: 66.4+ KB\n" - ] - } - ], - "source": [ - "df.info()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "name 0\n", - "album 0\n", - "artist 0\n", - "artist_top_genre 0\n", - "release_date 0\n", - "length 0\n", - "popularity 0\n", - "danceability 0\n", - "acousticness 0\n", - "energy 0\n", - "instrumentalness 0\n", - "liveness 0\n", - "loudness 0\n", - "speechiness 0\n", - "tempo 0\n", - "time_signature 0\n", - "dtype: int64" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.isnull().sum()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Observe os valores gerais dos dados. Note que a popularidade pode ser '0' - e há muitas linhas com esse valor\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
release_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
count530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000
mean2015.390566222298.16981117.5075470.7416190.2654120.7606230.0163050.147308-4.9530110.130748116.4878643.986792
std3.13168839696.82225918.9922120.1175220.2083420.1485330.0903210.1235882.4641860.09293923.5186010.333701
min1998.00000089488.0000000.0000000.2550000.0006650.1110000.0000000.028300-19.3620000.02780061.6950003.000000
25%2014.000000199305.0000000.0000000.6810000.0895250.6690000.0000000.075650-6.2987500.059100102.9612504.000000
50%2016.000000218509.00000013.0000000.7610000.2205000.7845000.0000040.103500-4.5585000.097950112.7145004.000000
75%2017.000000242098.50000031.0000000.8295000.4030000.8757500.0002340.164000-3.3310000.177000125.0392504.000000
max2020.000000511738.00000073.0000000.9660000.9540000.9950000.9100000.8110000.5820000.514000206.0070005.000000
\n", - "
" - ], - "text/plain": [ - " release_date length popularity danceability acousticness \\\n", - "count 530.000000 530.000000 530.000000 530.000000 530.000000 \n", - "mean 2015.390566 222298.169811 17.507547 0.741619 0.265412 \n", - "std 3.131688 39696.822259 18.992212 0.117522 0.208342 \n", - "min 1998.000000 89488.000000 0.000000 0.255000 0.000665 \n", - "25% 2014.000000 199305.000000 0.000000 0.681000 0.089525 \n", - "50% 2016.000000 218509.000000 13.000000 0.761000 0.220500 \n", - "75% 2017.000000 242098.500000 31.000000 0.829500 0.403000 \n", - "max 2020.000000 511738.000000 73.000000 0.966000 0.954000 \n", - "\n", - " energy instrumentalness liveness loudness speechiness \\\n", - "count 530.000000 530.000000 530.000000 530.000000 530.000000 \n", - "mean 0.760623 0.016305 0.147308 -4.953011 0.130748 \n", - "std 0.148533 0.090321 0.123588 2.464186 0.092939 \n", - "min 0.111000 0.000000 0.028300 -19.362000 0.027800 \n", - "25% 0.669000 0.000000 0.075650 -6.298750 0.059100 \n", - "50% 0.784500 0.000004 0.103500 -4.558500 0.097950 \n", - "75% 0.875750 0.000234 0.164000 -3.331000 0.177000 \n", - "max 0.995000 0.910000 0.811000 0.582000 0.514000 \n", - "\n", - " tempo time_signature \n", - "count 530.000000 530.000000 \n", - "mean 116.487864 3.986792 \n", - "std 23.518601 0.333701 \n", - "min 61.695000 3.000000 \n", - "25% 102.961250 4.000000 \n", - "50% 112.714500 4.000000 \n", - "75% 125.039250 4.000000 \n", - "max 206.007000 5.000000 " - ] - }, - "execution_count": 7, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.describe()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "execution_count": 8, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "import seaborn as sns\n", - "\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top[:5].index,y=top[:5].values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Guia de Gêneros no Spotify\n", - "\n", - "## Introdução\n", - "\n", - "Este documento fornece uma visão geral dos gêneros musicais disponíveis no Spotify. Ele é projetado para ajudar os desenvolvedores e usuários a entenderem como os gêneros são classificados e utilizados na plataforma.\n", - "\n", - "## Gêneros Suportados\n", - "\n", - "Abaixo está uma lista de gêneros atualmente suportados no Spotify:\n", - "\n", - "- Pop\n", - "- Rock\n", - "- Hip-Hop\n", - "- Jazz\n", - "- Clássico\n", - "- Eletrônica\n", - "- Country\n", - "- Reggae\n", - "- Blues\n", - "- Funk\n", - "- Soul\n", - "- R&B\n", - "- Metal\n", - "- Punk\n", - "- Alternativo\n", - "- Indie\n", - "- Folk\n", - "- Gospel\n", - "- Latino\n", - "- K-Pop\n", - "- Afrobeat\n", - "- Dance\n", - "- House\n", - "- Techno\n", - "- Trance\n", - "- Drum and Bass\n", - "- Dubstep\n", - "- Trap\n", - "- Música Infantil\n", - "- Música de Filme\n", - "- Música de Teatro\n", - "- Música Tradicional\n", - "- Música Instrumental\n", - "- Música Ambiental\n", - "- Música Étnica\n", - "- Música Experimental\n", - "\n", - "[!NOTE] Esta lista pode ser atualizada periodicamente para refletir novos gêneros adicionados ao Spotify.\n", - "\n", - "## Gêneros Não Classificados\n", - "\n", - "Alguns gêneros podem não ser classificados no Spotify devido à sua natureza específica ou falta de dados suficientes. Esses gêneros não são exibidos na lista acima.\n", - "\n", - "[!TIP] Se você não encontrar um gênero específico, tente usar palavras-chave relacionadas para explorar músicas semelhantes.\n", - "\n", - "## Conclusão\n", - "\n", - "Compreender os gêneros disponíveis no Spotify pode melhorar significativamente a experiência do usuário, permitindo uma navegação mais eficiente e personalizada. Use esta lista como referência para explorar a vasta biblioteca musical da plataforma.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "df = df[df['artist_top_genre'] != 'Missing']\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "execution_count": 10, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "corrmat = df.corr()\n", - "f, ax = plt.subplots(figsize=(12, 9))\n", - "sns.heatmap(corrmat, vmax=.8, square=True);" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.set_theme(style=\"ticks\")\n", - "\n", - "# Show the joint distribution using kernel density estimation\n", - "g = sns.jointplot(\n", - " data=df,\n", - " x=\"popularity\", y=\"danceability\", hue=\"artist_top_genre\",\n", - " kind=\"kde\",\n", - ")" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "/Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages/seaborn/axisgrid.py:337: UserWarning: The `size` parameter has been renamed to `height`; please update your code.\n", - " warnings.warn(msg, UserWarning)\n" - ] - }, - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 13, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.FacetGrid(df, hue=\"artist_top_genre\", size=5) \\\n", - " .map(plt.scatter, \"popularity\", \"danceability\") \\\n", - " .add_legend()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6" - }, - "kernelspec": { - "display_name": "Python 3.7.0 64-bit ('3.7')", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.9" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "c61deff2839902ac8cb4ed411eb10fee", - "translation_date": "2025-08-29T23:26:27+00:00", - "source_file": "5-Clustering/1-Visualize/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/README.md b/translations/br/5-Clustering/2-K-Means/README.md deleted file mode 100644 index ec566db99..000000000 --- a/translations/br/5-Clustering/2-K-Means/README.md +++ /dev/null @@ -1,261 +0,0 @@ - -# K-Means clustering - -## [Pre-lecture quiz](https://ff-quizzes.netlify.app/en/ml/) - -Nesta lição, você aprenderá como criar clusters usando Scikit-learn e o conjunto de dados de música nigeriana que você importou anteriormente. Vamos abordar os fundamentos do K-Means para Clustering. Lembre-se de que, como você aprendeu na lição anterior, existem várias maneiras de trabalhar com clusters, e o método que você usa depende dos seus dados. Vamos experimentar o K-Means, pois é a técnica de clustering mais comum. Vamos começar! - -Termos que você aprenderá: - -- Pontuação de Silhouette -- Método do cotovelo -- Inércia -- Variância - -## Introdução - -[K-Means Clustering](https://wikipedia.org/wiki/K-means_clustering) é um método derivado do domínio de processamento de sinais. Ele é usado para dividir e particionar grupos de dados em 'k' clusters usando uma série de observações. Cada observação trabalha para agrupar um determinado ponto de dados mais próximo de sua 'média' mais próxima, ou o ponto central de um cluster. - -Os clusters podem ser visualizados como [diagramas de Voronoi](https://wikipedia.org/wiki/Voronoi_diagram), que incluem um ponto (ou 'semente') e sua região correspondente. - -![voronoi diagram](../../../../5-Clustering/2-K-Means/images/voronoi.png) - -> Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -O processo de clustering K-Means [é executado em um processo de três etapas](https://scikit-learn.org/stable/modules/clustering.html#k-means): - -1. O algoritmo seleciona um número k de pontos centrais ao amostrar do conjunto de dados. Depois disso, ele entra em um loop: - 1. Ele atribui cada amostra ao centróide mais próximo. - 2. Ele cria novos centróides calculando o valor médio de todas as amostras atribuídas aos centróides anteriores. - 3. Em seguida, calcula a diferença entre os novos e antigos centróides e repete até que os centróides sejam estabilizados. - -Uma desvantagem de usar K-Means é o fato de que você precisará estabelecer 'k', ou seja, o número de centróides. Felizmente, o 'método do cotovelo' ajuda a estimar um bom valor inicial para 'k'. Você experimentará isso em breve. - -## Pré-requisito - -Você trabalhará no arquivo [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/2-K-Means/notebook.ipynb) desta lição, que inclui a importação de dados e a limpeza preliminar que você fez na última lição. - -## Exercício - preparação - -Comece revisando os dados das músicas. - -1. Crie um boxplot, chamando `boxplot()` para cada coluna: - - ```python - plt.figure(figsize=(20,20), dpi=200) - - plt.subplot(4,3,1) - sns.boxplot(x = 'popularity', data = df) - - plt.subplot(4,3,2) - sns.boxplot(x = 'acousticness', data = df) - - plt.subplot(4,3,3) - sns.boxplot(x = 'energy', data = df) - - plt.subplot(4,3,4) - sns.boxplot(x = 'instrumentalness', data = df) - - plt.subplot(4,3,5) - sns.boxplot(x = 'liveness', data = df) - - plt.subplot(4,3,6) - sns.boxplot(x = 'loudness', data = df) - - plt.subplot(4,3,7) - sns.boxplot(x = 'speechiness', data = df) - - plt.subplot(4,3,8) - sns.boxplot(x = 'tempo', data = df) - - plt.subplot(4,3,9) - sns.boxplot(x = 'time_signature', data = df) - - plt.subplot(4,3,10) - sns.boxplot(x = 'danceability', data = df) - - plt.subplot(4,3,11) - sns.boxplot(x = 'length', data = df) - - plt.subplot(4,3,12) - sns.boxplot(x = 'release_date', data = df) - ``` - - Esses dados estão um pouco ruidosos: ao observar cada coluna como um boxplot, você pode ver outliers. - - ![outliers](../../../../5-Clustering/2-K-Means/images/boxplots.png) - -Você poderia percorrer o conjunto de dados e remover esses outliers, mas isso tornaria os dados bastante reduzidos. - -1. Por enquanto, escolha quais colunas você usará para o exercício de clustering. Escolha aquelas com intervalos semelhantes e codifique a coluna `artist_top_genre` como dados numéricos: - - ```python - from sklearn.preprocessing import LabelEncoder - le = LabelEncoder() - - X = df.loc[:, ('artist_top_genre','popularity','danceability','acousticness','loudness','energy')] - - y = df['artist_top_genre'] - - X['artist_top_genre'] = le.fit_transform(X['artist_top_genre']) - - y = le.transform(y) - ``` - -1. Agora você precisa escolher quantos clusters deseja segmentar. Você sabe que há 3 gêneros musicais que extraímos do conjunto de dados, então vamos tentar 3: - - ```python - from sklearn.cluster import KMeans - - nclusters = 3 - seed = 0 - - km = KMeans(n_clusters=nclusters, random_state=seed) - km.fit(X) - - # Predict the cluster for each data point - - y_cluster_kmeans = km.predict(X) - y_cluster_kmeans - ``` - -Você verá um array impresso com clusters previstos (0, 1 ou 2) para cada linha do dataframe. - -1. Use esse array para calcular uma 'pontuação de silhouette': - - ```python - from sklearn import metrics - score = metrics.silhouette_score(X, y_cluster_kmeans) - score - ``` - -## Pontuação de Silhouette - -Procure uma pontuação de silhouette mais próxima de 1. Essa pontuação varia de -1 a 1, e se a pontuação for 1, o cluster é denso e bem separado de outros clusters. Um valor próximo de 0 representa clusters sobrepostos com amostras muito próximas do limite de decisão dos clusters vizinhos. [(Fonte)](https://dzone.com/articles/kmeans-silhouette-score-explained-with-python-exam) - -Nossa pontuação é **0.53**, bem no meio. Isso indica que nossos dados não são particularmente adequados para este tipo de clustering, mas vamos continuar. - -### Exercício - construir um modelo - -1. Importe `KMeans` e inicie o processo de clustering. - - ```python - from sklearn.cluster import KMeans - wcss = [] - - for i in range(1, 11): - kmeans = KMeans(n_clusters = i, init = 'k-means++', random_state = 42) - kmeans.fit(X) - wcss.append(kmeans.inertia_) - - ``` - - Há algumas partes aqui que merecem explicação. - - > 🎓 range: Estas são as iterações do processo de clustering. - - > 🎓 random_state: "Determina a geração de números aleatórios para a inicialização dos centróides." [Fonte](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans) - - > 🎓 WCSS: "soma dos quadrados dentro do cluster" mede a distância média quadrada de todos os pontos dentro de um cluster até o centróide do cluster. [Fonte](https://medium.com/@ODSC/unsupervised-learning-evaluating-clusters-bd47eed175ce). - - > 🎓 Inércia: Os algoritmos K-Means tentam escolher centróides para minimizar a 'inércia', "uma medida de quão internamente coerentes os clusters são." [Fonte](https://scikit-learn.org/stable/modules/clustering.html). O valor é adicionado à variável wcss em cada iteração. - - > 🎓 k-means++: No [Scikit-learn](https://scikit-learn.org/stable/modules/clustering.html#k-means), você pode usar a otimização 'k-means++', que "inicializa os centróides para serem (geralmente) distantes uns dos outros, levando a resultados provavelmente melhores do que a inicialização aleatória." - -### Método do cotovelo - -Anteriormente, você presumiu que, como segmentou 3 gêneros musicais, deveria escolher 3 clusters. Mas será que é isso mesmo? - -1. Use o 'método do cotovelo' para ter certeza. - - ```python - plt.figure(figsize=(10,5)) - sns.lineplot(x=range(1, 11), y=wcss, marker='o', color='red') - plt.title('Elbow') - plt.xlabel('Number of clusters') - plt.ylabel('WCSS') - plt.show() - ``` - - Use a variável `wcss` que você construiu na etapa anterior para criar um gráfico mostrando onde está a 'curva' no cotovelo, que indica o número ideal de clusters. Talvez seja **3**! - - ![elbow method](../../../../5-Clustering/2-K-Means/images/elbow.png) - -## Exercício - exibir os clusters - -1. Tente o processo novamente, desta vez configurando três clusters, e exiba os clusters como um gráfico de dispersão: - - ```python - from sklearn.cluster import KMeans - kmeans = KMeans(n_clusters = 3) - kmeans.fit(X) - labels = kmeans.predict(X) - plt.scatter(df['popularity'],df['danceability'],c = labels) - plt.xlabel('popularity') - plt.ylabel('danceability') - plt.show() - ``` - -1. Verifique a precisão do modelo: - - ```python - labels = kmeans.labels_ - - correct_labels = sum(y == labels) - - print("Result: %d out of %d samples were correctly labeled." % (correct_labels, y.size)) - - print('Accuracy score: {0:0.2f}'. format(correct_labels/float(y.size))) - ``` - - A precisão deste modelo não é muito boa, e o formato dos clusters dá uma pista do porquê. - - ![clusters](../../../../5-Clustering/2-K-Means/images/clusters.png) - - Esses dados são muito desequilibrados, pouco correlacionados e há muita variância entre os valores das colunas para formar bons clusters. Na verdade, os clusters que se formam provavelmente são fortemente influenciados ou enviesados pelas três categorias de gênero que definimos acima. Isso foi um processo de aprendizado! - - Na documentação do Scikit-learn, você pode ver que um modelo como este, com clusters não muito bem demarcados, tem um problema de 'variância': - - ![problem models](../../../../5-Clustering/2-K-Means/images/problems.png) - > Infográfico do Scikit-learn - -## Variância - -Variância é definida como "a média das diferenças quadradas em relação à média" [(Fonte)](https://www.mathsisfun.com/data/standard-deviation.html). No contexto deste problema de clustering, refere-se a dados cujos números do conjunto tendem a divergir um pouco demais da média. - -✅ Este é um ótimo momento para pensar em todas as maneiras de corrigir esse problema. Ajustar os dados um pouco mais? Usar colunas diferentes? Usar um algoritmo diferente? Dica: Experimente [escalar seus dados](https://www.mygreatlearning.com/blog/learning-data-science-with-k-means-clustering/) para normalizá-los e testar outras colunas. - -> Experimente este '[calculador de variância](https://www.calculatorsoup.com/calculators/statistics/variance-calculator.php)' para entender melhor o conceito. - ---- - -## 🚀Desafio - -Passe algum tempo com este notebook ajustando os parâmetros. Você consegue melhorar a precisão do modelo limpando mais os dados (removendo outliers, por exemplo)? Você pode usar pesos para dar mais importância a determinadas amostras de dados. O que mais você pode fazer para criar clusters melhores? - -Dica: Experimente escalar seus dados. Há código comentado no notebook que adiciona escala padrão para fazer as colunas de dados se parecerem mais em termos de intervalo. Você descobrirá que, embora a pontuação de silhouette diminua, a 'curva' no gráfico do cotovelo se suaviza. Isso ocorre porque deixar os dados sem escala permite que dados com menos variância tenham mais peso. Leia um pouco mais sobre esse problema [aqui](https://stats.stackexchange.com/questions/21222/are-mean-normalization-and-feature-scaling-needed-for-k-means-clustering/21226#21226). - -## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Dê uma olhada em um Simulador de K-Means [como este](https://user.ceng.metu.edu.tr/~akifakkus/courses/ceng574/k-means/). Você pode usar esta ferramenta para visualizar pontos de dados de amostra e determinar seus centróides. Você pode editar a aleatoriedade dos dados, o número de clusters e o número de centróides. Isso ajuda você a ter uma ideia de como os dados podem ser agrupados? - -Além disso, veja [este material sobre K-Means](https://stanford.edu/~cpiech/cs221/handouts/kmeans.html) da Stanford. - -## Tarefa - -[Experimente diferentes métodos de clustering](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/assignment.md b/translations/br/5-Clustering/2-K-Means/assignment.md deleted file mode 100644 index 1dd50615f..000000000 --- a/translations/br/5-Clustering/2-K-Means/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Experimente diferentes métodos de agrupamento - -## Instruções - -Nesta lição, você aprendeu sobre o agrupamento K-Means. Às vezes, o K-Means não é adequado para seus dados. Crie um notebook usando dados destas lições ou de outra fonte (credite sua fonte) e mostre um método de agrupamento diferente que NÃO utilize K-Means. O que você aprendeu? - -## Rubrica - -| Critério | Exemplary | Adequado | Precisa Melhorar | -| --------- | --------------------------------------------------------------- | -------------------------------------------------------------------- | ---------------------------- | -| | Um notebook é apresentado com um modelo de agrupamento bem documentado | Um notebook é apresentado sem boa documentação e/ou incompleto | Trabalho incompleto é enviado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/notebook.ipynb b/translations/br/5-Clustering/2-K-Means/notebook.ipynb deleted file mode 100644 index 77e2957ab..000000000 --- a/translations/br/5-Clustering/2-K-Means/notebook.ipynb +++ /dev/null @@ -1,231 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "3e5c8ab363e8d88f566d4365efc7e0bd", - "translation_date": "2025-08-29T23:32:42+00:00", - "source_file": "5-Clustering/2-K-Means/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: seaborn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.11.1)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.19.2)\n", - "Requirement already satisfied: pandas>=0.23 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.1.2)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.4.1)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (3.1.0)\n", - "Requirement already satisfied: python-dateutil>=2.7.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2.8.0)\n", - "Requirement already satisfied: pytz>=2017.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2019.1)\n", - "Requirement already satisfied: cycler>=0.10 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (0.10.0)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (1.1.0)\n", - "Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (2.4.0)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from python-dateutil>=2.7.3->pandas>=0.23->seaborn) (1.12.0)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib>=2.2->seaborn) (45.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install seaborn" - ] - }, - { - "source": [ - "Comece de onde terminamos na última aula, com os dados importados e filtrados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n
" - }, - "metadata": {}, - "execution_count": 6 - } - ], - "source": [ - "\n", - "import matplotlib.pyplot as plt\n", - "import pandas as pd\n", - "import seaborn as sns\n", - "\n", - "\n", - "df = pd.read_csv(\"../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "source": [ - "Vamos focar apenas em 3 gêneros. Talvez possamos formar 3 clusters!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "metadata": {}, - "execution_count": 7 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "5 Kasala Pioneers \n", - "6 Pull Up Everything Pretty \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "5 DRB Lasgidi nigerian pop 2020 184800 26 \n", - "6 prettyboydo nigerian pop 2018 202648 29 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "5 0.803 0.1270 0.525 0.000007 0.1290 -10.034 \n", - "6 0.818 0.4520 0.587 0.004490 0.5900 -9.840 \n", - "\n", - " speechiness tempo time_signature \n", - "1 0.3600 129.993 3 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 \n", - "5 0.1970 100.103 4 \n", - "6 0.1990 95.842 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
5KasalaPioneersDRB Lasgidinigerian pop2020184800260.8030.12700.5250.0000070.1290-10.0340.1970100.1034
6Pull UpEverything Prettyprettyboydonigerian pop2018202648290.8180.45200.5870.0044900.5900-9.8400.199095.8424
\n
" - }, - "metadata": {}, - "execution_count": 8 - } - ], - "source": [ - "df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/solution/Julia/README.md b/translations/br/5-Clustering/2-K-Means/solution/Julia/README.md deleted file mode 100644 index 7fbb62b4d..000000000 --- a/translations/br/5-Clustering/2-K-Means/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb b/translations/br/5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb deleted file mode 100644 index 192518acb..000000000 --- a/translations/br/5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb +++ /dev/null @@ -1,639 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 0, - "metadata": { - "anaconda-cloud": "", - "kernelspec": { - "display_name": "R", - "language": "R", - "name": "ir" - }, - "language_info": { - "codemirror_mode": "r", - "file_extension": ".r", - "mimetype": "text/x-r-source", - "name": "R", - "pygments_lexer": "r", - "version": "3.4.1" - }, - "colab": { - "name": "lesson_14.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "coopTranslator": { - "original_hash": "ad65fb4aad0a156b42216e4929f490fc", - "translation_date": "2025-08-29T23:39:22+00:00", - "source_file": "5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "GULATlQXLXyR" - }, - "source": [ - "## Explore o agrupamento K-Means usando R e os princípios de dados Tidy.\n", - "\n", - "### [**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/29/)\n", - "\n", - "Nesta lição, você aprenderá como criar agrupamentos usando o pacote Tidymodels e outros pacotes do ecossistema R (vamos chamá-los de amigos 🧑‍🤝‍🧑), além do conjunto de dados de música nigeriana que você importou anteriormente. Vamos abordar os fundamentos do K-Means para agrupamento. Lembre-se de que, como você aprendeu na lição anterior, existem várias maneiras de trabalhar com agrupamentos, e o método que você usa depende dos seus dados. Vamos experimentar o K-Means, pois é a técnica de agrupamento mais comum. Vamos começar!\n", - "\n", - "Termos que você aprenderá:\n", - "\n", - "- Pontuação Silhouette\n", - "\n", - "- Método do Cotovelo\n", - "\n", - "- Inércia\n", - "\n", - "- Variância\n", - "\n", - "### **Introdução**\n", - "\n", - "O [agrupamento K-Means](https://wikipedia.org/wiki/K-means_clustering) é um método derivado do domínio do processamento de sinais. Ele é usado para dividir e particionar grupos de dados em `k agrupamentos` com base em semelhanças em suas características.\n", - "\n", - "Os agrupamentos podem ser visualizados como [diagramas de Voronoi](https://wikipedia.org/wiki/Voronoi_diagram), que incluem um ponto (ou 'semente') e sua região correspondente.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Jen Looper
\n", - "\n", - "O agrupamento K-Means segue os seguintes passos:\n", - "\n", - "1. O cientista de dados começa especificando o número desejado de agrupamentos a serem criados.\n", - "\n", - "2. Em seguida, o algoritmo seleciona aleatoriamente K observações do conjunto de dados para servir como os centros iniciais dos agrupamentos (ou seja, centróides).\n", - "\n", - "3. Depois, cada uma das observações restantes é atribuída ao centróide mais próximo.\n", - "\n", - "4. Em seguida, as novas médias de cada agrupamento são calculadas e o centróide é movido para a nova média.\n", - "\n", - "5. Agora que os centros foram recalculados, cada observação é verificada novamente para ver se pode estar mais próxima de um agrupamento diferente. Todos os objetos são realocados novamente usando as médias atualizadas dos agrupamentos. As etapas de atribuição de agrupamento e atualização dos centróides são repetidas iterativamente até que as atribuições de agrupamento parem de mudar (ou seja, quando a convergência é alcançada). Normalmente, o algoritmo termina quando cada nova iteração resulta em um movimento insignificante dos centróides e os agrupamentos se tornam estáticos.\n", - "\n", - "
\n", - "\n", - "> Observe que, devido à randomização das k observações iniciais usadas como centróides iniciais, podemos obter resultados ligeiramente diferentes a cada vez que aplicamos o procedimento. Por essa razão, a maioria dos algoritmos utiliza vários *inícios aleatórios* e escolhe a iteração com o menor WCSS. Assim, é altamente recomendável sempre executar o K-Means com vários valores de *nstart* para evitar um *ótimo local indesejado.*\n", - "\n", - "
\n", - "\n", - "Esta breve animação usando a [arte](https://github.com/allisonhorst/stats-illustrations) de Allison Horst explica o processo de agrupamento:\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "Uma questão fundamental que surge no agrupamento é: como saber em quantos agrupamentos separar seus dados? Uma desvantagem do uso do K-Means é o fato de que você precisará estabelecer `k`, ou seja, o número de `centróides`. Felizmente, o `método do cotovelo` ajuda a estimar um bom valor inicial para `k`. Você experimentará isso em breve.\n", - "\n", - "### \n", - "\n", - "**Pré-requisito**\n", - "\n", - "Vamos continuar de onde paramos na [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb), onde analisamos o conjunto de dados, criamos várias visualizações e filtramos o conjunto de dados para observações de interesse. Certifique-se de conferir!\n", - "\n", - "Vamos precisar de alguns pacotes para concluir este módulo. Você pode instalá-los com: `install.packages(c('tidyverse', 'tidymodels', 'cluster', 'summarytools', 'plotly', 'paletteer', 'factoextra', 'patchwork'))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala para você caso algum esteja faltando.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "ah_tBi58LXyi" - }, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load('tidyverse', 'tidymodels', 'cluster', 'summarytools', 'plotly', 'paletteer', 'factoextra', 'patchwork')\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "7e--UCUTLXym" - }, - "source": [ - "Vamos começar com tudo!\n", - "\n", - "## 1. Uma dança com dados: Reduza para os 3 gêneros musicais mais populares\n", - "\n", - "Este é um resumo do que fizemos na lição anterior. Vamos explorar e analisar alguns dados!\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Ycamx7GGLXyn" - }, - "source": [ - "# Load the core tidyverse and make it available in your current R session\n", - "library(tidyverse)\n", - "\n", - "# Import the data into a tibble\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/5-Clustering/data/nigerian-songs.csv\", show_col_types = FALSE)\n", - "\n", - "# Narrow down to top 3 popular genres\n", - "nigerian_songs <- df %>% \n", - " # Concentrate on top 3 genres\n", - " filter(artist_top_genre %in% c(\"afro dancehall\", \"afropop\",\"nigerian pop\")) %>% \n", - " # Remove unclassified observations\n", - " filter(popularity != 0)\n", - "\n", - "\n", - "\n", - "# Visualize popular genres using bar plots\n", - "theme_set(theme_light())\n", - "nigerian_songs %>%\n", - " count(artist_top_genre) %>%\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\n", - " fill = artist_top_genre)) +\n", - " geom_col(alpha = 0.8) +\n", - " paletteer::scale_fill_paletteer_d(\"ggsci::category10_d3\") +\n", - " ggtitle(\"Top genres\") +\n", - " theme(plot.title = element_text(hjust = 0.5))\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "b5h5zmkPLXyp" - }, - "source": [ - "🤩 Isso foi ótimo!\n", - "\n", - "## 2. Mais exploração de dados.\n", - "\n", - "Quão limpos estão esses dados? Vamos verificar a presença de outliers usando boxplots. Vamos nos concentrar em colunas numéricas com menos outliers (embora você possa limpar os outliers, se preferir). Boxplots podem mostrar o intervalo dos dados e ajudar a escolher quais colunas usar. Observe que os boxplots não mostram a variância, um elemento importante para dados bem agrupáveis. Por favor, veja [esta discussão](https://stats.stackexchange.com/questions/91536/deduce-variance-from-boxplot) para leitura adicional.\n", - "\n", - "[Boxplots](https://en.wikipedia.org/wiki/Box_plot) são usados para representar graficamente a distribuição de dados `numéricos`, então vamos começar *selecionando* todas as colunas numéricas junto com os gêneros musicais populares.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "HhNreJKLLXyq" - }, - "source": [ - "# Select top genre column and all other numeric columns\n", - "df_numeric <- nigerian_songs %>% \n", - " select(artist_top_genre, where(is.numeric)) \n", - "\n", - "# Display the data\n", - "df_numeric %>% \n", - " slice_head(n = 5)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "uYXrwJRaLXyq" - }, - "source": [ - "Veja como o seletor `where` facilita isso 💁? Explore outras funções semelhantes [aqui](https://tidyselect.r-lib.org/).\n", - "\n", - "Como vamos criar um boxplot para cada característica numérica e queremos evitar o uso de loops, vamos reformular nossos dados para um formato *mais longo*, o que nos permitirá aproveitar os `facets` - subgráficos que exibem cada um um subconjunto dos dados.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "gd5bR3f8LXys" - }, - "source": [ - "# Pivot data from wide to long\n", - "df_numeric_long <- df_numeric %>% \n", - " pivot_longer(!artist_top_genre, names_to = \"feature_names\", values_to = \"values\") \n", - "\n", - "# Print out data\n", - "df_numeric_long %>% \n", - " slice_head(n = 15)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "-7tE1swnLXyv" - }, - "source": [ - "Muito mais longo! Agora é hora de alguns `ggplots`! Então, qual `geom` usaremos?\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "r88bIsyuLXyy" - }, - "source": [ - "# Make a box plot\n", - "df_numeric_long %>% \n", - " ggplot(mapping = aes(x = feature_names, y = values, fill = feature_names)) +\n", - " geom_boxplot() +\n", - " facet_wrap(~ feature_names, ncol = 4, scales = \"free\") +\n", - " theme(legend.position = \"none\")\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "EYVyKIUELXyz" - }, - "source": [ - "Fácil-gg!\n", - "\n", - "Agora podemos ver que esses dados estão um pouco ruidosos: ao observar cada coluna como um boxplot, é possível identificar valores atípicos. Você poderia percorrer o conjunto de dados e remover esses valores atípicos, mas isso tornaria os dados bem reduzidos.\n", - "\n", - "Por enquanto, vamos escolher quais colunas usaremos para o nosso exercício de agrupamento. Vamos selecionar as colunas numéricas com intervalos semelhantes. Poderíamos codificar o `artist_top_genre` como numérico, mas vamos descartá-lo por enquanto.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "-wkpINyZLXy0" - }, - "source": [ - "# Select variables with similar ranges\n", - "df_numeric_select <- df_numeric %>% \n", - " select(popularity, danceability, acousticness, loudness, energy) \n", - "\n", - "# Normalize data\n", - "# df_numeric_select <- scale(df_numeric_select)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "D7dLzgpqLXy1" - }, - "source": [ - "## 3. Computando agrupamento k-means em R\n", - "\n", - "Podemos calcular k-means em R usando a função integrada `kmeans`, veja `help(\"kmeans()\")`. A função `kmeans()` aceita um data frame com todas as colunas numéricas como seu argumento principal.\n", - "\n", - "O primeiro passo ao usar o agrupamento k-means é especificar o número de clusters (k) que serão gerados na solução final. Sabemos que há 3 gêneros musicais que extraímos do conjunto de dados, então vamos tentar com 3:\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "uC4EQ5w7LXy5" - }, - "source": [ - "set.seed(2056)\n", - "# Kmeans clustering for 3 clusters\n", - "kclust <- kmeans(\n", - " df_numeric_select,\n", - " # Specify the number of clusters\n", - " centers = 3,\n", - " # How many random initial configurations\n", - " nstart = 25\n", - ")\n", - "\n", - "# Display clustering object\n", - "kclust\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "hzfhscWrLXy-" - }, - "source": [ - "O objeto kmeans contém várias informações que estão bem explicadas em `help(\"kmeans()\")`. Por enquanto, vamos nos concentrar em algumas delas. Podemos ver que os dados foram agrupados em 3 clusters com tamanhos de 65, 110 e 111. A saída também contém os centros dos clusters (médias) para os 3 grupos em relação às 5 variáveis.\n", - "\n", - "O vetor de agrupamento é a atribuição de cluster para cada observação. Vamos usar a função `augment` para adicionar a atribuição de cluster ao conjunto de dados original.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "0XwwpFGQLXy_" - }, - "source": [ - "# Add predicted cluster assignment to data set\n", - "augment(kclust, df_numeric_select) %>% \n", - " relocate(.cluster) %>% \n", - " slice_head(n = 10)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "NXIVXXACLXzA" - }, - "source": [ - "Perfeito, acabamos de dividir nosso conjunto de dados em um conjunto de 3 grupos. Então, quão boa é nossa clusterização 🤷? Vamos dar uma olhada no `Silhouette score`.\n", - "\n", - "### **Silhouette score**\n", - "\n", - "[A análise de Silhouette](https://en.wikipedia.org/wiki/Silhouette_(clustering)) pode ser usada para estudar a distância de separação entre os clusters resultantes. Esse score varia de -1 a 1, e se o score estiver próximo de 1, o cluster é denso e bem separado dos outros clusters. Um valor próximo de 0 representa clusters sobrepostos com amostras muito próximas da fronteira de decisão dos clusters vizinhos. [fonte](https://dzone.com/articles/kmeans-silhouette-score-explained-with-python-exam).\n", - "\n", - "O método de silhouette médio calcula a média do silhouette das observações para diferentes valores de *k*. Um alto score médio de silhouette indica uma boa clusterização.\n", - "\n", - "A função `silhouette` no pacote de cluster é usada para calcular a largura média do silhouette.\n", - "\n", - "> O silhouette pode ser calculado com qualquer [métrica de distância](https://en.wikipedia.org/wiki/Distance \"Distance\"), como a [distância Euclidiana](https://en.wikipedia.org/wiki/Euclidean_distance \"Euclidean distance\") ou a [distância Manhattan](https://en.wikipedia.org/wiki/Manhattan_distance \"Manhattan distance\"), que discutimos na [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb).\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Jn0McL28LXzB" - }, - "source": [ - "# Load cluster package\n", - "library(cluster)\n", - "\n", - "# Compute average silhouette score\n", - "ss <- silhouette(kclust$cluster,\n", - " # Compute euclidean distance\n", - " dist = dist(df_numeric_select))\n", - "mean(ss[, 3])\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "QyQRn97nLXzC" - }, - "source": [ - "Nosso índice é **0,549**, bem no meio. Isso indica que nossos dados não são particularmente adequados para este tipo de agrupamento. Vamos verificar se conseguimos confirmar essa suspeita visualmente. O [pacote factoextra](https://rpkgs.datanovia.com/factoextra/index.html) fornece funções (`fviz_cluster()`) para visualizar agrupamentos.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "7a6Km1_FLXzD" - }, - "source": [ - "library(factoextra)\n", - "\n", - "# Visualize clustering results\n", - "fviz_cluster(kclust, df_numeric_select)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "IBwCWt-0LXzD" - }, - "source": [ - "A sobreposição nos clusters indica que nossos dados não são particularmente adequados para esse tipo de agrupamento, mas vamos continuar.\n", - "\n", - "## 4. Determinando o número ideal de clusters\n", - "\n", - "Uma pergunta fundamental que frequentemente surge no agrupamento K-Means é esta: sem rótulos de classe conhecidos, como você sabe em quantos clusters deve separar seus dados?\n", - "\n", - "Uma maneira de tentar descobrir é usar uma amostra de dados para `criar uma série de modelos de agrupamento` com um número crescente de clusters (por exemplo, de 1 a 10) e avaliar métricas de agrupamento, como o **Silhouette score.**\n", - "\n", - "Vamos determinar o número ideal de clusters calculando o algoritmo de agrupamento para diferentes valores de *k* e avaliando o **Within Cluster Sum of Squares** (WCSS). O total de soma de quadrados dentro dos clusters (WCSS) mede a compacidade do agrupamento, e queremos que ele seja o menor possível, com valores mais baixos indicando que os pontos de dados estão mais próximos.\n", - "\n", - "Vamos explorar o efeito de diferentes escolhas de `k`, de 1 a 10, nesse agrupamento.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "hSeIiylDLXzE" - }, - "source": [ - "# Create a series of clustering models\n", - "kclusts <- tibble(k = 1:10) %>% \n", - " # Perform kmeans clustering for 1,2,3 ... ,10 clusters\n", - " mutate(model = map(k, ~ kmeans(df_numeric_select, centers = .x, nstart = 25)),\n", - " # Farm out clustering metrics eg WCSS\n", - " glanced = map(model, ~ glance(.x))) %>% \n", - " unnest(cols = glanced)\n", - " \n", - "\n", - "# View clustering rsulsts\n", - "kclusts\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "m7rS2U1eLXzE" - }, - "source": [ - "Agora que temos o total da soma dos quadrados dentro dos clusters (tot.withinss) para cada algoritmo de agrupamento com centro *k*, usamos o [método do cotovelo](https://en.wikipedia.org/wiki/Elbow_method_(clustering)) para encontrar o número ideal de clusters. O método consiste em plotar o WCSS como uma função do número de clusters e escolher o [cotovelo da curva](https://en.wikipedia.org/wiki/Elbow_of_the_curve \"Elbow of the curve\") como o número de clusters a ser utilizado.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "o_DjHGItLXzF" - }, - "source": [ - "set.seed(2056)\n", - "# Use elbow method to determine optimum number of clusters\n", - "kclusts %>% \n", - " ggplot(mapping = aes(x = k, y = tot.withinss)) +\n", - " geom_line(size = 1.2, alpha = 0.8, color = \"#FF7F0EFF\") +\n", - " geom_point(size = 2, color = \"#FF7F0EFF\")\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "pLYyt5XSLXzG" - }, - "source": [ - "O gráfico mostra uma grande redução no WCSS (ou seja, maior *coerência*) à medida que o número de clusters aumenta de um para dois, e uma redução adicional perceptível de dois para três clusters. Depois disso, a redução é menos acentuada, resultando em um `cotovelo` 💪 no gráfico em torno de três clusters. Isso é uma boa indicação de que há dois a três clusters de pontos de dados razoavelmente bem separados.\n", - "\n", - "Agora podemos prosseguir e extrair o modelo de clustering onde `k = 3`:\n", - "\n", - "> `pull()`: usado para extrair uma única coluna\n", - ">\n", - "> `pluck()`: usado para indexar estruturas de dados como listas\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "JP_JPKBILXzG" - }, - "source": [ - "# Extract k = 3 clustering\n", - "final_kmeans <- kclusts %>% \n", - " filter(k == 3) %>% \n", - " pull(model) %>% \n", - " pluck(1)\n", - "\n", - "\n", - "final_kmeans\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "l_PDTu8tLXzI" - }, - "source": [ - "Ótimo! Vamos visualizar os clusters obtidos. Que tal adicionar um pouco de interatividade usando `plotly`?\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "dNcleFe-LXzJ" - }, - "source": [ - "# Add predicted cluster assignment to data set\n", - "results <- augment(final_kmeans, df_numeric_select) %>% \n", - " bind_cols(df_numeric %>% select(artist_top_genre)) \n", - "\n", - "# Plot cluster assignments\n", - "clust_plt <- results %>% \n", - " ggplot(mapping = aes(x = popularity, y = danceability, color = .cluster, shape = artist_top_genre)) +\n", - " geom_point(size = 2, alpha = 0.8) +\n", - " paletteer::scale_color_paletteer_d(\"ggthemes::Tableau_10\")\n", - "\n", - "ggplotly(clust_plt)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "6JUM_51VLXzK" - }, - "source": [ - "Talvez esperássemos que cada cluster (representado por cores diferentes) tivesse gêneros distintos (representados por formas diferentes).\n", - "\n", - "Vamos dar uma olhada na precisão do modelo.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "HdIMUGq7LXzL" - }, - "source": [ - "# Assign genres to predefined integers\n", - "label_count <- results %>% \n", - " group_by(artist_top_genre) %>% \n", - " mutate(id = cur_group_id()) %>% \n", - " ungroup() %>% \n", - " summarise(correct_labels = sum(.cluster == id))\n", - "\n", - "\n", - "# Print results \n", - "cat(\"Result:\", label_count$correct_labels, \"out of\", nrow(results), \"samples were correctly labeled.\")\n", - "\n", - "cat(\"\\nAccuracy score:\", label_count$correct_labels/nrow(results))\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "C50wvaAOLXzM" - }, - "source": [ - "A precisão deste modelo não é ruim, mas também não é excelente. Pode ser que os dados não sejam adequados para o agrupamento K-Means. Esses dados são muito desequilibrados, pouco correlacionados e há muita variância entre os valores das colunas para formar bons clusters. Na verdade, os clusters que se formam provavelmente são fortemente influenciados ou distorcidos pelas três categorias de gênero que definimos acima.\n", - "\n", - "Mesmo assim, foi um processo de aprendizado interessante!\n", - "\n", - "Na documentação do Scikit-learn, você pode ver que um modelo como este, com clusters não muito bem definidos, apresenta um problema de 'variância':\n", - "\n", - "

\n", - " \n", - "

Infográfico do Scikit-learn
\n", - "\n", - "\n", - "\n", - "## **Variância**\n", - "\n", - "Variância é definida como \"a média das diferenças quadradas em relação à média\" [fonte](https://www.mathsisfun.com/data/standard-deviation.html). No contexto deste problema de agrupamento, refere-se aos dados cujos números do nosso conjunto tendem a divergir um pouco demais da média.\n", - "\n", - "✅ Este é um ótimo momento para pensar em todas as maneiras de corrigir esse problema. Ajustar os dados um pouco mais? Usar colunas diferentes? Utilizar um algoritmo diferente? Dica: Experimente [escalar seus dados](https://www.mygreatlearning.com/blog/learning-data-science-with-k-means-clustering/) para normalizá-los e testar outras colunas.\n", - "\n", - "> Experimente este '[calculador de variância](https://www.calculatorsoup.com/calculators/statistics/variance-calculator.php)' para entender melhor o conceito.\n", - "\n", - "------------------------------------------------------------------------\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Dedique algum tempo a este notebook, ajustando os parâmetros. Você consegue melhorar a precisão do modelo limpando mais os dados (removendo outliers, por exemplo)? Você pode usar pesos para dar mais importância a determinadas amostras de dados. O que mais você pode fazer para criar clusters melhores?\n", - "\n", - "Dica: Experimente escalar seus dados. Há código comentado no notebook que adiciona escalonamento padrão para fazer com que as colunas de dados se assemelhem mais em termos de intervalo. Você verá que, embora a pontuação de silhueta diminua, o 'cotovelo' no gráfico suaviza. Isso ocorre porque deixar os dados sem escala permite que dados com menos variância tenham mais peso. Leia mais sobre esse problema [aqui](https://stats.stackexchange.com/questions/21222/are-mean-normalization-and-feature-scaling-needed-for-k-means-clustering/21226#21226).\n", - "\n", - "## [**Quiz pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/30/)\n", - "\n", - "## **Revisão e Autoestudo**\n", - "\n", - "- Dê uma olhada em um simulador de K-Means [como este](https://user.ceng.metu.edu.tr/~akifakkus/courses/ceng574/k-means/). Você pode usar esta ferramenta para visualizar pontos de dados de amostra e determinar seus centróides. Você pode editar a aleatoriedade dos dados, o número de clusters e o número de centróides. Isso ajuda você a ter uma ideia de como os dados podem ser agrupados?\n", - "\n", - "- Além disso, confira [este material sobre K-Means](https://stanford.edu/~cpiech/cs221/handouts/kmeans.html) de Stanford.\n", - "\n", - "Quer testar suas habilidades recém-adquiridas de agrupamento em conjuntos de dados que se adaptam bem ao K-Means? Veja:\n", - "\n", - "- [Treine e avalie modelos de agrupamento](https://rpubs.com/eR_ic/clustering) usando Tidymodels e amigos\n", - "\n", - "- [Análise de Cluster K-Means](https://uc-r.github.io/kmeans_clustering), Guia de Programação R para Análise de Negócios da UC\n", - "\n", - "- [Agrupamento K-Means com princípios de dados organizados](https://www.tidymodels.org/learn/statistics/k-means/)\n", - "\n", - "## **Tarefa**\n", - "\n", - "[Experimente diferentes métodos de agrupamento](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/2-K-Means/assignment.md)\n", - "\n", - "## AGRADECIMENTOS A:\n", - "\n", - "[Jen Looper](https://www.twitter.com/jenlooper) por criar a versão original em Python deste módulo ♥️\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações em sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "Feliz aprendizado,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Embaixador Estudante Gold da Microsoft Learn.\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/solution/notebook.ipynb b/translations/br/5-Clustering/2-K-Means/solution/notebook.ipynb deleted file mode 100644 index c113ab4fa..000000000 --- a/translations/br/5-Clustering/2-K-Means/solution/notebook.ipynb +++ /dev/null @@ -1,546 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "e867e87e3129c8875423a82945f4ad5e", - "translation_date": "2025-08-29T23:33:55+00:00", - "source_file": "5-Clustering/2-K-Means/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: seaborn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.11.1)\n", - "Requirement already satisfied: pandas>=0.23 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.1.2)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (3.1.0)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.4.1)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.19.2)\n", - "Requirement already satisfied: python-dateutil>=2.7.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2.8.0)\n", - "Requirement already satisfied: pytz>=2017.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2019.1)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (1.1.0)\n", - "Requirement already satisfied: cycler>=0.10 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (0.10.0)\n", - "Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (2.4.0)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from python-dateutil>=2.7.3->pandas>=0.23->seaborn) (1.12.0)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib>=2.2->seaborn) (45.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install seaborn" - ] - }, - { - "source": [ - "Comece de onde terminamos na última aula, com os dados importados e filtrados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n
" - }, - "metadata": {}, - "execution_count": 11 - } - ], - "source": [ - "\n", - "import matplotlib.pyplot as plt\n", - "import pandas as pd\n", - "import seaborn as sns\n", - "\n", - "\n", - "df = pd.read_csv(\"../../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "source": [ - "Vamos focar apenas em 3 gêneros. Talvez possamos formar 3 clusters!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "metadata": {}, - "execution_count": 12 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "5 Kasala Pioneers \n", - "6 Pull Up Everything Pretty \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "5 DRB Lasgidi nigerian pop 2020 184800 26 \n", - "6 prettyboydo nigerian pop 2018 202648 29 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "5 0.803 0.1270 0.525 0.000007 0.1290 -10.034 \n", - "6 0.818 0.4520 0.587 0.004490 0.5900 -9.840 \n", - "\n", - " speechiness tempo time_signature \n", - "1 0.3600 129.993 3 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 \n", - "5 0.1970 100.103 4 \n", - "6 0.1990 95.842 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
5KasalaPioneersDRB Lasgidinigerian pop2020184800260.8030.12700.5250.0000070.1290-10.0340.1970100.1034
6Pull UpEverything Prettyprettyboydonigerian pop2018202648290.8180.45200.5870.0044900.5900-9.8400.199095.8424
\n
" - }, - "metadata": {}, - "execution_count": 13 - } - ], - "source": [ - "df.head()" - ] - }, - { - "source": [ - "Quão limpa está esta base de dados? Verifique a presença de outliers usando boxplots. Vamos nos concentrar em colunas com menos outliers (embora você possa limpar os outliers). Boxplots podem mostrar o intervalo dos dados e ajudar a escolher quais colunas usar. Nota: Boxplots não mostram variância, um elemento importante para dados bem agrupáveis (https://stats.stackexchange.com/questions/91536/deduce-variance-from-boxplot)\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 14 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.figure(figsize=(20,20), dpi=200)\n", - "\n", - "plt.subplot(4,3,1)\n", - "sns.boxplot(x = 'popularity', data = df)\n", - "\n", - "plt.subplot(4,3,2)\n", - "sns.boxplot(x = 'acousticness', data = df)\n", - "\n", - "plt.subplot(4,3,3)\n", - "sns.boxplot(x = 'energy', data = df)\n", - "\n", - "plt.subplot(4,3,4)\n", - "sns.boxplot(x = 'instrumentalness', data = df)\n", - "\n", - "plt.subplot(4,3,5)\n", - "sns.boxplot(x = 'liveness', data = df)\n", - "\n", - "plt.subplot(4,3,6)\n", - "sns.boxplot(x = 'loudness', data = df)\n", - "\n", - "plt.subplot(4,3,7)\n", - "sns.boxplot(x = 'speechiness', data = df)\n", - "\n", - "plt.subplot(4,3,8)\n", - "sns.boxplot(x = 'tempo', data = df)\n", - "\n", - "plt.subplot(4,3,9)\n", - "sns.boxplot(x = 'time_signature', data = df)\n", - "\n", - "plt.subplot(4,3,10)\n", - "sns.boxplot(x = 'danceability', data = df)\n", - "\n", - "plt.subplot(4,3,11)\n", - "sns.boxplot(x = 'length', data = df)\n", - "\n", - "plt.subplot(4,3,12)\n", - "sns.boxplot(x = 'release_date', data = df)" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import LabelEncoder, StandardScaler\n", - "le = LabelEncoder()\n", - "\n", - "# scaler = StandardScaler()\n", - "\n", - "X = df.loc[:, ('artist_top_genre','popularity','danceability','acousticness','loudness','energy')]\n", - "\n", - "y = df['artist_top_genre']\n", - "\n", - "X['artist_top_genre'] = le.fit_transform(X['artist_top_genre'])\n", - "\n", - "# X = scaler.fit_transform(X)\n", - "\n", - "y = le.transform(y)\n", - "\n" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array([2, 1, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 2, 0, 2, 1, 1, 0, 1, 0, 0,\n", - " 0, 1, 0, 2, 0, 0, 2, 2, 1, 1, 0, 2, 2, 2, 2, 1, 1, 0, 2, 0, 2, 0,\n", - " 2, 0, 0, 1, 1, 2, 1, 0, 0, 2, 2, 2, 2, 1, 1, 0, 1, 2, 2, 1, 2, 2,\n", - " 1, 2, 1, 2, 2, 1, 1, 1, 1, 1, 2, 1, 2, 2, 0, 2, 1, 1, 1, 2, 2, 2,\n", - " 2, 1, 2, 2, 2, 2, 1, 1, 2, 1, 1, 2, 1, 2, 1, 2, 1, 2, 2, 1, 2, 0,\n", - " 1, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 0, 1, 1, 1, 1, 0, 1, 2, 1, 2,\n", - " 1, 2, 2, 2, 0, 2, 1, 1, 1, 2, 1, 0, 1, 2, 2, 1, 1, 1, 0, 1, 2, 2,\n", - " 2, 1, 1, 0, 1, 2, 1, 1, 1, 1, 2, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 2,\n", - " 0, 1, 0, 0, 1, 0, 0, 2, 0, 0, 1, 1, 2, 0, 2, 2, 0, 2, 2, 1, 1, 0,\n", - " 1, 1, 0, 0, 1, 0, 2, 0, 1, 0, 2, 0, 0, 2, 2, 2, 1, 1, 1, 1, 1, 0,\n", - " 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 0, 1, 1, 1, 0, 2, 2, 2,\n", - " 1, 1, 0, 0, 1, 1, 2, 0, 0, 0, 0, 0, 2, 0, 0, 2, 1, 1, 1, 2, 2, 2,\n", - " 1, 2, 1, 2, 1, 1, 1, 0, 2, 2, 2, 1, 2, 1, 0, 1, 2, 1, 1, 1, 2, 1],\n", - " dtype=int32)" - ] - }, - "metadata": {}, - "execution_count": 16 - } - ], - "source": [ - "\n", - "from sklearn.cluster import KMeans\n", - "\n", - "nclusters = 3 \n", - "seed = 0\n", - "\n", - "km = KMeans(n_clusters=nclusters, random_state=seed)\n", - "km.fit(X)\n", - "\n", - "# Predict the cluster for each data point\n", - "\n", - "y_cluster_kmeans = km.predict(X)\n", - "y_cluster_kmeans" - ] - }, - { - "source": [ - "Esses números não significam muito para nós, então vamos obter uma 'pontuação de silhueta' para verificar a precisão. Nossa pontuação está no meio.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0.5466747351275563" - ] - }, - "metadata": {}, - "execution_count": 17 - } - ], - "source": [ - "from sklearn import metrics\n", - "score = metrics.silhouette_score(X, y_cluster_kmeans)\n", - "score" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.cluster import KMeans\n", - "wcss = []\n", - "\n", - "for i in range(1, 11):\n", - " kmeans = KMeans(n_clusters = i, init = 'k-means++', random_state = 42)\n", - " kmeans.fit(X)\n", - " wcss.append(kmeans.inertia_)" - ] - }, - { - "source": [ - "Use esse modelo para decidir, usando o Método do Cotovelo, o melhor número de clusters para construir\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/seaborn/_decorators.py:43: FutureWarning: Pass the following variables as keyword args: x, y. From version 0.12, the only valid positional argument will be `data`, and passing other arguments without an explicit keyword will result in an error or misinterpretation.\n FutureWarning\n" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.figure(figsize=(10,5))\n", - "sns.lineplot(range(1, 11), wcss,marker='o',color='red')\n", - "plt.title('Elbow')\n", - "plt.xlabel('Number of clusters')\n", - "plt.ylabel('WCSS')\n", - "plt.show()" - ] - }, - { - "source": [ - "Looks like 3 is a good number after all. Fit the model again and create a scatterplot of your clusters. They do group in bunches, but they are pretty close together." - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "from sklearn.cluster import KMeans\n", - "kmeans = KMeans(n_clusters = 3)\n", - "kmeans.fit(X)\n", - "labels = kmeans.predict(X)\n", - "plt.scatter(df['popularity'],df['danceability'],c = labels)\n", - "plt.xlabel('popularity')\n", - "plt.ylabel('danceability')\n", - "plt.show()" - ] - }, - { - "source": [ - "A precisão deste modelo não é ruim, mas também não é ótima. Pode ser que os dados não se adaptem bem ao agrupamento K-Means. Você pode tentar um método diferente.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 811, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Result: 109 out of 286 samples were correctly labeled.\nAccuracy score: 0.38\n" - ] - } - ], - "source": [ - "labels = kmeans.labels_\n", - "\n", - "correct_labels = sum(y == labels)\n", - "\n", - "print(\"Result: %d out of %d samples were correctly labeled.\" % (correct_labels, y.size))\n", - "\n", - "print('Accuracy score: {0:0.2f}'. format(correct_labels/float(y.size)))" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/5-Clustering/2-K-Means/solution/tester.ipynb b/translations/br/5-Clustering/2-K-Means/solution/tester.ipynb deleted file mode 100644 index 4c66dfe34..000000000 --- a/translations/br/5-Clustering/2-K-Means/solution/tester.ipynb +++ /dev/null @@ -1,343 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "6f92868513e59d321245137c1c4c5311", - "translation_date": "2025-08-29T23:34:34+00:00", - "source_file": "5-Clustering/2-K-Means/solution/tester.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 104, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: seaborn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.11.1)\n", - "Requirement already satisfied: pandas>=0.23 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.1.2)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (3.1.0)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.19.2)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.4.1)\n", - "Requirement already satisfied: pytz>=2017.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2019.1)\n", - "Requirement already satisfied: python-dateutil>=2.7.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2.8.0)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (1.1.0)\n", - "Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (2.4.0)\n", - "Requirement already satisfied: cycler>=0.10 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (0.10.0)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from python-dateutil>=2.7.3->pandas>=0.23->seaborn) (1.12.0)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib>=2.2->seaborn) (45.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install seaborn" - ] - }, - { - "source": [ - "Comece de onde terminamos na última aula, com os dados importados e filtrados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 105, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n
" - }, - "metadata": {}, - "execution_count": 105 - } - ], - "source": [ - "\n", - "import matplotlib.pyplot as plt\n", - "import pandas as pd\n", - "import seaborn as sns\n", - "import numpy as np\n", - "\n", - "df = pd.read_csv(\"../../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "source": [ - "Vamos focar apenas em 3 gêneros. Talvez consigamos formar 3 clusters!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 106, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "metadata": {}, - "execution_count": 106 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "code", - "execution_count": 107, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "5 Kasala Pioneers \n", - "6 Pull Up Everything Pretty \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "5 DRB Lasgidi nigerian pop 2020 184800 26 \n", - "6 prettyboydo nigerian pop 2018 202648 29 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "5 0.803 0.1270 0.525 0.000007 0.1290 -10.034 \n", - "6 0.818 0.4520 0.587 0.004490 0.5900 -9.840 \n", - "\n", - " speechiness tempo time_signature \n", - "1 0.3600 129.993 3 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 \n", - "5 0.1970 100.103 4 \n", - "6 0.1990 95.842 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
5KasalaPioneersDRB Lasgidinigerian pop2020184800260.8030.12700.5250.0000070.1290-10.0340.1970100.1034
6Pull UpEverything Prettyprettyboydonigerian pop2018202648290.8180.45200.5870.0044900.5900-9.8400.199095.8424
\n
" - }, - "metadata": {}, - "execution_count": 107 - } - ], - "source": [ - "df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 108, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import StandardScaler\n", - "\n", - "scaler = StandardScaler()\n", - "\n", - "# X = df.loc[:, ('danceability','energy')]\n", - "\n", - "\n", - "\n", - "\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 110, - "metadata": {}, - "outputs": [ - { - "output_type": "error", - "ename": "ValueError", - "evalue": "Unknown label type: 'continuous'", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 20\u001b[0m \u001b[0;31m# we create an instance of SVM and fit out data. We do not scale our\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 21\u001b[0m \u001b[0;31m# data since we want to plot the support vectors\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 22\u001b[0;31m \u001b[0mls30\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mLabelSpreading\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_30\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_30\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Label Spreading 30% data'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 23\u001b[0m \u001b[0mls50\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mLabelSpreading\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_50\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_50\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Label Spreading 50% data'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 24\u001b[0m \u001b[0mls100\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mLabelSpreading\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Label Spreading 100% data'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;32m/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/semi_supervised/_label_propagation.py\u001b[0m in \u001b[0;36mfit\u001b[0;34m(self, X, y)\u001b[0m\n\u001b[1;32m 228\u001b[0m \u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_validate_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 229\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mX_\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mX\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 230\u001b[0;31m \u001b[0mcheck_classification_targets\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0my\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 231\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 232\u001b[0m \u001b[0;31m# actual graph construction (implementations should override this)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;32m/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/utils/multiclass.py\u001b[0m in \u001b[0;36mcheck_classification_targets\u001b[0;34m(y)\u001b[0m\n\u001b[1;32m 181\u001b[0m if y_type not in ['binary', 'multiclass', 'multiclass-multioutput',\n\u001b[1;32m 182\u001b[0m 'multilabel-indicator', 'multilabel-sequences']:\n\u001b[0;32m--> 183\u001b[0;31m \u001b[0;32mraise\u001b[0m \u001b[0mValueError\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m\"Unknown label type: %r\"\u001b[0m \u001b[0;34m%\u001b[0m \u001b[0my_type\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 184\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 185\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;31mValueError\u001b[0m: Unknown label type: 'continuous'" - ] - } - ], - "source": [ - "from sklearn.svm import SVC\n", - "from sklearn.semi_supervised import LabelSpreading\n", - "from sklearn.semi_supervised import SelfTrainingClassifier\n", - "from sklearn import datasets\n", - "\n", - "X = df[['danceability','acousticness']].values\n", - "y = df['energy'].values\n", - "\n", - "# X = scaler.fit_transform(X)\n", - "\n", - "# step size in the mesh\n", - "h = .02\n", - "\n", - "rng = np.random.RandomState(0)\n", - "y_rand = rng.rand(y.shape[0])\n", - "y_30 = np.copy(y)\n", - "y_30[y_rand < 0.3] = -1 # set random samples to be unlabeled\n", - "y_50 = np.copy(y)\n", - "y_50[y_rand < 0.5] = -1\n", - "# we create an instance of SVM and fit out data. We do not scale our\n", - "# data since we want to plot the support vectors\n", - "ls30 = (LabelSpreading().fit(X, y_30), y_30, 'Label Spreading 30% data')\n", - "ls50 = (LabelSpreading().fit(X, y_50), y_50, 'Label Spreading 50% data')\n", - "ls100 = (LabelSpreading().fit(X, y), y, 'Label Spreading 100% data')\n", - "\n", - "# the base classifier for self-training is identical to the SVC\n", - "base_classifier = SVC(kernel='rbf', gamma=.5, probability=True)\n", - "st30 = (SelfTrainingClassifier(base_classifier).fit(X, y_30),\n", - " y_30, 'Self-training 30% data')\n", - "st50 = (SelfTrainingClassifier(base_classifier).fit(X, y_50),\n", - " y_50, 'Self-training 50% data')\n", - "\n", - "rbf_svc = (SVC(kernel='rbf', gamma=.5).fit(X, y), y, 'SVC with rbf kernel')\n", - "\n", - "# create a mesh to plot in\n", - "x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1\n", - "y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1\n", - "xx, yy = np.meshgrid(np.arange(x_min, x_max, h),\n", - " np.arange(y_min, y_max, h))\n", - "\n", - "color_map = {-1: (1, 1, 1), 0: (0, 0, .9), 1: (1, 0, 0), 2: (.8, .6, 0)}\n", - "\n", - "classifiers = (ls30, st30, ls50, st50, ls100, rbf_svc)\n", - "for i, (clf, y_train, title) in enumerate(classifiers):\n", - " # Plot the decision boundary. For that, we will assign a color to each\n", - " # point in the mesh [x_min, x_max]x[y_min, y_max].\n", - " plt.subplot(3, 2, i + 1)\n", - " Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])\n", - "\n", - " # Put the result into a color plot\n", - " Z = Z.reshape(xx.shape)\n", - " plt.contourf(xx, yy, Z, cmap=plt.cm.Paired)\n", - " plt.axis('off')\n", - "\n", - " # Plot also the training points\n", - " colors = [color_map[y] for y in y_train]\n", - " plt.scatter(X[:, 0], X[:, 1], c=colors, edgecolors='black')\n", - "\n", - " plt.title(title)\n", - "\n", - "plt.suptitle(\"Unlabeled points are colored white\", y=0.1)\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/5-Clustering/README.md b/translations/br/5-Clustering/README.md deleted file mode 100644 index 91f4e08c6..000000000 --- a/translations/br/5-Clustering/README.md +++ /dev/null @@ -1,42 +0,0 @@ - -# Modelos de clustering para aprendizado de máquina - -Clustering é uma tarefa de aprendizado de máquina que busca encontrar objetos que se assemelham entre si e agrupá-los em grupos chamados clusters. O que diferencia o clustering de outras abordagens no aprendizado de máquina é que tudo acontece automaticamente. Na verdade, é justo dizer que é o oposto do aprendizado supervisionado. - -## Tópico regional: modelos de clustering para o gosto musical do público nigeriano 🎧 - -O público diversificado da Nigéria tem gostos musicais igualmente variados. Usando dados extraídos do Spotify (inspirado por [este artigo](https://towardsdatascience.com/country-wise-visual-analysis-of-music-taste-using-spotify-api-seaborn-in-python-77f5b749b421)), vamos analisar algumas músicas populares na Nigéria. Este conjunto de dados inclui informações sobre a pontuação de 'dançabilidade', 'acousticness', volume, 'speechiness', popularidade e energia de várias músicas. Será interessante descobrir padrões nesses dados! - -![Um toca-discos](../../../translated_images/pt-BR/turntable.f2b86b13c53302dc.webp) - -> Foto por Marcela Laskoski no Unsplash - -Nesta série de lições, você descobrirá novas maneiras de analisar dados usando técnicas de clustering. O clustering é particularmente útil quando seu conjunto de dados não possui rótulos. Se ele tiver rótulos, então técnicas de classificação, como as que você aprendeu em lições anteriores, podem ser mais úteis. Mas, em casos onde você deseja agrupar dados não rotulados, o clustering é uma ótima maneira de descobrir padrões. - -> Existem ferramentas de baixo código úteis que podem ajudá-lo a aprender a trabalhar com modelos de clustering. Experimente [Azure ML para esta tarefa](https://docs.microsoft.com/learn/modules/create-clustering-model-azure-machine-learning-designer/?WT.mc_id=academic-77952-leestott) - -## Lições - -1. [Introdução ao clustering](1-Visualize/README.md) -2. [Clustering com K-Means](2-K-Means/README.md) - -## Créditos - -Estas lições foram escritas com 🎶 por [Jen Looper](https://www.twitter.com/jenlooper) com revisões úteis de [Rishit Dagli](https://rishit_dagli) e [Muhammad Sakib Khan Inan](https://twitter.com/Sakibinan). - -O conjunto de dados [Nigerian Songs](https://www.kaggle.com/sootersaalu/nigerian-songs-spotify) foi obtido no Kaggle, extraído do Spotify. - -Exemplos úteis de K-Means que ajudaram na criação desta lição incluem esta [exploração de íris](https://www.kaggle.com/bburns/iris-exploration-pca-k-means-and-gmm-clustering), este [notebook introdutório](https://www.kaggle.com/prashant111/k-means-clustering-with-python) e este [exemplo hipotético de ONG](https://www.kaggle.com/ankandash/pca-k-means-clustering-hierarchical-clustering). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/1-Introduction-to-NLP/README.md b/translations/br/6-NLP/1-Introduction-to-NLP/README.md deleted file mode 100644 index 8edee4f3a..000000000 --- a/translations/br/6-NLP/1-Introduction-to-NLP/README.md +++ /dev/null @@ -1,179 +0,0 @@ - -# Introdução ao processamento de linguagem natural - -Esta lição aborda um breve histórico e conceitos importantes do *processamento de linguagem natural*, um subcampo da *linguística computacional*. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -O PLN, como é comumente conhecido, é uma das áreas mais conhecidas onde o aprendizado de máquina foi aplicado e utilizado em softwares de produção. - -✅ Você consegue pensar em algum software que usa todos os dias e que provavelmente possui algum PLN embutido? E os programas de processamento de texto ou aplicativos móveis que você utiliza regularmente? - -Você aprenderá sobre: - -- **A ideia de linguagens**. Como as linguagens se desenvolveram e quais foram as principais áreas de estudo. -- **Definição e conceitos**. Você também aprenderá definições e conceitos sobre como os computadores processam texto, incluindo análise sintática, gramática e identificação de substantivos e verbos. Há algumas tarefas de codificação nesta lição, e vários conceitos importantes são introduzidos, que você aprenderá a programar nas próximas lições. - -## Linguística computacional - -A linguística computacional é uma área de pesquisa e desenvolvimento que, ao longo de muitas décadas, estuda como os computadores podem trabalhar com, e até mesmo entender, traduzir e se comunicar em linguagens. O processamento de linguagem natural (PLN) é um campo relacionado que se concentra em como os computadores podem processar linguagens 'naturais', ou humanas. - -### Exemplo - ditado no celular - -Se você já ditou algo para o seu celular em vez de digitar ou fez uma pergunta a um assistente virtual, sua fala foi convertida em texto e depois processada ou *analisada* a partir da linguagem que você falou. As palavras-chave detectadas foram então processadas em um formato que o celular ou assistente pudesse entender e executar. - -![compreensão](../../../../6-NLP/1-Introduction-to-NLP/images/comprehension.png) -> A verdadeira compreensão linguística é difícil! Imagem por [Jen Looper](https://twitter.com/jenlooper) - -### Como essa tecnologia é possível? - -Isso é possível porque alguém escreveu um programa de computador para fazer isso. Algumas décadas atrás, alguns escritores de ficção científica previram que as pessoas falariam principalmente com seus computadores, e os computadores sempre entenderiam exatamente o que elas queriam dizer. Infelizmente, isso se revelou um problema mais difícil do que muitos imaginavam, e, embora seja um problema muito mais compreendido hoje, ainda há desafios significativos para alcançar um processamento de linguagem natural 'perfeito' no que diz respeito a entender o significado de uma frase. Isso é particularmente difícil quando se trata de compreender humor ou detectar emoções como sarcasmo em uma frase. - -Neste momento, você pode estar se lembrando das aulas escolares em que o professor abordava as partes da gramática em uma frase. Em alguns países, os alunos aprendem gramática e linguística como uma disciplina dedicada, mas em muitos, esses tópicos são incluídos como parte do aprendizado de uma língua: seja sua língua materna no ensino fundamental (aprendendo a ler e escrever) e talvez uma segunda língua no ensino médio. Não se preocupe se você não é um especialista em diferenciar substantivos de verbos ou advérbios de adjetivos! - -Se você tem dificuldade em diferenciar o *presente simples* do *presente contínuo*, você não está sozinho. Isso é desafiador para muitas pessoas, até mesmo falantes nativos de uma língua. A boa notícia é que os computadores são muito bons em aplicar regras formais, e você aprenderá a escrever código que pode *analisar* uma frase tão bem quanto um humano. O maior desafio que você examinará mais tarde é entender o *significado* e o *sentimento* de uma frase. - -## Pré-requisitos - -Para esta lição, o principal pré-requisito é ser capaz de ler e entender o idioma desta lição. Não há problemas matemáticos ou equações para resolver. Embora o autor original tenha escrito esta lição em inglês, ela também foi traduzida para outros idiomas, então você pode estar lendo uma tradução. Há exemplos onde são usados vários idiomas diferentes (para comparar as diferentes regras gramaticais de diferentes línguas). Estes *não* são traduzidos, mas o texto explicativo é, então o significado deve ser claro. - -Para as tarefas de codificação, você usará Python, e os exemplos utilizam Python 3.8. - -Nesta seção, você precisará e usará: - -- **Compreensão de Python 3**. Compreensão da linguagem de programação Python 3, esta lição utiliza entrada, loops, leitura de arquivos e arrays. -- **Visual Studio Code + extensão**. Usaremos o Visual Studio Code e sua extensão Python. Você também pode usar um IDE de Python de sua escolha. -- **TextBlob**. [TextBlob](https://github.com/sloria/TextBlob) é uma biblioteca simplificada de processamento de texto para Python. Siga as instruções no site do TextBlob para instalá-lo em seu sistema (instale também os corpora, conforme mostrado abaixo): - - ```bash - pip install -U textblob - python -m textblob.download_corpora - ``` - -> 💡 Dica: Você pode executar Python diretamente em ambientes do VS Code. Confira a [documentação](https://code.visualstudio.com/docs/languages/python?WT.mc_id=academic-77952-leestott) para mais informações. - -## Conversando com máquinas - -A história de tentar fazer os computadores entenderem a linguagem humana remonta a décadas, e um dos primeiros cientistas a considerar o processamento de linguagem natural foi *Alan Turing*. - -### O 'teste de Turing' - -Quando Turing estava pesquisando *inteligência artificial* na década de 1950, ele considerou se um teste de conversação poderia ser dado a um humano e a um computador (via correspondência digitada), onde o humano na conversa não soubesse se estava conversando com outro humano ou com um computador. - -Se, após um certo tempo de conversa, o humano não conseguisse determinar se as respostas vinham de um computador ou não, então o computador poderia ser considerado como *pensante*? - -### A inspiração - 'o jogo da imitação' - -A ideia para isso veio de um jogo de festa chamado *O Jogo da Imitação*, onde um interrogador está sozinho em uma sala e tem a tarefa de determinar quais das duas pessoas (em outra sala) são, respectivamente, homem e mulher. O interrogador pode enviar bilhetes e deve tentar pensar em perguntas cujas respostas escritas revelem o gênero da pessoa misteriosa. Claro, os jogadores na outra sala tentam enganar o interrogador respondendo de forma a confundi-lo, enquanto também dão a impressão de responder honestamente. - -### Desenvolvendo Eliza - -Na década de 1960, um cientista do MIT chamado *Joseph Weizenbaum* desenvolveu [*Eliza*](https://wikipedia.org/wiki/ELIZA), uma 'terapeuta' computadorizada que fazia perguntas ao humano e dava a impressão de entender suas respostas. No entanto, embora Eliza pudesse analisar uma frase e identificar certos elementos gramaticais e palavras-chave para dar uma resposta razoável, não se podia dizer que ela *entendia* a frase. Se Eliza recebesse uma frase no formato "**Eu estou** triste", ela poderia reorganizar e substituir palavras na frase para formar a resposta "Há quanto tempo **você está** triste". - -Isso dava a impressão de que Eliza entendia a declaração e estava fazendo uma pergunta de acompanhamento, enquanto, na realidade, ela estava apenas mudando o tempo verbal e adicionando algumas palavras. Se Eliza não conseguisse identificar uma palavra-chave para a qual tivesse uma resposta, ela daria uma resposta aleatória que poderia ser aplicável a muitas declarações diferentes. Eliza podia ser facilmente enganada, por exemplo, se um usuário escrevesse "**Você é** uma bicicleta", ela poderia responder "Há quanto tempo **eu sou** uma bicicleta?", em vez de uma resposta mais razoável. - -[![Conversando com Eliza](https://img.youtube.com/vi/RMK9AphfLco/0.jpg)](https://youtu.be/RMK9AphfLco "Conversando com Eliza") - -> 🎥 Clique na imagem acima para assistir a um vídeo sobre o programa original ELIZA - -> Nota: Você pode ler a descrição original de [Eliza](https://cacm.acm.org/magazines/1966/1/13317-elizaa-computer-program-for-the-study-of-natural-language-communication-between-man-and-machine/abstract) publicada em 1966 se tiver uma conta ACM. Alternativamente, leia sobre Eliza na [Wikipedia](https://wikipedia.org/wiki/ELIZA). - -## Exercício - programando um bot de conversação básico - -Um bot de conversação, como Eliza, é um programa que solicita a entrada do usuário e parece entender e responder de forma inteligente. Diferentemente de Eliza, nosso bot não terá várias regras que dão a aparência de uma conversa inteligente. Em vez disso, nosso bot terá apenas uma habilidade: manter a conversa com respostas aleatórias que podem funcionar em quase qualquer conversa trivial. - -### O plano - -Seus passos ao construir um bot de conversação: - -1. Imprimir instruções orientando o usuário sobre como interagir com o bot. -2. Iniciar um loop: - 1. Aceitar a entrada do usuário. - 2. Se o usuário pedir para sair, então sair. - 3. Processar a entrada do usuário e determinar a resposta (neste caso, a resposta será uma escolha aleatória de uma lista de possíveis respostas genéricas). - 4. Imprimir a resposta. -3. Voltar ao passo 2. - -### Construindo o bot - -Vamos criar o bot a seguir. Começaremos definindo algumas frases. - -1. Crie este bot você mesmo em Python com as seguintes respostas aleatórias: - - ```python - random_responses = ["That is quite interesting, please tell me more.", - "I see. Do go on.", - "Why do you say that?", - "Funny weather we've been having, isn't it?", - "Let's change the subject.", - "Did you catch the game last night?"] - ``` - - Aqui está um exemplo de saída para guiá-lo (a entrada do usuário está nas linhas que começam com `>`): - - ```output - Hello, I am Marvin, the simple robot. - You can end this conversation at any time by typing 'bye' - After typing each answer, press 'enter' - How are you today? - > I am good thanks - That is quite interesting, please tell me more. - > today I went for a walk - Did you catch the game last night? - > I did, but my team lost - Funny weather we've been having, isn't it? - > yes but I hope next week is better - Let's change the subject. - > ok, lets talk about music - Why do you say that? - > because I like music! - Why do you say that? - > bye - It was nice talking to you, goodbye! - ``` - - Uma possível solução para a tarefa está [aqui](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/1-Introduction-to-NLP/solution/bot.py). - - ✅ Pare e reflita - - 1. Você acha que as respostas aleatórias 'enganariam' alguém a pensar que o bot realmente as entendeu? - 2. Quais recursos o bot precisaria para ser mais eficaz? - 3. Se um bot pudesse realmente 'entender' o significado de uma frase, ele precisaria 'lembrar' o significado de frases anteriores em uma conversa também? - ---- - -## 🚀Desafio - -Escolha um dos elementos de "pare e reflita" acima e tente implementá-lo em código ou escreva uma solução no papel usando pseudocódigo. - -Na próxima lição, você aprenderá sobre várias outras abordagens para analisar linguagem natural e aprendizado de máquina. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e autoestudo - -Confira as referências abaixo como oportunidades de leitura adicional. - -### Referências - -1. Schubert, Lenhart, "Computational Linguistics", *The Stanford Encyclopedia of Philosophy* (Spring 2020 Edition), Edward N. Zalta (ed.), URL = . -2. Princeton University "About WordNet." [WordNet](https://wordnet.princeton.edu/). Princeton University. 2010. - -## Tarefa - -[Procure por um bot](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/1-Introduction-to-NLP/assignment.md b/translations/br/6-NLP/1-Introduction-to-NLP/assignment.md deleted file mode 100644 index e10c72558..000000000 --- a/translations/br/6-NLP/1-Introduction-to-NLP/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Procure um bot - -## Instruções - -Bots estão em todos os lugares. Sua tarefa: encontre um e adote-o! Você pode encontrá-los em sites, aplicativos bancários e ao telefone, por exemplo, quando liga para empresas de serviços financeiros em busca de conselhos ou informações sobre contas. Analise o bot e veja se consegue confundi-lo. Se conseguir confundir o bot, por que acha que isso aconteceu? Escreva um breve relatório sobre sua experiência. - -## Rubrica - -| Critérios | Exemplário | Adequado | Precisa Melhorar | -| --------- | ----------------------------------------------------------------------------------------------------------- | ------------------------------------------ | --------------------- | -| | Um relatório completo de uma página é escrito, explicando a arquitetura presumida do bot e detalhando sua experiência com ele | O relatório está incompleto ou não foi bem pesquisado | Nenhum relatório foi enviado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/2-Tasks/README.md b/translations/br/6-NLP/2-Tasks/README.md deleted file mode 100644 index 6007f5552..000000000 --- a/translations/br/6-NLP/2-Tasks/README.md +++ /dev/null @@ -1,228 +0,0 @@ - -# Tarefas e técnicas comuns de processamento de linguagem natural - -Para a maioria das tarefas de *processamento de linguagem natural*, o texto a ser processado deve ser dividido, examinado e os resultados armazenados ou cruzados com regras e conjuntos de dados. Essas tarefas permitem que o programador derive o _significado_, a _intenção_ ou apenas a _frequência_ de termos e palavras em um texto. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -Vamos explorar técnicas comuns usadas no processamento de texto. Combinadas com aprendizado de máquina, essas técnicas ajudam a analisar grandes volumes de texto de forma eficiente. Antes de aplicar ML a essas tarefas, no entanto, vamos entender os problemas enfrentados por um especialista em PLN. - -## Tarefas comuns em PLN - -Existem diferentes maneiras de analisar um texto com o qual você está trabalhando. Há tarefas que você pode realizar e, por meio delas, é possível compreender o texto e tirar conclusões. Normalmente, essas tarefas são realizadas em sequência. - -### Tokenização - -Provavelmente, a primeira coisa que a maioria dos algoritmos de PLN precisa fazer é dividir o texto em tokens, ou palavras. Embora isso pareça simples, lidar com pontuação e delimitadores de palavras e frases em diferentes idiomas pode ser complicado. Pode ser necessário usar vários métodos para determinar as demarcações. - -![tokenization](../../../../6-NLP/2-Tasks/images/tokenization.png) -> Tokenizando uma frase de **Orgulho e Preconceito**. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -### Embeddings - -[Word embeddings](https://wikipedia.org/wiki/Word_embedding) são uma maneira de converter seus dados textuais em valores numéricos. Os embeddings são feitos de forma que palavras com significados semelhantes ou usadas juntas fiquem agrupadas. - -![word embeddings](../../../../6-NLP/2-Tasks/images/embedding.png) -> "Tenho o maior respeito pelos seus nervos, eles são meus velhos amigos." - Word embeddings para uma frase de **Orgulho e Preconceito**. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -✅ Experimente [esta ferramenta interessante](https://projector.tensorflow.org/) para explorar word embeddings. Clicar em uma palavra mostra clusters de palavras semelhantes: 'brinquedo' agrupa-se com 'disney', 'lego', 'playstation' e 'console'. - -### Parsing e Marcação de Partes do Discurso - -Cada palavra que foi tokenizada pode ser marcada como uma parte do discurso - um substantivo, verbo ou adjetivo. A frase `a rápida raposa vermelha pulou sobre o cachorro marrom preguiçoso` pode ser marcada como raposa = substantivo, pulou = verbo. - -![parsing](../../../../6-NLP/2-Tasks/images/parse.png) - -> Fazendo parsing de uma frase de **Orgulho e Preconceito**. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -Parsing é reconhecer quais palavras estão relacionadas umas às outras em uma frase - por exemplo, `a rápida raposa vermelha pulou` é uma sequência de adjetivo-substantivo-verbo que é separada da sequência `cachorro marrom preguiçoso`. - -### Frequência de Palavras e Frases - -Um procedimento útil ao analisar um grande corpo de texto é construir um dicionário de cada palavra ou frase de interesse e com que frequência ela aparece. A frase `a rápida raposa vermelha pulou sobre o cachorro marrom preguiçoso` tem uma frequência de 2 para a palavra "a". - -Vamos observar um exemplo de texto onde contamos a frequência das palavras. O poema The Winners de Rudyard Kipling contém o seguinte verso: - -```output -What the moral? Who rides may read. -When the night is thick and the tracks are blind -A friend at a pinch is a friend, indeed, -But a fool to wait for the laggard behind. -Down to Gehenna or up to the Throne, -He travels the fastest who travels alone. -``` - -Como as frequências de frases podem ser sensíveis ou não a maiúsculas e minúsculas, conforme necessário, a frase `um amigo` tem uma frequência de 2, `o` tem uma frequência de 6 e `viaja` tem uma frequência de 2. - -### N-grams - -Um texto pode ser dividido em sequências de palavras de um comprimento definido, uma única palavra (unigrama), duas palavras (bigrama), três palavras (trigrama) ou qualquer número de palavras (n-gramas). - -Por exemplo, `a rápida raposa vermelha pulou sobre o cachorro marrom preguiçoso` com um n-grama de 2 produz os seguintes n-gramas: - -1. a rápida -2. rápida raposa -3. raposa vermelha -4. vermelha pulou -5. pulou sobre -6. sobre o -7. o cachorro -8. cachorro marrom -9. marrom preguiçoso - -Pode ser mais fácil visualizar isso como uma janela deslizante sobre a frase. Aqui está para n-gramas de 3 palavras, o n-grama está em negrito em cada frase: - -1. **a rápida raposa** vermelha pulou sobre o cachorro marrom preguiçoso -2. a **rápida raposa vermelha** pulou sobre o cachorro marrom preguiçoso -3. a rápida **raposa vermelha pulou** sobre o cachorro marrom preguiçoso -4. a rápida raposa **vermelha pulou sobre** o cachorro marrom preguiçoso -5. a rápida raposa vermelha **pulou sobre o** cachorro marrom preguiçoso -6. a rápida raposa vermelha pulou **sobre o cachorro** marrom preguiçoso -7. a rápida raposa vermelha pulou sobre **o cachorro marrom** preguiçoso -8. a rápida raposa vermelha pulou sobre o **cachorro marrom preguiçoso** - -![n-grams sliding window](../../../../6-NLP/2-Tasks/images/n-grams.gif) - -> Valor de N-grama de 3: Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -### Extração de Frases Nominais - -Na maioria das frases, há um substantivo que é o sujeito ou objeto da frase. Em inglês, muitas vezes é identificável por ter 'a', 'an' ou 'the' antes dele. Identificar o sujeito ou objeto de uma frase extraindo a 'frase nominal' é uma tarefa comum em PLN ao tentar entender o significado de uma frase. - -✅ Na frase "Não consigo fixar a hora, ou o local, ou o olhar ou as palavras, que lançaram a base. Faz muito tempo. Eu já estava no meio antes de perceber que tinha começado.", você consegue identificar as frases nominais? - -Na frase `a rápida raposa vermelha pulou sobre o cachorro marrom preguiçoso`, há 2 frases nominais: **rápida raposa vermelha** e **cachorro marrom preguiçoso**. - -### Análise de Sentimento - -Uma frase ou texto pode ser analisado para determinar o sentimento, ou quão *positivo* ou *negativo* ele é. O sentimento é medido em *polaridade* e *objetividade/subjetividade*. A polaridade é medida de -1.0 a 1.0 (negativo a positivo) e de 0.0 a 1.0 (mais objetivo a mais subjetivo). - -✅ Mais tarde, você aprenderá que existem diferentes maneiras de determinar o sentimento usando aprendizado de máquina, mas uma delas é ter uma lista de palavras e frases categorizadas como positivas ou negativas por um especialista humano e aplicar esse modelo ao texto para calcular uma pontuação de polaridade. Você consegue ver como isso funcionaria em algumas circunstâncias e menos em outras? - -### Flexão - -A flexão permite que você pegue uma palavra e obtenha sua forma singular ou plural. - -### Lematização - -Um *lema* é a raiz ou palavra-base para um conjunto de palavras, por exemplo, *voou*, *voa*, *voando* têm como lema o verbo *voar*. - -Também existem bancos de dados úteis disponíveis para pesquisadores de PLN, notavelmente: - -### WordNet - -[WordNet](https://wordnet.princeton.edu/) é um banco de dados de palavras, sinônimos, antônimos e muitos outros detalhes para cada palavra em vários idiomas. É incrivelmente útil ao tentar construir tradutores, verificadores ortográficos ou ferramentas de linguagem de qualquer tipo. - -## Bibliotecas de PLN - -Felizmente, você não precisa construir todas essas técnicas sozinho, pois existem excelentes bibliotecas Python disponíveis que tornam o PLN muito mais acessível para desenvolvedores que não são especializados em processamento de linguagem natural ou aprendizado de máquina. As próximas lições incluem mais exemplos dessas bibliotecas, mas aqui você aprenderá alguns exemplos úteis para ajudá-lo na próxima tarefa. - -### Exercício - usando a biblioteca `TextBlob` - -Vamos usar uma biblioteca chamada TextBlob, pois ela contém APIs úteis para lidar com esses tipos de tarefas. TextBlob "se apoia nos ombros gigantes do [NLTK](https://nltk.org) e do [pattern](https://github.com/clips/pattern), e funciona bem com ambos." Ela possui uma quantidade considerável de ML embutida em sua API. - -> Nota: Um [Guia Rápido](https://textblob.readthedocs.io/en/dev/quickstart.html#quickstart) útil está disponível para TextBlob e é recomendado para desenvolvedores Python experientes. - -Ao tentar identificar *frases nominais*, o TextBlob oferece várias opções de extratores para encontrá-las. - -1. Dê uma olhada no `ConllExtractor`. - - ```python - from textblob import TextBlob - from textblob.np_extractors import ConllExtractor - # import and create a Conll extractor to use later - extractor = ConllExtractor() - - # later when you need a noun phrase extractor: - user_input = input("> ") - user_input_blob = TextBlob(user_input, np_extractor=extractor) # note non-default extractor specified - np = user_input_blob.noun_phrases - ``` - - > O que está acontecendo aqui? [ConllExtractor](https://textblob.readthedocs.io/en/dev/api_reference.html?highlight=Conll#textblob.en.np_extractors.ConllExtractor) é "Um extrator de frases nominais que usa chunk parsing treinado com o corpus de treinamento ConLL-2000." ConLL-2000 refere-se à Conferência de 2000 sobre Aprendizado Computacional de Linguagem Natural. Cada ano, a conferência hospedava um workshop para resolver um problema desafiador de PLN, e em 2000 foi o chunking de frases nominais. Um modelo foi treinado no Wall Street Journal, com "as seções 15-18 como dados de treinamento (211727 tokens) e a seção 20 como dados de teste (47377 tokens)". Você pode conferir os procedimentos usados [aqui](https://www.clips.uantwerpen.be/conll2000/chunking/) e os [resultados](https://ifarm.nl/erikt/research/np-chunking.html). - -### Desafio - melhorando seu bot com PLN - -Na lição anterior, você construiu um bot de perguntas e respostas muito simples. Agora, você tornará Marvin um pouco mais simpático analisando sua entrada para detectar o sentimento e imprimindo uma resposta correspondente. Você também precisará identificar uma `noun_phrase` e perguntar sobre ela. - -Seus passos para construir um bot conversacional melhor: - -1. Imprima instruções orientando o usuário sobre como interagir com o bot. -2. Inicie o loop: - 1. Aceite a entrada do usuário. - 2. Se o usuário pedir para sair, encerre. - 3. Processe a entrada do usuário e determine a resposta de sentimento apropriada. - 4. Se uma frase nominal for detectada no sentimento, pluralize-a e peça mais informações sobre esse tópico. - 5. Imprima a resposta. -3. Volte ao passo 2. - -Aqui está o trecho de código para determinar o sentimento usando TextBlob. Observe que há apenas quatro *gradientes* de resposta de sentimento (você pode adicionar mais, se quiser): - -```python -if user_input_blob.polarity <= -0.5: - response = "Oh dear, that sounds bad. " -elif user_input_blob.polarity <= 0: - response = "Hmm, that's not great. " -elif user_input_blob.polarity <= 0.5: - response = "Well, that sounds positive. " -elif user_input_blob.polarity <= 1: - response = "Wow, that sounds great. " -``` - -Aqui está um exemplo de saída para guiá-lo (a entrada do usuário está nas linhas que começam com >): - -```output -Hello, I am Marvin, the friendly robot. -You can end this conversation at any time by typing 'bye' -After typing each answer, press 'enter' -How are you today? -> I am ok -Well, that sounds positive. Can you tell me more? -> I went for a walk and saw a lovely cat -Well, that sounds positive. Can you tell me more about lovely cats? -> cats are the best. But I also have a cool dog -Wow, that sounds great. Can you tell me more about cool dogs? -> I have an old hounddog but he is sick -Hmm, that's not great. Can you tell me more about old hounddogs? -> bye -It was nice talking to you, goodbye! -``` - -Uma possível solução para a tarefa está [aqui](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/2-Tasks/solution/bot.py). - -✅ Verificação de Conhecimento - -1. Você acha que as respostas simpáticas poderiam 'enganar' alguém a pensar que o bot realmente os entende? -2. Identificar a frase nominal torna o bot mais 'crível'? -3. Por que extrair uma 'frase nominal' de uma frase seria algo útil? - ---- - -Implemente o bot na verificação de conhecimento anterior e teste-o com um amigo. Ele consegue enganá-lo? Você consegue tornar seu bot mais 'crível'? - -## 🚀Desafio - -Escolha uma tarefa na verificação de conhecimento anterior e tente implementá-la. Teste o bot com um amigo. Ele consegue enganá-lo? Você consegue tornar seu bot mais 'crível'? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Nas próximas lições, você aprenderá mais sobre análise de sentimento. Pesquise essa técnica interessante em artigos como os do [KDNuggets](https://www.kdnuggets.com/tag/nlp). - -## Tarefa - -[Faça um bot responder](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/2-Tasks/assignment.md b/translations/br/6-NLP/2-Tasks/assignment.md deleted file mode 100644 index d244ae940..000000000 --- a/translations/br/6-NLP/2-Tasks/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Faça um Bot responder - -## Instruções - -Nas últimas lições, você programou um bot básico com quem pode conversar. Esse bot dá respostas aleatórias até que você diga 'tchau'. Você consegue fazer as respostas um pouco menos aleatórias e ativar respostas específicas quando você disser coisas como 'por quê' ou 'como'? Pense um pouco sobre como o aprendizado de máquina pode tornar esse tipo de trabalho menos manual enquanto você expande seu bot. Você pode usar as bibliotecas NLTK ou TextBlob para facilitar suas tarefas. - -## Critérios de Avaliação - -| Critério | Exemplar | Adequado | Precisa Melhorar | -| -------- | -------------------------------------------- | ------------------------------------------------ | ----------------------- | -| | Um novo arquivo bot.py é apresentado e documentado | Um novo arquivo bot é apresentado, mas contém erros | Um arquivo não é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/3-Translation-Sentiment/README.md b/translations/br/6-NLP/3-Translation-Sentiment/README.md deleted file mode 100644 index 69ae6633a..000000000 --- a/translations/br/6-NLP/3-Translation-Sentiment/README.md +++ /dev/null @@ -1,200 +0,0 @@ - -# Tradução e análise de sentimentos com ML - -Nas lições anteriores, você aprendeu como construir um bot básico usando `TextBlob`, uma biblioteca que incorpora aprendizado de máquina nos bastidores para realizar tarefas básicas de PLN, como extração de frases nominais. Outro desafio importante na linguística computacional é a _tradução_ precisa de uma frase de um idioma falado ou escrito para outro. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -A tradução é um problema muito difícil, agravado pelo fato de que existem milhares de idiomas, cada um com regras gramaticais muito diferentes. Uma abordagem é converter as regras gramaticais formais de um idioma, como o inglês, em uma estrutura independente de idioma e, em seguida, traduzi-la convertendo de volta para outro idioma. Essa abordagem envolve as seguintes etapas: - -1. **Identificação**. Identificar ou marcar as palavras no idioma de entrada como substantivos, verbos, etc. -2. **Criar tradução**. Produzir uma tradução direta de cada palavra no formato do idioma de destino. - -### Exemplo de frase, Inglês para Irlandês - -Em 'inglês', a frase _I feel happy_ tem três palavras na seguinte ordem: - -- **sujeito** (I) -- **verbo** (feel) -- **adjetivo** (happy) - -No entanto, no idioma 'irlandês', a mesma frase tem uma estrutura gramatical muito diferente - emoções como "*feliz*" ou "*triste*" são expressas como estando *sobre* você. - -A frase em inglês `I feel happy` em irlandês seria `Tá athas orm`. Uma tradução *literal* seria `Felicidade está sobre mim`. - -Um falante de irlandês traduzindo para o inglês diria `I feel happy`, e não `Happy is upon me`, porque ele entende o significado da frase, mesmo que as palavras e a estrutura da frase sejam diferentes. - -A ordem formal da frase em irlandês é: - -- **verbo** (Tá ou é) -- **adjetivo** (athas, ou feliz) -- **sujeito** (orm, ou sobre mim) - -## Tradução - -Um programa de tradução ingênuo pode traduzir apenas palavras, ignorando a estrutura da frase. - -✅ Se você aprendeu um segundo (ou terceiro ou mais) idioma como adulto, pode ter começado pensando no seu idioma nativo, traduzindo um conceito palavra por palavra na sua cabeça para o segundo idioma e, em seguida, falando sua tradução. Isso é semelhante ao que programas de tradução ingênuos fazem. É importante superar essa fase para alcançar a fluência! - -A tradução ingênua leva a traduções ruins (e às vezes hilárias): `I feel happy` traduz literalmente para `Mise bhraitheann athas` em irlandês. Isso significa (literalmente) `eu sinto feliz` e não é uma frase válida em irlandês. Mesmo que o inglês e o irlandês sejam idiomas falados em duas ilhas vizinhas, eles são muito diferentes, com estruturas gramaticais distintas. - -> Você pode assistir a alguns vídeos sobre as tradições linguísticas irlandesas, como [este aqui](https://www.youtube.com/watch?v=mRIaLSdRMMs) - -### Abordagens de aprendizado de máquina - -Até agora, você aprendeu sobre a abordagem de regras formais para o processamento de linguagem natural. Outra abordagem é ignorar o significado das palavras e _usar aprendizado de máquina para detectar padrões_. Isso pode funcionar na tradução se você tiver muitos textos (um *corpus*) ou textos (*corpora*) nos idiomas de origem e de destino. - -Por exemplo, considere o caso de *Orgulho e Preconceito*, um romance inglês bem conhecido escrito por Jane Austen em 1813. Se você consultar o livro em inglês e uma tradução humana do livro em *francês*, poderá detectar frases em um idioma que são traduzidas _idiomaticamente_ para o outro. Você fará isso em breve. - -Por exemplo, quando uma frase em inglês como `I have no money` é traduzida literalmente para o francês, pode se tornar `Je n'ai pas de monnaie`. "Monnaie" é um falso cognato complicado em francês, pois 'money' e 'monnaie' não são sinônimos. Uma tradução melhor que um humano poderia fazer seria `Je n'ai pas d'argent`, porque transmite melhor o significado de que você não tem dinheiro (em vez de 'troco', que é o significado de 'monnaie'). - -![monnaie](../../../../6-NLP/3-Translation-Sentiment/images/monnaie.png) - -> Imagem por [Jen Looper](https://twitter.com/jenlooper) - -Se um modelo de ML tiver traduções humanas suficientes para construir um modelo, ele pode melhorar a precisão das traduções identificando padrões comuns em textos que foram previamente traduzidos por falantes humanos especialistas em ambos os idiomas. - -### Exercício - tradução - -Você pode usar `TextBlob` para traduzir frases. Experimente a famosa primeira linha de **Orgulho e Preconceito**: - -```python -from textblob import TextBlob - -blob = TextBlob( - "It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife!" -) -print(blob.translate(to="fr")) - -``` - -`TextBlob` faz um trabalho muito bom na tradução: "C'est une vérité universellement reconnue, qu'un homme célibataire en possession d'une bonne fortune doit avoir besoin d'une femme!". - -Pode-se argumentar que a tradução do TextBlob é muito mais precisa, de fato, do que a tradução francesa de 1932 do livro por V. Leconte e Ch. Pressoir: - -"C'est une vérité universelle qu'un célibataire pourvu d'une belle fortune doit avoir envie de se marier, et, si peu que l'on sache de son sentiment à cet egard, lorsqu'il arrive dans une nouvelle résidence, cette idée est si bien fixée dans l'esprit de ses voisins qu'ils le considèrent sur-le-champ comme la propriété légitime de l'une ou l'autre de leurs filles." - -Nesse caso, a tradução informada por ML faz um trabalho melhor do que o tradutor humano, que adicionou palavras desnecessárias à boca do autor original para 'clareza'. - -> O que está acontecendo aqui? E por que o TextBlob é tão bom em tradução? Bem, nos bastidores, ele está usando o Google Translate, uma IA sofisticada capaz de analisar milhões de frases para prever as melhores sequências para a tarefa em questão. Não há nada manual acontecendo aqui, e você precisa de uma conexão com a internet para usar `blob.translate`. - -✅ Experimente mais frases. Qual é melhor, ML ou tradução humana? Em quais casos? - -## Análise de sentimentos - -Outra área onde o aprendizado de máquina pode funcionar muito bem é a análise de sentimentos. Uma abordagem não baseada em ML para sentimentos é identificar palavras e frases que são 'positivas' e 'negativas'. Em seguida, dado um novo texto, calcular o valor total das palavras positivas, negativas e neutras para identificar o sentimento geral. - -Essa abordagem é facilmente enganada, como você pode ter visto na tarefa do Marvin - a frase `Great, that was a wonderful waste of time, I'm glad we are lost on this dark road` é uma frase sarcástica e de sentimento negativo, mas o algoritmo simples detecta 'great', 'wonderful', 'glad' como positivas e 'waste', 'lost' e 'dark' como negativas. O sentimento geral é influenciado por essas palavras conflitantes. - -✅ Pare um segundo e pense em como transmitimos sarcasmo como falantes humanos. A inflexão do tom desempenha um papel importante. Tente dizer a frase "Well, that film was awesome" de diferentes maneiras para descobrir como sua voz transmite significado. - -### Abordagens de ML - -A abordagem de ML seria reunir manualmente textos negativos e positivos - tweets, resenhas de filmes ou qualquer coisa onde o humano tenha dado uma pontuação *e* uma opinião escrita. Em seguida, técnicas de PLN podem ser aplicadas às opiniões e pontuações, para que padrões surjam (por exemplo, resenhas de filmes positivas tendem a ter a frase 'Oscar worthy' mais do que resenhas negativas, ou resenhas positivas de restaurantes dizem 'gourmet' muito mais do que 'disgusting'). - -> ⚖️ **Exemplo**: Se você trabalhasse no escritório de um político e houvesse uma nova lei sendo debatida, os eleitores poderiam escrever para o escritório com e-mails a favor ou contra a nova lei. Digamos que você seja encarregado de ler os e-mails e classificá-los em 2 pilhas, *a favor* e *contra*. Se houvesse muitos e-mails, você poderia se sentir sobrecarregado tentando ler todos. Não seria ótimo se um bot pudesse ler todos para você, entendê-los e dizer em qual pilha cada e-mail deveria estar? -> -> Uma maneira de conseguir isso é usar aprendizado de máquina. Você treinaria o modelo com uma parte dos e-mails *contra* e uma parte dos e-mails *a favor*. O modelo tenderia a associar frases e palavras ao lado contra e ao lado a favor, *mas não entenderia nenhum conteúdo*, apenas que certas palavras e padrões eram mais propensos a aparecer em um e-mail *contra* ou *a favor*. Você poderia testá-lo com alguns e-mails que não usou para treinar o modelo e ver se ele chegava à mesma conclusão que você. Então, uma vez satisfeito com a precisão do modelo, você poderia processar e-mails futuros sem precisar ler cada um. - -✅ Esse processo soa como processos que você usou em lições anteriores? - -## Exercício - frases sentimentais - -O sentimento é medido com uma *polaridade* de -1 a 1, onde -1 é o sentimento mais negativo e 1 é o mais positivo. O sentimento também é medido com uma pontuação de 0 - 1 para objetividade (0) e subjetividade (1). - -Dê outra olhada em *Orgulho e Preconceito* de Jane Austen. O texto está disponível aqui no [Project Gutenberg](https://www.gutenberg.org/files/1342/1342-h/1342-h.htm). O exemplo abaixo mostra um programa curto que analisa o sentimento das primeiras e últimas frases do livro e exibe sua polaridade de sentimento e pontuação de subjetividade/objetividade. - -Você deve usar a biblioteca `TextBlob` (descrita acima) para determinar o `sentimento` (você não precisa escrever seu próprio calculador de sentimentos) na seguinte tarefa. - -```python -from textblob import TextBlob - -quote1 = """It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife.""" - -quote2 = """Darcy, as well as Elizabeth, really loved them; and they were both ever sensible of the warmest gratitude towards the persons who, by bringing her into Derbyshire, had been the means of uniting them.""" - -sentiment1 = TextBlob(quote1).sentiment -sentiment2 = TextBlob(quote2).sentiment - -print(quote1 + " has a sentiment of " + str(sentiment1)) -print(quote2 + " has a sentiment of " + str(sentiment2)) -``` - -Você verá a seguinte saída: - -```output -It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want # of a wife. has a sentiment of Sentiment(polarity=0.20952380952380953, subjectivity=0.27142857142857146) - -Darcy, as well as Elizabeth, really loved them; and they were - both ever sensible of the warmest gratitude towards the persons - who, by bringing her into Derbyshire, had been the means of - uniting them. has a sentiment of Sentiment(polarity=0.7, subjectivity=0.8) -``` - -## Desafio - verificar polaridade de sentimentos - -Sua tarefa é determinar, usando a polaridade de sentimentos, se *Orgulho e Preconceito* tem mais frases absolutamente positivas do que absolutamente negativas. Para esta tarefa, você pode assumir que uma pontuação de polaridade de 1 ou -1 é absolutamente positiva ou negativa, respectivamente. - -**Passos:** - -1. Baixe uma [cópia de Orgulho e Preconceito](https://www.gutenberg.org/files/1342/1342-h/1342-h.htm) do Project Gutenberg como um arquivo .txt. Remova os metadados no início e no final do arquivo, deixando apenas o texto original. -2. Abra o arquivo em Python e extraia o conteúdo como uma string. -3. Crie um TextBlob usando a string do livro. -4. Analise cada frase do livro em um loop. - 1. Se a polaridade for 1 ou -1, armazene a frase em um array ou lista de mensagens positivas ou negativas. -5. No final, imprima todas as frases positivas e negativas (separadamente) e o número de cada uma. - -Aqui está uma [solução de exemplo](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb). - -✅ Verificação de Conhecimento - -1. O sentimento é baseado nas palavras usadas na frase, mas o código *entende* as palavras? -2. Você acha que a polaridade de sentimento é precisa ou, em outras palavras, você *concorda* com as pontuações? - 1. Em particular, você concorda ou discorda da polaridade **positiva** absoluta das seguintes frases? - * “What an excellent father you have, girls!” said she, when the door was shut. - * “Your examination of Mr. Darcy is over, I presume,” said Miss Bingley; “and pray what is the result?” “I am perfectly convinced by it that Mr. Darcy has no defect. - * How wonderfully these sort of things occur! - * I have the greatest dislike in the world to that sort of thing. - * Charlotte is an excellent manager, I dare say. - * “This is delightful indeed! - * I am so happy! - * Your idea of the ponies is delightful. - 2. As próximas 3 frases foram pontuadas com um sentimento positivo absoluto, mas, ao ler com atenção, elas não são frases positivas. Por que a análise de sentimentos achou que eram frases positivas? - * Happy shall I be, when his stay at Netherfield is over!” “I wish I could say anything to comfort you,” replied Elizabeth; “but it is wholly out of my power. - * If I could but see you as happy! - * Our distress, my dear Lizzy, is very great. - 3. Você concorda ou discorda da polaridade **negativa** absoluta das seguintes frases? - - Everybody is disgusted with his pride. - - “I should like to know how he behaves among strangers.” “You shall hear then—but prepare yourself for something very dreadful. - - The pause was to Elizabeth’s feelings dreadful. - - It would be dreadful! - -✅ Qualquer aficionado por Jane Austen entenderá que ela frequentemente usa seus livros para criticar os aspectos mais ridículos da sociedade da Regência Inglesa. Elizabeth Bennett, a personagem principal de *Orgulho e Preconceito*, é uma observadora social perspicaz (como a autora), e sua linguagem é frequentemente muito sutil. Até mesmo Mr. Darcy (o interesse amoroso na história) observa o uso brincalhão e provocador da linguagem por Elizabeth: "Eu tive o prazer de sua companhia por tempo suficiente para saber que você encontra grande diversão em ocasionalmente professar opiniões que, na verdade, não são suas." - ---- - -## 🚀Desafio - -Você pode melhorar o Marvin extraindo outros recursos da entrada do usuário? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo -Existem muitas maneiras de extrair sentimentos de um texto. Pense nas aplicações empresariais que podem fazer uso dessa técnica. Reflita sobre como isso pode dar errado. Leia mais sobre sistemas sofisticados e prontos para empresas que analisam sentimentos, como o [Azure Text Analysis](https://docs.microsoft.com/azure/cognitive-services/Text-Analytics/how-tos/text-analytics-how-to-sentiment-analysis?tabs=version-3-1?WT.mc_id=academic-77952-leestott). Teste algumas das frases de Orgulho e Preconceito mencionadas acima e veja se ele consegue detectar nuances. - -## Tarefa - -[Licença poética](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/3-Translation-Sentiment/assignment.md b/translations/br/6-NLP/3-Translation-Sentiment/assignment.md deleted file mode 100644 index 72677abe0..000000000 --- a/translations/br/6-NLP/3-Translation-Sentiment/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Licença Poética - -## Instruções - -Neste [notebook](https://www.kaggle.com/jenlooper/emily-dickinson-word-frequency), você encontrará mais de 500 poemas de Emily Dickinson previamente analisados quanto ao sentimento usando o serviço de análise de texto do Azure. Usando este conjunto de dados, analise-o utilizando as técnicas descritas na lição. O sentimento sugerido de um poema corresponde à decisão do serviço mais sofisticado do Azure? Por que, na sua opinião? Algo te surpreendeu? - -## Rubrica - -| Critério | Exemplary | Adequado | Precisa de Melhorias | -| --------- | -------------------------------------------------------------------------- | ------------------------------------------------------- | ------------------------ | -| | Um notebook é apresentado com uma análise sólida da amostra de saída do autor | O notebook está incompleto ou não realiza a análise | Nenhum notebook é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/3-Translation-Sentiment/solution/Julia/README.md b/translations/br/6-NLP/3-Translation-Sentiment/solution/Julia/README.md deleted file mode 100644 index fec98180e..000000000 --- a/translations/br/6-NLP/3-Translation-Sentiment/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/3-Translation-Sentiment/solution/R/README.md b/translations/br/6-NLP/3-Translation-Sentiment/solution/R/README.md deleted file mode 100644 index 01c0396f8..000000000 --- a/translations/br/6-NLP/3-Translation-Sentiment/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb b/translations/br/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb deleted file mode 100644 index aed1df079..000000000 --- a/translations/br/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb +++ /dev/null @@ -1,100 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 4, - "coopTranslator": { - "original_hash": "27de2abc0235ebd22080fc8f1107454d", - "translation_date": "2025-08-30T00:14:49+00:00", - "source_file": "6-NLP/3-Translation-Sentiment/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "from textblob import TextBlob\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# You should download the book text, clean it, and import it here\n", - "with open(\"pride.txt\", encoding=\"utf8\") as f:\n", - " file_contents = f.read()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "book_pride = TextBlob(file_contents)\n", - "positive_sentiment_sentences = []\n", - "negative_sentiment_sentences = []" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "for sentence in book_pride.sentences:\n", - " if sentence.sentiment.polarity == 1:\n", - " positive_sentiment_sentences.append(sentence)\n", - " if sentence.sentiment.polarity == -1:\n", - " negative_sentiment_sentences.append(sentence)\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "print(\"The \" + str(len(positive_sentiment_sentences)) + \" most positive sentences:\")\n", - "for sentence in positive_sentiment_sentences:\n", - " print(\"+ \" + str(sentence.replace(\"\\n\", \"\").replace(\" \", \" \")))\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "print(\"The \" + str(len(negative_sentiment_sentences)) + \" most negative sentences:\")\n", - "for sentence in negative_sentiment_sentences:\n", - " print(\"- \" + str(sentence.replace(\"\\n\", \"\").replace(\" \", \" \")))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/6-NLP/4-Hotel-Reviews-1/README.md b/translations/br/6-NLP/4-Hotel-Reviews-1/README.md deleted file mode 100644 index f465eec4a..000000000 --- a/translations/br/6-NLP/4-Hotel-Reviews-1/README.md +++ /dev/null @@ -1,417 +0,0 @@ - -# Análise de sentimento com avaliações de hotéis - processando os dados - -Nesta seção, você usará as técnicas das lições anteriores para realizar uma análise exploratória de dados em um grande conjunto de dados. Depois de entender bem a utilidade das várias colunas, você aprenderá: - -- como remover colunas desnecessárias -- como calcular novos dados com base nas colunas existentes -- como salvar o conjunto de dados resultante para uso no desafio final - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Introdução - -Até agora, você aprendeu como os dados textuais são bem diferentes dos dados numéricos. Se o texto foi escrito ou falado por um humano, ele pode ser analisado para encontrar padrões, frequências, sentimentos e significados. Esta lição apresenta um conjunto de dados real com um desafio real: **[515K Hotel Reviews Data in Europe](https://www.kaggle.com/jiashenliu/515k-hotel-reviews-data-in-europe)**, que inclui uma [licença CC0: Domínio Público](https://creativecommons.org/publicdomain/zero/1.0/). Ele foi extraído de fontes públicas do Booking.com. O criador do conjunto de dados foi Jiashen Liu. - -### Preparação - -Você precisará de: - -* Capacidade de executar notebooks .ipynb usando Python 3 -* pandas -* NLTK, [que você deve instalar localmente](https://www.nltk.org/install.html) -* O conjunto de dados disponível no Kaggle [515K Hotel Reviews Data in Europe](https://www.kaggle.com/jiashenliu/515k-hotel-reviews-data-in-europe). Ele tem cerca de 230 MB descompactado. Baixe-o para a pasta raiz `/data` associada a estas lições de NLP. - -## Análise exploratória de dados - -Este desafio assume que você está construindo um bot de recomendação de hotéis usando análise de sentimento e pontuações de avaliações de hóspedes. O conjunto de dados que você usará inclui avaliações de 1493 hotéis diferentes em 6 cidades. - -Usando Python, um conjunto de dados de avaliações de hotéis e a análise de sentimento do NLTK, você pode descobrir: - -* Quais são as palavras e frases mais frequentemente usadas nas avaliações? -* As *tags* oficiais que descrevem um hotel têm correlação com as pontuações das avaliações (por exemplo, há mais avaliações negativas para um hotel específico por *Família com crianças pequenas* do que por *Viajante solo*, talvez indicando que ele é melhor para *Viajantes solo*)? -* As pontuações de sentimento do NLTK "concordam" com a pontuação numérica do avaliador? - -#### Conjunto de dados - -Vamos explorar o conjunto de dados que você baixou e salvou localmente. Abra o arquivo em um editor como VS Code ou até mesmo Excel. - -Os cabeçalhos no conjunto de dados são os seguintes: - -*Hotel_Address, Additional_Number_of_Scoring, Review_Date, Average_Score, Hotel_Name, Reviewer_Nationality, Negative_Review, Review_Total_Negative_Word_Counts, Total_Number_of_Reviews, Positive_Review, Review_Total_Positive_Word_Counts, Total_Number_of_Reviews_Reviewer_Has_Given, Reviewer_Score, Tags, days_since_review, lat, lng* - -Aqui estão agrupados de uma forma que pode ser mais fácil de examinar: -##### Colunas do hotel - -* `Hotel_Name`, `Hotel_Address`, `lat` (latitude), `lng` (longitude) - * Usando *lat* e *lng*, você poderia plotar um mapa com Python mostrando as localizações dos hotéis (talvez codificado por cores para avaliações negativas e positivas) - * Hotel_Address não parece ser útil para nós, e provavelmente será substituído por um país para facilitar a classificação e pesquisa - -**Colunas de meta-avaliação do hotel** - -* `Average_Score` - * De acordo com o criador do conjunto de dados, esta coluna é a *Pontuação média do hotel, calculada com base no último comentário do último ano*. Este parece ser um método incomum de calcular a pontuação, mas é o dado extraído, então podemos aceitá-lo por enquanto. - - ✅ Com base nas outras colunas deste conjunto de dados, você consegue pensar em outra maneira de calcular a pontuação média? - -* `Total_Number_of_Reviews` - * O número total de avaliações que este hotel recebeu - não está claro (sem escrever algum código) se isso se refere às avaliações no conjunto de dados. -* `Additional_Number_of_Scoring` - * Isso significa que uma pontuação foi dada, mas nenhuma avaliação positiva ou negativa foi escrita pelo avaliador. - -**Colunas de avaliação** - -- `Reviewer_Score` - - Este é um valor numérico com no máximo 1 casa decimal entre os valores mínimos e máximos 2.5 e 10 - - Não é explicado por que 2.5 é a menor pontuação possível -- `Negative_Review` - - Se um avaliador não escreveu nada, este campo terá "**No Negative**" - - Note que um avaliador pode escrever uma avaliação positiva na coluna de avaliação negativa (por exemplo, "não há nada de ruim neste hotel") -- `Review_Total_Negative_Word_Counts` - - Contagens mais altas de palavras negativas indicam uma pontuação mais baixa (sem verificar a sentimentalidade) -- `Positive_Review` - - Se um avaliador não escreveu nada, este campo terá "**No Positive**" - - Note que um avaliador pode escrever uma avaliação negativa na coluna de avaliação positiva (por exemplo, "não há nada de bom neste hotel") -- `Review_Total_Positive_Word_Counts` - - Contagens mais altas de palavras positivas indicam uma pontuação mais alta (sem verificar a sentimentalidade) -- `Review_Date` e `days_since_review` - - Uma medida de frescor ou desatualização pode ser aplicada a uma avaliação (avaliações mais antigas podem não ser tão precisas quanto as mais recentes porque a administração do hotel mudou, ou reformas foram feitas, ou uma piscina foi adicionada etc.) -- `Tags` - - Estas são descrições curtas que um avaliador pode selecionar para descrever o tipo de hóspede que ele era (por exemplo, solo ou família), o tipo de quarto que teve, a duração da estadia e como a avaliação foi enviada. - - Infelizmente, usar essas tags é problemático, veja a seção abaixo que discute sua utilidade. - -**Colunas do avaliador** - -- `Total_Number_of_Reviews_Reviewer_Has_Given` - - Isso pode ser um fator em um modelo de recomendação, por exemplo, se você puder determinar que avaliadores mais prolíficos com centenas de avaliações eram mais propensos a serem negativos do que positivos. No entanto, o avaliador de qualquer avaliação específica não é identificado com um código único e, portanto, não pode ser vinculado a um conjunto de avaliações. Há 30 avaliadores com 100 ou mais avaliações, mas é difícil ver como isso pode ajudar no modelo de recomendação. -- `Reviewer_Nationality` - - Algumas pessoas podem pensar que certas nacionalidades são mais propensas a dar uma avaliação positiva ou negativa devido a uma inclinação nacional. Tenha cuidado ao construir essas visões anedóticas em seus modelos. Estes são estereótipos nacionais (e às vezes raciais), e cada avaliador foi um indivíduo que escreveu uma avaliação com base em sua experiência. Ela pode ter sido filtrada por muitas lentes, como suas estadias anteriores em hotéis, a distância percorrida e seu temperamento pessoal. Pensar que sua nacionalidade foi a razão para uma pontuação de avaliação é difícil de justificar. - -##### Exemplos - -| Average Score | Total Number Reviews | Reviewer Score | Negative
Review | Positive Review | Tags | -| -------------- | ---------------------- | ---------------- | :------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------- | ----------------------------------------------------------------------------------------- | -| 7.8 | 1945 | 2.5 | Este não é atualmente um hotel, mas um canteiro de obras. Fui atormentado desde cedo pela manhã e durante todo o dia com ruídos de construção inaceitáveis enquanto descansava após uma longa viagem e trabalhava no quarto. Pessoas estavam trabalhando o dia todo, ou seja, com martelos nas salas adjacentes. Pedi para trocar de quarto, mas nenhum quarto silencioso estava disponível. Para piorar, fui cobrado a mais. Saí à noite, pois tinha um voo muito cedo e recebi uma conta apropriada. Um dia depois, o hotel fez outra cobrança sem meu consentimento, excedendo o preço reservado. É um lugar terrível. Não se puna reservando aqui. | Nada. Lugar terrível. Fique longe. | Viagem de negócios. Casal. Quarto duplo padrão. Ficou 2 noites. | - -Como você pode ver, este hóspede não teve uma estadia feliz neste hotel. O hotel tem uma boa pontuação média de 7.8 e 1945 avaliações, mas este avaliador deu 2.5 e escreveu 115 palavras sobre como sua estadia foi negativa. Se ele não escreveu nada na coluna Positive_Review, você poderia deduzir que não houve nada positivo, mas ele escreveu 7 palavras de alerta. Se apenas contarmos palavras em vez do significado ou sentimento das palavras, podemos ter uma visão distorcida da intenção do avaliador. Estranhamente, sua pontuação de 2.5 é confusa, porque se a estadia no hotel foi tão ruim, por que dar qualquer ponto? Investigando o conjunto de dados de perto, você verá que a menor pontuação possível é 2.5, não 0. A maior pontuação possível é 10. - -##### Tags - -Como mencionado acima, à primeira vista, a ideia de usar `Tags` para categorizar os dados faz sentido. Infelizmente, essas tags não são padronizadas, o que significa que em um determinado hotel, as opções podem ser *Quarto individual*, *Quarto duplo* e *Quarto twin*, mas no próximo hotel, elas são *Quarto individual deluxe*, *Quarto queen clássico* e *Quarto king executivo*. Estes podem ser a mesma coisa, mas há tantas variações que a escolha se torna: - -1. Tentar alterar todos os termos para um único padrão, o que é muito difícil, porque não está claro qual seria o caminho de conversão em cada caso (por exemplo, *Quarto individual clássico* mapeia para *Quarto individual*, mas *Quarto queen superior com vista para o jardim ou cidade* é muito mais difícil de mapear) - -1. Podemos adotar uma abordagem de NLP e medir a frequência de certos termos como *Solo*, *Viajante de negócios* ou *Família com crianças pequenas* conforme se aplicam a cada hotel, e incluir isso no modelo de recomendação. - -As tags geralmente (mas nem sempre) são um único campo contendo uma lista de 5 a 6 valores separados por vírgulas alinhados a *Tipo de viagem*, *Tipo de hóspede*, *Tipo de quarto*, *Número de noites* e *Tipo de dispositivo usado para enviar a avaliação*. No entanto, como alguns avaliadores não preenchem cada campo (podem deixar um em branco), os valores nem sempre estão na mesma ordem. - -Como exemplo, pegue *Tipo de grupo*. Há 1025 possibilidades únicas neste campo na coluna `Tags`, e infelizmente apenas algumas delas se referem a um grupo (algumas são o tipo de quarto etc.). Se você filtrar apenas os que mencionam família, os resultados contêm muitos tipos de *Quarto familiar*. Se você incluir o termo *com*, ou seja, contar os valores *Família com*, os resultados são melhores, com mais de 80.000 dos 515.000 resultados contendo a frase "Família com crianças pequenas" ou "Família com crianças mais velhas". - -Isso significa que a coluna tags não é completamente inútil para nós, mas exigirá algum trabalho para torná-la útil. - -##### Pontuação média do hotel - -Há uma série de peculiaridades ou discrepâncias com o conjunto de dados que não consigo entender, mas são ilustradas aqui para que você esteja ciente delas ao construir seus modelos. Se você descobrir, por favor, nos avise na seção de discussão! - -O conjunto de dados possui as seguintes colunas relacionadas à pontuação média e ao número de avaliações: - -1. Hotel_Name -2. Additional_Number_of_Scoring -3. Average_Score -4. Total_Number_of_Reviews -5. Reviewer_Score - -O único hotel com mais avaliações neste conjunto de dados é o *Britannia International Hotel Canary Wharf* com 4789 avaliações de um total de 515.000. Mas se olharmos para o valor `Total_Number_of_Reviews` deste hotel, ele é 9086. Você poderia deduzir que há muitas mais pontuações sem avaliações, então talvez devêssemos adicionar o valor da coluna `Additional_Number_of_Scoring`. Esse valor é 2682, e somando-o a 4789 obtemos 7471, que ainda está 1615 abaixo do `Total_Number_of_Reviews`. - -Se você pegar a coluna `Average_Score`, poderia deduzir que é a média das avaliações no conjunto de dados, mas a descrição do Kaggle é "*Pontuação média do hotel, calculada com base no último comentário do último ano*". Isso não parece muito útil, mas podemos calcular nossa própria média com base nas pontuações das avaliações no conjunto de dados. Usando o mesmo hotel como exemplo, a pontuação média do hotel é dada como 7.1, mas a pontuação calculada (média da pontuação dos avaliadores *no* conjunto de dados) é 6.8. Isso é próximo, mas não o mesmo valor, e só podemos supor que as pontuações dadas nas avaliações `Additional_Number_of_Scoring` aumentaram a média para 7.1. Infelizmente, sem uma maneira de testar ou provar essa suposição, é difícil usar ou confiar em `Average_Score`, `Additional_Number_of_Scoring` e `Total_Number_of_Reviews` quando são baseados em, ou se referem a, dados que não temos. - -Para complicar ainda mais, o hotel com o segundo maior número de avaliações tem uma pontuação média calculada de 8.12 e a `Average_Score` do conjunto de dados é 8.1. Essa pontuação correta é uma coincidência ou o primeiro hotel é uma discrepância? - -Na possibilidade de que esses hotéis possam ser um caso atípico, e que talvez a maioria dos valores se alinhe (mas alguns não por algum motivo), escreveremos um pequeno programa a seguir para explorar os valores no conjunto de dados e determinar o uso correto (ou não uso) dos valores. -> 🚨 Uma nota de cautela -> -> Ao trabalhar com este conjunto de dados, você escreverá código que calcula algo a partir do texto sem precisar ler ou analisar o texto diretamente. Essa é a essência do NLP, interpretar significado ou sentimento sem que um humano precise fazê-lo. No entanto, é possível que você acabe lendo algumas das avaliações negativas. Eu recomendo que não faça isso, porque não é necessário. Algumas delas são bobas ou irrelevantes, como avaliações negativas de hotéis do tipo "O clima não estava bom", algo que está fora do controle do hotel ou de qualquer pessoa. Mas há um lado sombrio em algumas avaliações também. Às vezes, as avaliações negativas são racistas, sexistas ou preconceituosas em relação à idade. Isso é lamentável, mas esperado em um conjunto de dados extraído de um site público. Alguns avaliadores deixam comentários que você pode achar desagradáveis, desconfortáveis ou perturbadores. É melhor deixar o código medir o sentimento do que lê-los você mesmo e se sentir incomodado. Dito isso, é uma minoria que escreve tais coisas, mas elas existem mesmo assim. -## Exercício - Exploração de dados -### Carregar os dados - -Chega de examinar os dados visualmente, agora você vai escrever algum código e obter algumas respostas! Esta seção utiliza a biblioteca pandas. Sua primeira tarefa é garantir que você pode carregar e ler os dados do CSV. A biblioteca pandas possui um carregador rápido de CSV, e o resultado é colocado em um dataframe, como nas lições anteriores. O CSV que estamos carregando tem mais de meio milhão de linhas, mas apenas 17 colunas. O pandas oferece várias maneiras poderosas de interagir com um dataframe, incluindo a capacidade de realizar operações em cada linha. - -A partir daqui, nesta lição, haverá trechos de código, algumas explicações sobre o código e discussões sobre o que os resultados significam. Use o _notebook.ipynb_ incluído para o seu código. - -Vamos começar carregando o arquivo de dados que você usará: - -```python -# Load the hotel reviews from CSV -import pandas as pd -import time -# importing time so the start and end time can be used to calculate file loading time -print("Loading data file now, this could take a while depending on file size") -start = time.time() -# df is 'DataFrame' - make sure you downloaded the file to the data folder -df = pd.read_csv('../../data/Hotel_Reviews.csv') -end = time.time() -print("Loading took " + str(round(end - start, 2)) + " seconds") -``` - -Agora que os dados estão carregados, podemos realizar algumas operações com eles. Mantenha este código no topo do seu programa para a próxima parte. - -## Explorar os dados - -Neste caso, os dados já estão *limpos*, o que significa que estão prontos para trabalhar e não possuem caracteres em outros idiomas que possam atrapalhar algoritmos que esperam apenas caracteres em inglês. - -✅ Você pode ter que trabalhar com dados que exigem algum processamento inicial para formatá-los antes de aplicar técnicas de NLP, mas não desta vez. Se fosse necessário, como você lidaria com caracteres que não estão em inglês? - -Reserve um momento para garantir que, uma vez que os dados estejam carregados, você possa explorá-los com código. É muito fácil querer focar nas colunas `Negative_Review` e `Positive_Review`. Elas estão preenchidas com texto natural para seus algoritmos de NLP processarem. Mas espere! Antes de mergulhar no NLP e na análise de sentimentos, você deve seguir o código abaixo para verificar se os valores fornecidos no conjunto de dados correspondem aos valores que você calcula com pandas. - -## Operações com dataframe - -A primeira tarefa desta lição é verificar se as seguintes afirmações estão corretas, escrevendo algum código que examine o dataframe (sem alterá-lo). - -> Como muitas tarefas de programação, há várias maneiras de realizar isso, mas um bom conselho é fazer da maneira mais simples e fácil possível, especialmente se isso for mais fácil de entender quando você voltar a este código no futuro. Com dataframes, há uma API abrangente que frequentemente terá uma maneira eficiente de fazer o que você deseja. - -Trate as seguintes perguntas como tarefas de codificação e tente respondê-las sem olhar para a solução. - -1. Imprima a *forma* do dataframe que você acabou de carregar (a forma é o número de linhas e colunas). -2. Calcule a contagem de frequência para as nacionalidades dos revisores: - 1. Quantos valores distintos existem na coluna `Reviewer_Nationality` e quais são eles? - 2. Qual nacionalidade de revisor é a mais comum no conjunto de dados (imprima o país e o número de avaliações)? - 3. Quais são as 10 nacionalidades mais frequentes e suas contagens de frequência? -3. Qual foi o hotel mais avaliado para cada uma das 10 nacionalidades de revisores mais frequentes? -4. Quantas avaliações existem por hotel (contagem de frequência de hotel) no conjunto de dados? -5. Embora haja uma coluna `Average_Score` para cada hotel no conjunto de dados, você também pode calcular uma pontuação média (obtendo a média de todas as pontuações dos revisores no conjunto de dados para cada hotel). Adicione uma nova coluna ao seu dataframe com o cabeçalho `Calc_Average_Score` que contém essa média calculada. -6. Algum hotel tem o mesmo valor (arredondado para 1 casa decimal) em `Average_Score` e `Calc_Average_Score`? - 1. Tente escrever uma função Python que receba uma Series (linha) como argumento e compare os valores, imprimindo uma mensagem quando os valores não forem iguais. Em seguida, use o método `.apply()` para processar cada linha com a função. -7. Calcule e imprima quantas linhas têm valores "No Negative" na coluna `Negative_Review`. -8. Calcule e imprima quantas linhas têm valores "No Positive" na coluna `Positive_Review`. -9. Calcule e imprima quantas linhas têm valores "No Positive" na coluna `Positive_Review` **e** valores "No Negative" na coluna `Negative_Review`. - -### Respostas em código - -1. Imprima a *forma* do dataframe que você acabou de carregar (a forma é o número de linhas e colunas). - - ```python - print("The shape of the data (rows, cols) is " + str(df.shape)) - > The shape of the data (rows, cols) is (515738, 17) - ``` - -2. Calcule a contagem de frequência para as nacionalidades dos revisores: - - 1. Quantos valores distintos existem na coluna `Reviewer_Nationality` e quais são eles? - 2. Qual nacionalidade de revisor é a mais comum no conjunto de dados (imprima o país e o número de avaliações)? - - ```python - # value_counts() creates a Series object that has index and values in this case, the country and the frequency they occur in reviewer nationality - nationality_freq = df["Reviewer_Nationality"].value_counts() - print("There are " + str(nationality_freq.size) + " different nationalities") - # print first and last rows of the Series. Change to nationality_freq.to_string() to print all of the data - print(nationality_freq) - - There are 227 different nationalities - United Kingdom 245246 - United States of America 35437 - Australia 21686 - Ireland 14827 - United Arab Emirates 10235 - ... - Comoros 1 - Palau 1 - Northern Mariana Islands 1 - Cape Verde 1 - Guinea 1 - Name: Reviewer_Nationality, Length: 227, dtype: int64 - ``` - - 3. Quais são as 10 nacionalidades mais frequentes e suas contagens de frequência? - - ```python - print("The highest frequency reviewer nationality is " + str(nationality_freq.index[0]).strip() + " with " + str(nationality_freq[0]) + " reviews.") - # Notice there is a leading space on the values, strip() removes that for printing - # What is the top 10 most common nationalities and their frequencies? - print("The next 10 highest frequency reviewer nationalities are:") - print(nationality_freq[1:11].to_string()) - - The highest frequency reviewer nationality is United Kingdom with 245246 reviews. - The next 10 highest frequency reviewer nationalities are: - United States of America 35437 - Australia 21686 - Ireland 14827 - United Arab Emirates 10235 - Saudi Arabia 8951 - Netherlands 8772 - Switzerland 8678 - Germany 7941 - Canada 7894 - France 7296 - ``` - -3. Qual foi o hotel mais avaliado para cada uma das 10 nacionalidades de revisores mais frequentes? - - ```python - # What was the most frequently reviewed hotel for the top 10 nationalities - # Normally with pandas you will avoid an explicit loop, but wanted to show creating a new dataframe using criteria (don't do this with large amounts of data because it could be very slow) - for nat in nationality_freq[:10].index: - # First, extract all the rows that match the criteria into a new dataframe - nat_df = df[df["Reviewer_Nationality"] == nat] - # Now get the hotel freq - freq = nat_df["Hotel_Name"].value_counts() - print("The most reviewed hotel for " + str(nat).strip() + " was " + str(freq.index[0]) + " with " + str(freq[0]) + " reviews.") - - The most reviewed hotel for United Kingdom was Britannia International Hotel Canary Wharf with 3833 reviews. - The most reviewed hotel for United States of America was Hotel Esther a with 423 reviews. - The most reviewed hotel for Australia was Park Plaza Westminster Bridge London with 167 reviews. - The most reviewed hotel for Ireland was Copthorne Tara Hotel London Kensington with 239 reviews. - The most reviewed hotel for United Arab Emirates was Millennium Hotel London Knightsbridge with 129 reviews. - The most reviewed hotel for Saudi Arabia was The Cumberland A Guoman Hotel with 142 reviews. - The most reviewed hotel for Netherlands was Jaz Amsterdam with 97 reviews. - The most reviewed hotel for Switzerland was Hotel Da Vinci with 97 reviews. - The most reviewed hotel for Germany was Hotel Da Vinci with 86 reviews. - The most reviewed hotel for Canada was St James Court A Taj Hotel London with 61 reviews. - ``` - -4. Quantas avaliações existem por hotel (contagem de frequência de hotel) no conjunto de dados? - - ```python - # First create a new dataframe based on the old one, removing the uneeded columns - hotel_freq_df = df.drop(["Hotel_Address", "Additional_Number_of_Scoring", "Review_Date", "Average_Score", "Reviewer_Nationality", "Negative_Review", "Review_Total_Negative_Word_Counts", "Positive_Review", "Review_Total_Positive_Word_Counts", "Total_Number_of_Reviews_Reviewer_Has_Given", "Reviewer_Score", "Tags", "days_since_review", "lat", "lng"], axis = 1) - - # Group the rows by Hotel_Name, count them and put the result in a new column Total_Reviews_Found - hotel_freq_df['Total_Reviews_Found'] = hotel_freq_df.groupby('Hotel_Name').transform('count') - - # Get rid of all the duplicated rows - hotel_freq_df = hotel_freq_df.drop_duplicates(subset = ["Hotel_Name"]) - display(hotel_freq_df) - ``` - | Hotel_Name | Total_Number_of_Reviews | Total_Reviews_Found | - | :----------------------------------------: | :---------------------: | :-----------------: | - | Britannia International Hotel Canary Wharf | 9086 | 4789 | - | Park Plaza Westminster Bridge London | 12158 | 4169 | - | Copthorne Tara Hotel London Kensington | 7105 | 3578 | - | ... | ... | ... | - | Mercure Paris Porte d Orleans | 110 | 10 | - | Hotel Wagner | 135 | 10 | - | Hotel Gallitzinberg | 173 | 8 | - - Você pode notar que os resultados *contados no conjunto de dados* não correspondem ao valor em `Total_Number_of_Reviews`. Não está claro se este valor no conjunto de dados representa o número total de avaliações que o hotel teve, mas nem todas foram coletadas, ou algum outro cálculo. `Total_Number_of_Reviews` não é usado no modelo devido a essa falta de clareza. - -5. Embora haja uma coluna `Average_Score` para cada hotel no conjunto de dados, você também pode calcular uma pontuação média (obtendo a média de todas as pontuações dos revisores no conjunto de dados para cada hotel). Adicione uma nova coluna ao seu dataframe com o cabeçalho `Calc_Average_Score` que contém essa média calculada. Imprima as colunas `Hotel_Name`, `Average_Score` e `Calc_Average_Score`. - - ```python - # define a function that takes a row and performs some calculation with it - def get_difference_review_avg(row): - return row["Average_Score"] - row["Calc_Average_Score"] - - # 'mean' is mathematical word for 'average' - df['Calc_Average_Score'] = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1) - - # Add a new column with the difference between the two average scores - df["Average_Score_Difference"] = df.apply(get_difference_review_avg, axis = 1) - - # Create a df without all the duplicates of Hotel_Name (so only 1 row per hotel) - review_scores_df = df.drop_duplicates(subset = ["Hotel_Name"]) - - # Sort the dataframe to find the lowest and highest average score difference - review_scores_df = review_scores_df.sort_values(by=["Average_Score_Difference"]) - - display(review_scores_df[["Average_Score_Difference", "Average_Score", "Calc_Average_Score", "Hotel_Name"]]) - ``` - - Você também pode se perguntar sobre o valor de `Average_Score` e por que ele às vezes é diferente da pontuação média calculada. Como não podemos saber por que alguns valores correspondem, mas outros têm uma diferença, é mais seguro, neste caso, usar as pontuações das avaliações que temos para calcular a média nós mesmos. Dito isso, as diferenças geralmente são muito pequenas. Aqui estão os hotéis com a maior diferença entre a média do conjunto de dados e a média calculada: - - | Average_Score_Difference | Average_Score | Calc_Average_Score | Hotel_Name | - | :----------------------: | :-----------: | :----------------: | ------------------------------------------: | - | -0.8 | 7.7 | 8.5 | Best Western Hotel Astoria | - | -0.7 | 8.8 | 9.5 | Hotel Stendhal Place Vend me Paris MGallery | - | -0.7 | 7.5 | 8.2 | Mercure Paris Porte d Orleans | - | -0.7 | 7.9 | 8.6 | Renaissance Paris Vendome Hotel | - | -0.5 | 7.0 | 7.5 | Hotel Royal Elys es | - | ... | ... | ... | ... | - | 0.7 | 7.5 | 6.8 | Mercure Paris Op ra Faubourg Montmartre | - | 0.8 | 7.1 | 6.3 | Holiday Inn Paris Montparnasse Pasteur | - | 0.9 | 6.8 | 5.9 | Villa Eugenie | - | 0.9 | 8.6 | 7.7 | MARQUIS Faubourg St Honor Relais Ch teaux | - | 1.3 | 7.2 | 5.9 | Kube Hotel Ice Bar | - - Com apenas 1 hotel tendo uma diferença de pontuação maior que 1, isso significa que provavelmente podemos ignorar a diferença e usar a pontuação média calculada. - -6. Calcule e imprima quantas linhas têm valores "No Negative" na coluna `Negative_Review`. - -7. Calcule e imprima quantas linhas têm valores "No Positive" na coluna `Positive_Review`. - -8. Calcule e imprima quantas linhas têm valores "No Positive" na coluna `Positive_Review` **e** valores "No Negative" na coluna `Negative_Review`. - - ```python - # with lambdas: - start = time.time() - no_negative_reviews = df.apply(lambda x: True if x['Negative_Review'] == "No Negative" else False , axis=1) - print("Number of No Negative reviews: " + str(len(no_negative_reviews[no_negative_reviews == True].index))) - - no_positive_reviews = df.apply(lambda x: True if x['Positive_Review'] == "No Positive" else False , axis=1) - print("Number of No Positive reviews: " + str(len(no_positive_reviews[no_positive_reviews == True].index))) - - both_no_reviews = df.apply(lambda x: True if x['Negative_Review'] == "No Negative" and x['Positive_Review'] == "No Positive" else False , axis=1) - print("Number of both No Negative and No Positive reviews: " + str(len(both_no_reviews[both_no_reviews == True].index))) - end = time.time() - print("Lambdas took " + str(round(end - start, 2)) + " seconds") - - Number of No Negative reviews: 127890 - Number of No Positive reviews: 35946 - Number of both No Negative and No Positive reviews: 127 - Lambdas took 9.64 seconds - ``` - -## Outra maneira - -Outra maneira de contar itens sem Lambdas e usar sum para contar as linhas: - - ```python - # without lambdas (using a mixture of notations to show you can use both) - start = time.time() - no_negative_reviews = sum(df.Negative_Review == "No Negative") - print("Number of No Negative reviews: " + str(no_negative_reviews)) - - no_positive_reviews = sum(df["Positive_Review"] == "No Positive") - print("Number of No Positive reviews: " + str(no_positive_reviews)) - - both_no_reviews = sum((df.Negative_Review == "No Negative") & (df.Positive_Review == "No Positive")) - print("Number of both No Negative and No Positive reviews: " + str(both_no_reviews)) - - end = time.time() - print("Sum took " + str(round(end - start, 2)) + " seconds") - - Number of No Negative reviews: 127890 - Number of No Positive reviews: 35946 - Number of both No Negative and No Positive reviews: 127 - Sum took 0.19 seconds - ``` - - Você pode ter notado que há 127 linhas que têm valores "No Negative" e "No Positive" nas colunas `Negative_Review` e `Positive_Review`, respectivamente. Isso significa que o revisor deu ao hotel uma pontuação numérica, mas optou por não escrever uma avaliação positiva ou negativa. Felizmente, isso é uma pequena quantidade de linhas (127 de 515738, ou 0,02%), então provavelmente não vai distorcer nosso modelo ou resultados em nenhuma direção específica, mas você pode não ter esperado que um conjunto de dados de avaliações tivesse linhas sem avaliações, então vale a pena explorar os dados para descobrir linhas como esta. - -Agora que você explorou o conjunto de dados, na próxima lição você filtrará os dados e adicionará alguma análise de sentimentos. - ---- -## 🚀Desafio - -Esta lição demonstra, como vimos em lições anteriores, o quão importante é entender seus dados e suas peculiaridades antes de realizar operações com eles. Dados baseados em texto, em particular, exigem uma análise cuidadosa. Explore vários conjuntos de dados ricos em texto e veja se você consegue descobrir áreas que poderiam introduzir viés ou sentimentos distorcidos em um modelo. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Faça [este Caminho de Aprendizado sobre NLP](https://docs.microsoft.com/learn/paths/explore-natural-language-processing/?WT.mc_id=academic-77952-leestott) para descobrir ferramentas para experimentar ao construir modelos baseados em fala e texto. - -## Tarefa - -[NLTK](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/4-Hotel-Reviews-1/assignment.md b/translations/br/6-NLP/4-Hotel-Reviews-1/assignment.md deleted file mode 100644 index 3dbb4a869..000000000 --- a/translations/br/6-NLP/4-Hotel-Reviews-1/assignment.md +++ /dev/null @@ -1,19 +0,0 @@ - -# NLTK - -## Instruções - -NLTK é uma biblioteca renomada para uso em linguística computacional e processamento de linguagem natural (NLP). Aproveite esta oportunidade para ler o '[livro do NLTK](https://www.nltk.org/book/)' e experimentar seus exercícios. Nesta tarefa não avaliada, você terá a chance de conhecer esta biblioteca mais a fundo. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/4-Hotel-Reviews-1/notebook.ipynb b/translations/br/6-NLP/4-Hotel-Reviews-1/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/br/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md b/translations/br/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md deleted file mode 100644 index 91c3931fb..000000000 --- a/translations/br/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/4-Hotel-Reviews-1/solution/R/README.md b/translations/br/6-NLP/4-Hotel-Reviews-1/solution/R/README.md deleted file mode 100644 index 05d30f771..000000000 --- a/translations/br/6-NLP/4-Hotel-Reviews-1/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb b/translations/br/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb deleted file mode 100644 index 5881f48d2..000000000 --- a/translations/br/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb +++ /dev/null @@ -1,174 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 4, - "coopTranslator": { - "original_hash": "2d05e7db439376aa824f4b387f8324ca", - "translation_date": "2025-08-30T00:14:37+00:00", - "source_file": "6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# EDA\n", - "import pandas as pd\n", - "import time" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "def get_difference_review_avg(row):\n", - " return row[\"Average_Score\"] - row[\"Calc_Average_Score\"]" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV\n", - "print(\"Loading data file now, this could take a while depending on file size\")\n", - "start = time.time()\n", - "df = pd.read_csv('../../data/Hotel_Reviews.csv')\n", - "end = time.time()\n", - "print(\"Loading took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What shape is the data (rows, columns)?\n", - "print(\"The shape of the data (rows, cols) is \" + str(df.shape))\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# value_counts() creates a Series object that has index and values\n", - "# in this case, the country and the frequency they occur in reviewer nationality\n", - "nationality_freq = df[\"Reviewer_Nationality\"].value_counts()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What reviewer nationality is the most common in the dataset?\n", - "print(\"The highest frequency reviewer nationality is \" + str(nationality_freq.index[0]).strip() + \" with \" + str(nationality_freq[0]) + \" reviews.\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What is the top 10 most common nationalities and their frequencies?\n", - "print(\"The top 10 highest frequency reviewer nationalities are:\")\n", - "print(nationality_freq[0:10].to_string())\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# How many unique nationalities are there?\n", - "print(\"There are \" + str(nationality_freq.index.size) + \" unique nationalities in the dataset\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What was the most frequently reviewed hotel for the top 10 nationalities - print the hotel and number of reviews\n", - "for nat in nationality_freq[:10].index:\n", - " # First, extract all the rows that match the criteria into a new dataframe\n", - " nat_df = df[df[\"Reviewer_Nationality\"] == nat] \n", - " # Now get the hotel freq\n", - " freq = nat_df[\"Hotel_Name\"].value_counts()\n", - " print(\"The most reviewed hotel for \" + str(nat).strip() + \" was \" + str(freq.index[0]) + \" with \" + str(freq[0]) + \" reviews.\") \n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# How many reviews are there per hotel (frequency count of hotel) and do the results match the value in `Total_Number_of_Reviews`?\n", - "# First create a new dataframe based on the old one, removing the uneeded columns\n", - "hotel_freq_df = df.drop([\"Hotel_Address\", \"Additional_Number_of_Scoring\", \"Review_Date\", \"Average_Score\", \"Reviewer_Nationality\", \"Negative_Review\", \"Review_Total_Negative_Word_Counts\", \"Positive_Review\", \"Review_Total_Positive_Word_Counts\", \"Total_Number_of_Reviews_Reviewer_Has_Given\", \"Reviewer_Score\", \"Tags\", \"days_since_review\", \"lat\", \"lng\"], axis = 1)\n", - "# Group the rows by Hotel_Name, count them and put the result in a new column Total_Reviews_Found\n", - "hotel_freq_df['Total_Reviews_Found'] = hotel_freq_df.groupby('Hotel_Name').transform('count')\n", - "# Get rid of all the duplicated rows\n", - "hotel_freq_df = hotel_freq_df.drop_duplicates(subset = [\"Hotel_Name\"])\n", - "print()\n", - "print(hotel_freq_df.to_string())\n", - "print(str(hotel_freq_df.shape))" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# While there is an `Average_Score` for each hotel according to the dataset, \n", - "# you can also calculate an average score (getting the average of all reviewer scores in the dataset for each hotel)\n", - "# Add a new column to your dataframe with the column header `Calc_Average_Score` that contains that calculated average. \n", - "df['Calc_Average_Score'] = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1)\n", - "# Add a new column with the difference between the two average scores\n", - "df[\"Average_Score_Difference\"] = df.apply(get_difference_review_avg, axis = 1)\n", - "# Create a df without all the duplicates of Hotel_Name (so only 1 row per hotel)\n", - "review_scores_df = df.drop_duplicates(subset = [\"Hotel_Name\"])\n", - "# Sort the dataframe to find the lowest and highest average score difference\n", - "review_scores_df = review_scores_df.sort_values(by=[\"Average_Score_Difference\"])\n", - "print(review_scores_df[[\"Average_Score_Difference\", \"Average_Score\", \"Calc_Average_Score\", \"Hotel_Name\"]])\n", - "# Do any hotels have the same (rounded to 1 decimal place) `Average_Score` and `Calc_Average_Score`?\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/README.md b/translations/br/6-NLP/5-Hotel-Reviews-2/README.md deleted file mode 100644 index 04f855251..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/README.md +++ /dev/null @@ -1,389 +0,0 @@ - -# Análise de sentimento com avaliações de hotéis - -Agora que você explorou o conjunto de dados em detalhes, é hora de filtrar as colunas e usar técnicas de NLP no conjunto de dados para obter novos insights sobre os hotéis. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Operações de filtragem e análise de sentimento - -Como você provavelmente percebeu, o conjunto de dados tem alguns problemas. Algumas colunas estão preenchidas com informações inúteis, outras parecem incorretas. Mesmo que estejam corretas, não está claro como foram calculadas, e as respostas não podem ser verificadas de forma independente por seus próprios cálculos. - -## Exercício: um pouco mais de processamento de dados - -Limpe os dados um pouco mais. Adicione colunas que serão úteis mais tarde, altere os valores em outras colunas e elimine algumas colunas completamente. - -1. Processamento inicial de colunas - - 1. Elimine `lat` e `lng` - - 2. Substitua os valores de `Hotel_Address` pelos seguintes valores (se o endereço contiver o nome da cidade e do país, altere para apenas a cidade e o país). - - Estas são as únicas cidades e países no conjunto de dados: - - Amsterdam, Netherlands - - Barcelona, Spain - - London, United Kingdom - - Milan, Italy - - Paris, France - - Vienna, Austria - - ```python - def replace_address(row): - if "Netherlands" in row["Hotel_Address"]: - return "Amsterdam, Netherlands" - elif "Barcelona" in row["Hotel_Address"]: - return "Barcelona, Spain" - elif "United Kingdom" in row["Hotel_Address"]: - return "London, United Kingdom" - elif "Milan" in row["Hotel_Address"]: - return "Milan, Italy" - elif "France" in row["Hotel_Address"]: - return "Paris, France" - elif "Vienna" in row["Hotel_Address"]: - return "Vienna, Austria" - - # Replace all the addresses with a shortened, more useful form - df["Hotel_Address"] = df.apply(replace_address, axis = 1) - # The sum of the value_counts() should add up to the total number of reviews - print(df["Hotel_Address"].value_counts()) - ``` - - Agora você pode consultar dados a nível de país: - - ```python - display(df.groupby("Hotel_Address").agg({"Hotel_Name": "nunique"})) - ``` - - | Hotel_Address | Hotel_Name | - | :--------------------- | :--------: | - | Amsterdam, Netherlands | 105 | - | Barcelona, Spain | 211 | - | London, United Kingdom | 400 | - | Milan, Italy | 162 | - | Paris, France | 458 | - | Vienna, Austria | 158 | - -2. Processar colunas de meta-avaliação dos hotéis - - 1. Elimine `Additional_Number_of_Scoring` - - 1. Substitua `Total_Number_of_Reviews` pelo número total de avaliações para aquele hotel que realmente estão no conjunto de dados - - 1. Substitua `Average_Score` pela nossa própria pontuação calculada - - ```python - # Drop `Additional_Number_of_Scoring` - df.drop(["Additional_Number_of_Scoring"], axis = 1, inplace=True) - # Replace `Total_Number_of_Reviews` and `Average_Score` with our own calculated values - df.Total_Number_of_Reviews = df.groupby('Hotel_Name').transform('count') - df.Average_Score = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1) - ``` - -3. Processar colunas de avaliação - - 1. Elimine `Review_Total_Negative_Word_Counts`, `Review_Total_Positive_Word_Counts`, `Review_Date` e `days_since_review` - - 2. Mantenha `Reviewer_Score`, `Negative_Review` e `Positive_Review` como estão - - 3. Mantenha `Tags` por enquanto - - - Faremos algumas operações adicionais de filtragem nas tags na próxima seção e, em seguida, as tags serão eliminadas - -4. Processar colunas de avaliadores - - 1. Elimine `Total_Number_of_Reviews_Reviewer_Has_Given` - - 2. Mantenha `Reviewer_Nationality` - -### Colunas de tags - -A coluna `Tag` é problemática, pois é uma lista (em formato de texto) armazenada na coluna. Infelizmente, a ordem e o número de subseções nesta coluna nem sempre são os mesmos. É difícil para um humano identificar as frases corretas de interesse, porque há 515.000 linhas e 1427 hotéis, e cada um tem opções ligeiramente diferentes que um avaliador poderia escolher. É aqui que o NLP se destaca. Você pode escanear o texto e encontrar as frases mais comuns, e contá-las. - -Infelizmente, não estamos interessados em palavras isoladas, mas em frases compostas (por exemplo, *Viagem de negócios*). Executar um algoritmo de distribuição de frequência de frases compostas em tantos dados (6762646 palavras) pode levar um tempo extraordinário, mas sem olhar para os dados, parece que isso é uma despesa necessária. É aqui que a análise exploratória de dados é útil, porque você viu uma amostra das tags como `[' Business trip ', ' Solo traveler ', ' Single Room ', ' Stayed 5 nights ', ' Submitted from a mobile device ']`, você pode começar a perguntar se é possível reduzir significativamente o processamento necessário. Felizmente, é - mas primeiro você precisa seguir alguns passos para determinar as tags de interesse. - -### Filtrando tags - -Lembre-se de que o objetivo do conjunto de dados é adicionar sentimento e colunas que ajudarão você a escolher o melhor hotel (para você ou talvez para um cliente que lhe pediu para criar um bot de recomendação de hotéis). Você precisa se perguntar se as tags são úteis ou não no conjunto de dados final. Aqui está uma interpretação (se você precisasse do conjunto de dados para outros motivos, tags diferentes poderiam permanecer/ser removidas da seleção): - -1. O tipo de viagem é relevante e deve permanecer -2. O tipo de grupo de hóspedes é importante e deve permanecer -3. O tipo de quarto, suíte ou estúdio em que o hóspede ficou é irrelevante (todos os hotéis têm basicamente os mesmos quartos) -4. O dispositivo no qual a avaliação foi enviada é irrelevante -5. O número de noites que o avaliador ficou *poderia* ser relevante se você atribuísse estadias mais longas ao fato de eles gostarem mais do hotel, mas é algo incerto e provavelmente irrelevante - -Em resumo, **mantenha 2 tipos de tags e remova as outras**. - -Primeiro, você não quer contar as tags até que estejam em um formato melhor, o que significa remover os colchetes e aspas. Você pode fazer isso de várias maneiras, mas deve escolher a mais rápida, pois pode levar muito tempo para processar muitos dados. Felizmente, o pandas tem uma maneira fácil de realizar cada uma dessas etapas. - -```Python -# Remove opening and closing brackets -df.Tags = df.Tags.str.strip("[']") -# remove all quotes too -df.Tags = df.Tags.str.replace(" ', '", ",", regex = False) -``` - -Cada tag se torna algo como: `Business trip, Solo traveler, Single Room, Stayed 5 nights, Submitted from a mobile device`. - -Em seguida, encontramos um problema. Algumas avaliações, ou linhas, têm 5 colunas, outras 3, outras 6. Isso é resultado de como o conjunto de dados foi criado e difícil de corrigir. Você quer obter uma contagem de frequência de cada frase, mas elas estão em ordens diferentes em cada avaliação, então a contagem pode estar errada, e um hotel pode não receber uma tag que merecia. - -Em vez disso, você usará a ordem diferente a seu favor, porque cada tag é composta por várias palavras, mas também separada por uma vírgula! A maneira mais simples de fazer isso é criar 6 colunas temporárias com cada tag inserida na coluna correspondente à sua ordem na tag. Você pode então mesclar as 6 colunas em uma grande coluna e executar o método `value_counts()` na coluna resultante. Ao imprimir isso, você verá que havia 2428 tags únicas. Aqui está uma pequena amostra: - -| Tag | Count | -| ------------------------------ | ------ | -| Leisure trip | 417778 | -| Submitted from a mobile device | 307640 | -| Couple | 252294 | -| Stayed 1 night | 193645 | -| Stayed 2 nights | 133937 | -| Solo traveler | 108545 | -| Stayed 3 nights | 95821 | -| Business trip | 82939 | -| Group | 65392 | -| Family with young children | 61015 | -| Stayed 4 nights | 47817 | -| Double Room | 35207 | -| Standard Double Room | 32248 | -| Superior Double Room | 31393 | -| Family with older children | 26349 | -| Deluxe Double Room | 24823 | -| Double or Twin Room | 22393 | -| Stayed 5 nights | 20845 | -| Standard Double or Twin Room | 17483 | -| Classic Double Room | 16989 | -| Superior Double or Twin Room | 13570 | -| 2 rooms | 12393 | - -Algumas das tags comuns, como `Submitted from a mobile device`, não são úteis para nós, então pode ser inteligente removê-las antes de contar a ocorrência de frases, mas é uma operação tão rápida que você pode deixá-las e ignorá-las. - -### Removendo tags de duração da estadia - -Remover essas tags é o primeiro passo, reduzindo ligeiramente o número total de tags a serem consideradas. Note que você não as remove do conjunto de dados, apenas escolhe removê-las da consideração como valores a serem contados/mantidos no conjunto de dados de avaliações. - -| Length of stay | Count | -| ---------------- | ------ | -| Stayed 1 night | 193645 | -| Stayed 2 nights | 133937 | -| Stayed 3 nights | 95821 | -| Stayed 4 nights | 47817 | -| Stayed 5 nights | 20845 | -| Stayed 6 nights | 9776 | -| Stayed 7 nights | 7399 | -| Stayed 8 nights | 2502 | -| Stayed 9 nights | 1293 | -| ... | ... | - -Há uma enorme variedade de quartos, suítes, estúdios, apartamentos e assim por diante. Todos significam basicamente a mesma coisa e não são relevantes para você, então remova-os da consideração. - -| Type of room | Count | -| ----------------------------- | ----- | -| Double Room | 35207 | -| Standard Double Room | 32248 | -| Superior Double Room | 31393 | -| Deluxe Double Room | 24823 | -| Double or Twin Room | 22393 | -| Standard Double or Twin Room | 17483 | -| Classic Double Room | 16989 | -| Superior Double or Twin Room | 13570 | - -Finalmente, e isso é ótimo (porque não exigiu muito processamento), você ficará com as seguintes tags *úteis*: - -| Tag | Count | -| --------------------------------------------- | ------ | -| Leisure trip | 417778 | -| Couple | 252294 | -| Solo traveler | 108545 | -| Business trip | 82939 | -| Group (combined with Travellers with friends) | 67535 | -| Family with young children | 61015 | -| Family with older children | 26349 | -| With a pet | 1405 | - -Você poderia argumentar que `Travellers with friends` é o mesmo que `Group` mais ou menos, e seria justo combinar os dois como acima. O código para identificar as tags corretas está no [notebook de Tags](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb). - -O passo final é criar novas colunas para cada uma dessas tags. Então, para cada linha de avaliação, se a coluna `Tag` corresponder a uma das novas colunas, adicione 1, caso contrário, adicione 0. O resultado final será uma contagem de quantos avaliadores escolheram este hotel (em agregado) para, por exemplo, negócios vs lazer, ou para trazer um animal de estimação, e isso é informação útil ao recomendar um hotel. - -```python -# Process the Tags into new columns -# The file Hotel_Reviews_Tags.py, identifies the most important tags -# Leisure trip, Couple, Solo traveler, Business trip, Group combined with Travelers with friends, -# Family with young children, Family with older children, With a pet -df["Leisure_trip"] = df.Tags.apply(lambda tag: 1 if "Leisure trip" in tag else 0) -df["Couple"] = df.Tags.apply(lambda tag: 1 if "Couple" in tag else 0) -df["Solo_traveler"] = df.Tags.apply(lambda tag: 1 if "Solo traveler" in tag else 0) -df["Business_trip"] = df.Tags.apply(lambda tag: 1 if "Business trip" in tag else 0) -df["Group"] = df.Tags.apply(lambda tag: 1 if "Group" in tag or "Travelers with friends" in tag else 0) -df["Family_with_young_children"] = df.Tags.apply(lambda tag: 1 if "Family with young children" in tag else 0) -df["Family_with_older_children"] = df.Tags.apply(lambda tag: 1 if "Family with older children" in tag else 0) -df["With_a_pet"] = df.Tags.apply(lambda tag: 1 if "With a pet" in tag else 0) - -``` - -### Salve seu arquivo - -Finalmente, salve o conjunto de dados como está agora com um novo nome. - -```python -df.drop(["Review_Total_Negative_Word_Counts", "Review_Total_Positive_Word_Counts", "days_since_review", "Total_Number_of_Reviews_Reviewer_Has_Given"], axis = 1, inplace=True) - -# Saving new data file with calculated columns -print("Saving results to Hotel_Reviews_Filtered.csv") -df.to_csv(r'../data/Hotel_Reviews_Filtered.csv', index = False) -``` - -## Operações de análise de sentimento - -Nesta seção final, você aplicará análise de sentimento às colunas de avaliação e salvará os resultados em um conjunto de dados. - -## Exercício: carregar e salvar os dados filtrados - -Note que agora você está carregando o conjunto de dados filtrado que foi salvo na seção anterior, **não** o conjunto de dados original. - -```python -import time -import pandas as pd -import nltk as nltk -from nltk.corpus import stopwords -from nltk.sentiment.vader import SentimentIntensityAnalyzer -nltk.download('vader_lexicon') - -# Load the filtered hotel reviews from CSV -df = pd.read_csv('../../data/Hotel_Reviews_Filtered.csv') - -# You code will be added here - - -# Finally remember to save the hotel reviews with new NLP data added -print("Saving results to Hotel_Reviews_NLP.csv") -df.to_csv(r'../data/Hotel_Reviews_NLP.csv', index = False) -``` - -### Removendo stop words - -Se você fosse executar a análise de sentimento nas colunas de avaliação negativa e positiva, isso poderia levar muito tempo. Testado em um laptop de teste poderoso com CPU rápida, levou de 12 a 14 minutos, dependendo de qual biblioteca de análise de sentimento foi usada. Esse é um tempo (relativamente) longo, então vale a pena investigar se isso pode ser acelerado. - -Remover stop words, ou palavras comuns em inglês que não alteram o sentimento de uma frase, é o primeiro passo. Ao removê-las, a análise de sentimento deve ser mais rápida, mas não menos precisa (já que as stop words não afetam o sentimento, mas elas desaceleram a análise). - -A avaliação negativa mais longa tinha 395 palavras, mas após remover as stop words, ficou com 195 palavras. - -Remover as stop words também é uma operação rápida, removê-las de 2 colunas de avaliação em mais de 515.000 linhas levou 3,3 segundos no dispositivo de teste. Pode levar um pouco mais ou menos tempo para você, dependendo da velocidade da CPU do seu dispositivo, RAM, se você tem um SSD ou não, e outros fatores. A relativa rapidez da operação significa que, se ela melhorar o tempo de análise de sentimento, então vale a pena fazer. - -```python -from nltk.corpus import stopwords - -# Load the hotel reviews from CSV -df = pd.read_csv("../../data/Hotel_Reviews_Filtered.csv") - -# Remove stop words - can be slow for a lot of text! -# Ryan Han (ryanxjhan on Kaggle) has a great post measuring performance of different stop words removal approaches -# https://www.kaggle.com/ryanxjhan/fast-stop-words-removal # using the approach that Ryan recommends -start = time.time() -cache = set(stopwords.words("english")) -def remove_stopwords(review): - text = " ".join([word for word in review.split() if word not in cache]) - return text - -# Remove the stop words from both columns -df.Negative_Review = df.Negative_Review.apply(remove_stopwords) -df.Positive_Review = df.Positive_Review.apply(remove_stopwords) -``` - -### Realizando análise de sentimento - -Agora você deve calcular a análise de sentimento para as colunas de avaliação negativa e positiva e armazenar o resultado em 2 novas colunas. O teste da análise de sentimento será compará-lo com a pontuação do avaliador para a mesma avaliação. Por exemplo, se a análise de sentimento indicar que a avaliação negativa teve um sentimento de 1 (sentimento extremamente positivo) e a avaliação positiva também teve um sentimento de 1, mas o avaliador deu ao hotel a menor pontuação possível, então ou o texto da avaliação não corresponde à pontuação, ou o analisador de sentimento não conseguiu reconhecer o sentimento corretamente. Você deve esperar que algumas pontuações de sentimento estejam completamente erradas, e muitas vezes isso será explicável, por exemplo, a avaliação pode ser extremamente sarcástica: "Claro que eu AMEI dormir em um quarto sem aquecimento", e o analisador de sentimento pode interpretar isso como um sentimento positivo, mesmo que um humano lendo saiba que foi sarcasmo. -O NLTK oferece diferentes analisadores de sentimento para você experimentar, e é possível substituí-los para verificar se a análise de sentimento é mais ou menos precisa. Aqui, utilizamos a análise de sentimento VADER. - -> Hutto, C.J. & Gilbert, E.E. (2014). VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text. Eighth International Conference on Weblogs and Social Media (ICWSM-14). Ann Arbor, MI, junho de 2014. - -```python -from nltk.sentiment.vader import SentimentIntensityAnalyzer - -# Create the vader sentiment analyser (there are others in NLTK you can try too) -vader_sentiment = SentimentIntensityAnalyzer() -# Hutto, C.J. & Gilbert, E.E. (2014). VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text. Eighth International Conference on Weblogs and Social Media (ICWSM-14). Ann Arbor, MI, June 2014. - -# There are 3 possibilities of input for a review: -# It could be "No Negative", in which case, return 0 -# It could be "No Positive", in which case, return 0 -# It could be a review, in which case calculate the sentiment -def calc_sentiment(review): - if review == "No Negative" or review == "No Positive": - return 0 - return vader_sentiment.polarity_scores(review)["compound"] -``` - -Mais tarde, no seu programa, quando estiver pronto para calcular o sentimento, você pode aplicá-lo a cada avaliação da seguinte forma: - -```python -# Add a negative sentiment and positive sentiment column -print("Calculating sentiment columns for both positive and negative reviews") -start = time.time() -df["Negative_Sentiment"] = df.Negative_Review.apply(calc_sentiment) -df["Positive_Sentiment"] = df.Positive_Review.apply(calc_sentiment) -end = time.time() -print("Calculating sentiment took " + str(round(end - start, 2)) + " seconds") -``` - -Isso leva aproximadamente 120 segundos no meu computador, mas o tempo pode variar dependendo do computador. Se você quiser imprimir os resultados e verificar se o sentimento corresponde à avaliação: - -```python -df = df.sort_values(by=["Negative_Sentiment"], ascending=True) -print(df[["Negative_Review", "Negative_Sentiment"]]) -df = df.sort_values(by=["Positive_Sentiment"], ascending=True) -print(df[["Positive_Review", "Positive_Sentiment"]]) -``` - -A última coisa a fazer com o arquivo antes de usá-lo no desafio é salvá-lo! Também é recomendável reorganizar todas as suas novas colunas para que sejam fáceis de trabalhar (para um humano, é uma mudança estética). - -```python -# Reorder the columns (This is cosmetic, but to make it easier to explore the data later) -df = df.reindex(["Hotel_Name", "Hotel_Address", "Total_Number_of_Reviews", "Average_Score", "Reviewer_Score", "Negative_Sentiment", "Positive_Sentiment", "Reviewer_Nationality", "Leisure_trip", "Couple", "Solo_traveler", "Business_trip", "Group", "Family_with_young_children", "Family_with_older_children", "With_a_pet", "Negative_Review", "Positive_Review"], axis=1) - -print("Saving results to Hotel_Reviews_NLP.csv") -df.to_csv(r"../data/Hotel_Reviews_NLP.csv", index = False) -``` - -Você deve executar todo o código do [notebook de análise](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb) (depois de executar o [notebook de filtragem](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb) para gerar o arquivo Hotel_Reviews_Filtered.csv). - -Para revisar, os passos são: - -1. O arquivo do conjunto de dados original **Hotel_Reviews.csv** é explorado na lição anterior com o [notebook de exploração](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb) -2. O arquivo Hotel_Reviews.csv é filtrado pelo [notebook de filtragem](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb), resultando no **Hotel_Reviews_Filtered.csv** -3. O arquivo Hotel_Reviews_Filtered.csv é processado pelo [notebook de análise de sentimento](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb), resultando no **Hotel_Reviews_NLP.csv** -4. Use o arquivo Hotel_Reviews_NLP.csv no Desafio de NLP abaixo - -### Conclusão - -Quando você começou, tinha um conjunto de dados com colunas e informações, mas nem tudo podia ser verificado ou utilizado. Você explorou os dados, filtrou o que não era necessário, converteu tags em algo útil, calculou suas próprias médias, adicionou algumas colunas de sentimento e, com sorte, aprendeu coisas interessantes sobre o processamento de texto natural. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Desafio - -Agora que você analisou o sentimento do seu conjunto de dados, veja se consegue usar as estratégias aprendidas neste curso (talvez clustering?) para identificar padrões relacionados ao sentimento. - -## Revisão e Autoestudo - -Faça [este módulo do Learn](https://docs.microsoft.com/en-us/learn/modules/classify-user-feedback-with-the-text-analytics-api/?WT.mc_id=academic-77952-leestott) para aprender mais e usar ferramentas diferentes para explorar o sentimento em textos. - -## Tarefa - -[Experimente um conjunto de dados diferente](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/assignment.md b/translations/br/6-NLP/5-Hotel-Reviews-2/assignment.md deleted file mode 100644 index 246dbfb5e..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Experimente um conjunto de dados diferente - -## Instruções - -Agora que você aprendeu a usar o NLTK para atribuir sentimento a textos, experimente um conjunto de dados diferente. Você provavelmente precisará realizar algum processamento nos dados, então crie um notebook e documente seu raciocínio. O que você descobre? - -## Rubrica - -| Critério | Exemplares | Adequado | Precisa de Melhorias | -| -------- | ---------------------------------------------------------------------------------------------------------------- | ----------------------------------------- | ----------------------- | -| | Um notebook completo e um conjunto de dados são apresentados com células bem documentadas explicando como o sentimento é atribuído | O notebook está faltando boas explicações | O notebook apresenta falhas | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/notebook.ipynb b/translations/br/6-NLP/5-Hotel-Reviews-2/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb b/translations/br/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb deleted file mode 100644 index d08397733..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb +++ /dev/null @@ -1,172 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "033cb89c85500224b3c63fd04f49b4aa", - "translation_date": "2025-08-30T00:15:03+00:00", - "source_file": "6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import time\n", - "import ast" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "def replace_address(row):\n", - " if \"Netherlands\" in row[\"Hotel_Address\"]:\n", - " return \"Amsterdam, Netherlands\"\n", - " elif \"Barcelona\" in row[\"Hotel_Address\"]:\n", - " return \"Barcelona, Spain\"\n", - " elif \"United Kingdom\" in row[\"Hotel_Address\"]:\n", - " return \"London, United Kingdom\"\n", - " elif \"Milan\" in row[\"Hotel_Address\"]: \n", - " return \"Milan, Italy\"\n", - " elif \"France\" in row[\"Hotel_Address\"]:\n", - " return \"Paris, France\"\n", - " elif \"Vienna\" in row[\"Hotel_Address\"]:\n", - " return \"Vienna, Austria\" \n", - " else:\n", - " return row.Hotel_Address\n", - " " - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV\n", - "start = time.time()\n", - "df = pd.read_csv('../../data/Hotel_Reviews.csv')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "# dropping columns we will not use:\n", - "df.drop([\"lat\", \"lng\"], axis = 1, inplace=True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "# Replace all the addresses with a shortened, more useful form\n", - "df[\"Hotel_Address\"] = df.apply(replace_address, axis = 1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "# Drop `Additional_Number_of_Scoring`\n", - "df.drop([\"Additional_Number_of_Scoring\"], axis = 1, inplace=True)\n", - "# Replace `Total_Number_of_Reviews` and `Average_Score` with our own calculated values\n", - "df.Total_Number_of_Reviews = df.groupby('Hotel_Name').transform('count')\n", - "df.Average_Score = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "# Process the Tags into new columns\n", - "# The file Hotel_Reviews_Tags.py, identifies the most important tags\n", - "# Leisure trip, Couple, Solo traveler, Business trip, Group combined with Travelers with friends, \n", - "# Family with young children, Family with older children, With a pet\n", - "df[\"Leisure_trip\"] = df.Tags.apply(lambda tag: 1 if \"Leisure trip\" in tag else 0)\n", - "df[\"Couple\"] = df.Tags.apply(lambda tag: 1 if \"Couple\" in tag else 0)\n", - "df[\"Solo_traveler\"] = df.Tags.apply(lambda tag: 1 if \"Solo traveler\" in tag else 0)\n", - "df[\"Business_trip\"] = df.Tags.apply(lambda tag: 1 if \"Business trip\" in tag else 0)\n", - "df[\"Group\"] = df.Tags.apply(lambda tag: 1 if \"Group\" in tag or \"Travelers with friends\" in tag else 0)\n", - "df[\"Family_with_young_children\"] = df.Tags.apply(lambda tag: 1 if \"Family with young children\" in tag else 0)\n", - "df[\"Family_with_older_children\"] = df.Tags.apply(lambda tag: 1 if \"Family with older children\" in tag else 0)\n", - "df[\"With_a_pet\"] = df.Tags.apply(lambda tag: 1 if \"With a pet\" in tag else 0)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "# No longer need any of these columns\n", - "df.drop([\"Review_Date\", \"Review_Total_Negative_Word_Counts\", \"Review_Total_Positive_Word_Counts\", \"days_since_review\", \"Total_Number_of_Reviews_Reviewer_Has_Given\"], axis = 1, inplace=True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Saving results to Hotel_Reviews_Filtered.csv\n", - "Filtering took 23.74 seconds\n" - ] - } - ], - "source": [ - "# Saving new data file with calculated columns\n", - "print(\"Saving results to Hotel_Reviews_Filtered.csv\")\n", - "df.to_csv(r'../../data/Hotel_Reviews_Filtered.csv', index = False)\n", - "end = time.time()\n", - "print(\"Filtering took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb b/translations/br/6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb deleted file mode 100644 index 7da8660dc..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb +++ /dev/null @@ -1,137 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "341efc86325ec2a214f682f57a189dfd", - "translation_date": "2025-08-30T00:15:16+00:00", - "source_file": "6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV (you can )\n", - "import pandas as pd \n", - "\n", - "df = pd.read_csv('../../data/Hotel_Reviews_Filtered.csv')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "# We want to find the most useful tags to keep\n", - "# Remove opening and closing brackets\n", - "df.Tags = df.Tags.str.strip(\"[']\")\n", - "# remove all quotes too\n", - "df.Tags = df.Tags.str.replace(\" ', '\", \",\", regex = False)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "# removing this to take advantage of the 'already a phrase' fact of the dataset \n", - "# Now split the strings into a list\n", - "tag_list_df = df.Tags.str.split(',', expand = True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "# Remove leading and trailing spaces\n", - "df[\"Tag_1\"] = tag_list_df[0].str.strip()\n", - "df[\"Tag_2\"] = tag_list_df[1].str.strip()\n", - "df[\"Tag_3\"] = tag_list_df[2].str.strip()\n", - "df[\"Tag_4\"] = tag_list_df[3].str.strip()\n", - "df[\"Tag_5\"] = tag_list_df[4].str.strip()\n", - "df[\"Tag_6\"] = tag_list_df[5].str.strip()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "# Merge the 6 columns into one with melt\n", - "df_tags = df.melt(value_vars=[\"Tag_1\", \"Tag_2\", \"Tag_3\", \"Tag_4\", \"Tag_5\", \"Tag_6\"])\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "The shape of the tags with no filtering: (2514684, 2)\n", - " index count\n", - "0 Leisure trip 338423\n", - "1 Couple 205305\n", - "2 Solo traveler 89779\n", - "3 Business trip 68176\n", - "4 Group 51593\n", - "5 Family with young children 49318\n", - "6 Family with older children 21509\n", - "7 Travelers with friends 1610\n", - "8 With a pet 1078\n" - ] - } - ], - "source": [ - "# Get the value counts\n", - "tag_vc = df_tags.value.value_counts()\n", - "# print(tag_vc)\n", - "print(\"The shape of the tags with no filtering:\", str(df_tags.shape))\n", - "# Drop rooms, suites, and length of stay, mobile device and anything with less count than a 1000\n", - "df_tags = df_tags[~df_tags.value.str.contains(\"Standard|room|Stayed|device|Beds|Suite|Studio|King|Superior|Double\", na=False, case=False)]\n", - "tag_vc = df_tags.value.value_counts().reset_index(name=\"count\").query(\"count > 1000\")\n", - "# Print the top 10 (there should only be 9 and we'll use these in the filtering section)\n", - "print(tag_vc[:10])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb b/translations/br/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb deleted file mode 100644 index 6f14216b6..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb +++ /dev/null @@ -1,260 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "705bf02633759f689abc37b19749a16d", - "translation_date": "2025-08-30T00:15:29+00:00", - "source_file": "6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "[nltk_data] Downloading package vader_lexicon to\n[nltk_data] /Users/jenlooper/nltk_data...\n" - ] - }, - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "True" - ] - }, - "metadata": {}, - "execution_count": 9 - } - ], - "source": [ - "import time\n", - "import pandas as pd\n", - "import nltk as nltk\n", - "from nltk.corpus import stopwords\n", - "from nltk.sentiment.vader import SentimentIntensityAnalyzer\n", - "nltk.download('vader_lexicon')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "vader_sentiment = SentimentIntensityAnalyzer()\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [], - "source": [ - "# There are 3 possibilities of input for a review:\n", - "# It could be \"No Negative\", in which case, return 0\n", - "# It could be \"No Positive\", in which case, return 0\n", - "# It could be a review, in which case calculate the sentiment\n", - "def calc_sentiment(review): \n", - " if review == \"No Negative\" or review == \"No Positive\":\n", - " return 0\n", - " return vader_sentiment.polarity_scores(review)[\"compound\"] \n" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV\n", - "df = pd.read_csv(\"../../data/Hotel_Reviews_Filtered.csv\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [], - "source": [ - "# Remove stop words - can be slow for a lot of text!\n", - "# Ryan Han (ryanxjhan on Kaggle) has a great post measuring performance of different stop words removal approaches\n", - "# https://www.kaggle.com/ryanxjhan/fast-stop-words-removal # using the approach that Ryan recommends\n", - "start = time.time()\n", - "cache = set(stopwords.words(\"english\"))\n", - "def remove_stopwords(review):\n", - " text = \" \".join([word for word in review.split() if word not in cache])\n", - " return text\n" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [], - "source": [ - "# Remove the stop words from both columns\n", - "df.Negative_Review = df.Negative_Review.apply(remove_stopwords) \n", - "df.Positive_Review = df.Positive_Review.apply(remove_stopwords)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Removing stop words took 5.77 seconds\n" - ] - } - ], - "source": [ - "end = time.time()\n", - "print(\"Removing stop words took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Calculating sentiment columns for both positive and negative reviews\n", - "Calculating sentiment took 201.07 seconds\n" - ] - } - ], - "source": [ - "# Add a negative sentiment and positive sentiment column\n", - "print(\"Calculating sentiment columns for both positive and negative reviews\")\n", - "start = time.time()\n", - "df[\"Negative_Sentiment\"] = df.Negative_Review.apply(calc_sentiment)\n", - "df[\"Positive_Sentiment\"] = df.Positive_Review.apply(calc_sentiment)\n", - "end = time.time()\n", - "print(\"Calculating sentiment took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " Negative_Review Negative_Sentiment\n", - "186584 So bad experience memories I hotel The first n... -0.9920\n", - "129503 First charged twice room booked booking second... -0.9896\n", - "307286 The staff Had bad experience even booking Janu... -0.9889\n", - "452092 No WLAN room Incredibly rude restaurant staff ... -0.9884\n", - "201293 We usually traveling Paris 2 3 times year busi... -0.9873\n", - "... ... ...\n", - "26899 I would say however one night expensive even d... 0.9933\n", - "138365 Wifi terribly slow I speed test network upload... 0.9938\n", - "79215 I find anything hotel first I walked past hote... 0.9938\n", - "278506 The property great location There bakery next ... 0.9945\n", - "339189 Guys I like hotel I wish return next year Howe... 0.9948\n", - "\n", - "[515738 rows x 2 columns]\n", - " Positive_Review Positive_Sentiment\n", - "137893 Bathroom Shower We going stay twice hotel 2 ni... -0.9820\n", - "5839 I completely disappointed mad since reception ... -0.9780\n", - "64158 get everything extra internet parking breakfas... -0.9751\n", - "124178 I didnt like anythig Room small Asked upgrade ... -0.9721\n", - "489137 Very rude manager abusive staff reception Dirt... -0.9703\n", - "... ... ...\n", - "331570 Everything This recently renovated hotel class... 0.9984\n", - "322920 From moment stepped doors Guesthouse Hotel sta... 0.9985\n", - "293710 This place surprise expected good actually gre... 0.9985\n", - "417442 We celebrated wedding night Langham I commend ... 0.9985\n", - "132492 We arrived super cute boutique hotel area expl... 0.9987\n", - "\n", - "[515738 rows x 2 columns]\n" - ] - } - ], - "source": [ - "df = df.sort_values(by=[\"Negative_Sentiment\"], ascending=True)\n", - "print(df[[\"Negative_Review\", \"Negative_Sentiment\"]])\n", - "df = df.sort_values(by=[\"Positive_Sentiment\"], ascending=True)\n", - "print(df[[\"Positive_Review\", \"Positive_Sentiment\"]])\n" - ] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [], - "source": [ - "# Reorder the columns (This is cosmetic, but to make it easier to explore the data later)\n", - "df = df.reindex([\"Hotel_Name\", \"Hotel_Address\", \"Total_Number_of_Reviews\", \"Average_Score\", \"Reviewer_Score\", \"Negative_Sentiment\", \"Positive_Sentiment\", \"Reviewer_Nationality\", \"Leisure_trip\", \"Couple\", \"Solo_traveler\", \"Business_trip\", \"Group\", \"Family_with_young_children\", \"Family_with_older_children\", \"With_a_pet\", \"Negative_Review\", \"Positive_Review\"], axis=1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Saving results to Hotel_Reviews_NLP.csv\n" - ] - } - ], - "source": [ - "print(\"Saving results to Hotel_Reviews_NLP.csv\")\n", - "df.to_csv(r\"../../data/Hotel_Reviews_NLP.csv\", index = False)\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md b/translations/br/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md deleted file mode 100644 index 295cd6012..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/R/README.md b/translations/br/6-NLP/5-Hotel-Reviews-2/solution/R/README.md deleted file mode 100644 index 4eeaa0ec5..000000000 --- a/translations/br/6-NLP/5-Hotel-Reviews-2/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/README.md b/translations/br/6-NLP/README.md deleted file mode 100644 index 361ade8ae..000000000 --- a/translations/br/6-NLP/README.md +++ /dev/null @@ -1,38 +0,0 @@ - -# Introdução ao processamento de linguagem natural - -O processamento de linguagem natural (PLN) é a capacidade de um programa de computador entender a linguagem humana como ela é falada e escrita — referida como linguagem natural. É um componente da inteligência artificial (IA). O PLN existe há mais de 50 anos e tem raízes no campo da linguística. Todo o campo é direcionado a ajudar as máquinas a entender e processar a linguagem humana. Isso pode ser usado para realizar tarefas como correção ortográfica ou tradução automática. Ele possui uma variedade de aplicações no mundo real em diversos campos, incluindo pesquisa médica, motores de busca e inteligência empresarial. - -## Tópico regional: Línguas e literatura europeias e hotéis românticos da Europa ❤️ - -Nesta seção do currículo, você será introduzido a um dos usos mais difundidos do aprendizado de máquina: o processamento de linguagem natural (PLN). Derivado da linguística computacional, esta categoria de inteligência artificial é a ponte entre humanos e máquinas por meio de comunicação vocal ou textual. - -Nestas lições, aprenderemos os fundamentos do PLN construindo pequenos bots conversacionais para entender como o aprendizado de máquina ajuda a tornar essas conversas cada vez mais 'inteligentes'. Você viajará no tempo, conversando com Elizabeth Bennett e Mr. Darcy do clássico romance de Jane Austen, **Orgulho e Preconceito**, publicado em 1813. Depois, você aprofundará seu conhecimento aprendendo sobre análise de sentimentos por meio de avaliações de hotéis na Europa. - -![Livro Orgulho e Preconceito e chá](../../../translated_images/pt-BR/p&p.279f1c49ecd88941.webp) -> Foto por Elaine Howlin no Unsplash - -## Lições - -1. [Introdução ao processamento de linguagem natural](1-Introduction-to-NLP/README.md) -2. [Tarefas e técnicas comuns de PLN](2-Tasks/README.md) -3. [Tradução e análise de sentimentos com aprendizado de máquina](3-Translation-Sentiment/README.md) -4. [Preparando seus dados](4-Hotel-Reviews-1/README.md) -5. [NLTK para análise de sentimentos](5-Hotel-Reviews-2/README.md) - -## Créditos - -Estas lições de processamento de linguagem natural foram escritas com ☕ por [Stephen Howell](https://twitter.com/Howell_MSFT) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/6-NLP/data/README.md b/translations/br/6-NLP/data/README.md deleted file mode 100644 index f4cf67795..000000000 --- a/translations/br/6-NLP/data/README.md +++ /dev/null @@ -1,15 +0,0 @@ - -Baixe os dados de avaliação do hotel para esta pasta. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/1-Introduction/README.md b/translations/br/7-TimeSeries/1-Introduction/README.md deleted file mode 100644 index 3df9cfa87..000000000 --- a/translations/br/7-TimeSeries/1-Introduction/README.md +++ /dev/null @@ -1,199 +0,0 @@ - -# Introdução à previsão de séries temporais - -![Resumo de séries temporais em um sketchnote](../../../../sketchnotes/ml-timeseries.png) - -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -Nesta lição e na próxima, você aprenderá um pouco sobre previsão de séries temporais, uma parte interessante e valiosa do repertório de um cientista de ML que é um pouco menos conhecida do que outros tópicos. A previsão de séries temporais é como uma espécie de "bola de cristal": com base no desempenho passado de uma variável, como preço, você pode prever seu valor potencial futuro. - -[![Introdução à previsão de séries temporais](https://img.youtube.com/vi/cBojo1hsHiI/0.jpg)](https://youtu.be/cBojo1hsHiI "Introdução à previsão de séries temporais") - -> 🎥 Clique na imagem acima para assistir a um vídeo sobre previsão de séries temporais - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -É um campo útil e interessante com valor real para os negócios, dado sua aplicação direta em problemas de precificação, inventário e questões de cadeia de suprimentos. Embora técnicas de aprendizado profundo tenham começado a ser usadas para obter mais insights e prever melhor o desempenho futuro, a previsão de séries temporais continua sendo um campo amplamente informado por técnicas clássicas de ML. - -> O currículo útil de séries temporais da Penn State pode ser encontrado [aqui](https://online.stat.psu.edu/stat510/lesson/1) - -## Introdução - -Suponha que você gerencie uma rede de parquímetros inteligentes que fornecem dados sobre com que frequência eles são usados e por quanto tempo ao longo do tempo. - -> E se você pudesse prever, com base no desempenho passado do parquímetro, seu valor futuro de acordo com as leis de oferta e demanda? - -Prever com precisão quando agir para alcançar seu objetivo é um desafio que pode ser abordado com previsão de séries temporais. Não deixaria as pessoas felizes serem cobradas mais caro em horários de pico quando estão procurando uma vaga, mas seria uma maneira eficaz de gerar receita para limpar as ruas! - -Vamos explorar alguns dos tipos de algoritmos de séries temporais e começar um notebook para limpar e preparar alguns dados. Os dados que você analisará foram retirados da competição de previsão GEFCom2014. Eles consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014. Dado os padrões históricos de carga elétrica e temperatura, você pode prever valores futuros de carga elétrica. - -Neste exemplo, você aprenderá como prever um passo de tempo à frente, usando apenas dados históricos de carga. Antes de começar, no entanto, é útil entender o que está acontecendo nos bastidores. - -## Algumas definições - -Ao encontrar o termo "séries temporais", você precisa entender seu uso em vários contextos diferentes. - -🎓 **Séries temporais** - -Em matemática, "uma série temporal é uma série de pontos de dados indexados (ou listados ou representados graficamente) em ordem temporal. Mais comumente, uma série temporal é uma sequência tomada em pontos sucessivos igualmente espaçados no tempo." Um exemplo de série temporal é o valor de fechamento diário do [Dow Jones Industrial Average](https://wikipedia.org/wiki/Time_series). O uso de gráficos de séries temporais e modelagem estatística é frequentemente encontrado em processamento de sinais, previsão do tempo, previsão de terremotos e outros campos onde eventos ocorrem e pontos de dados podem ser plotados ao longo do tempo. - -🎓 **Análise de séries temporais** - -A análise de séries temporais é a análise dos dados de séries temporais mencionados acima. Os dados de séries temporais podem assumir formas distintas, incluindo "séries temporais interrompidas", que detectam padrões na evolução de uma série temporal antes e depois de um evento interruptor. O tipo de análise necessário para a série temporal depende da natureza dos dados. Os dados de séries temporais podem assumir a forma de séries de números ou caracteres. - -A análise a ser realizada utiliza uma variedade de métodos, incluindo domínio de frequência e domínio de tempo, linear e não linear, e mais. [Saiba mais](https://www.itl.nist.gov/div898/handbook/pmc/section4/pmc4.htm) sobre as muitas maneiras de analisar esse tipo de dado. - -🎓 **Previsão de séries temporais** - -A previsão de séries temporais é o uso de um modelo para prever valores futuros com base em padrões exibidos por dados previamente coletados conforme ocorreram no passado. Embora seja possível usar modelos de regressão para explorar dados de séries temporais, com índices de tempo como variáveis x em um gráfico, esses dados são melhor analisados usando tipos especiais de modelos. - -Os dados de séries temporais são uma lista de observações ordenadas, diferente de dados que podem ser analisados por regressão linear. O mais comum é o ARIMA, um acrônimo que significa "Autoregressive Integrated Moving Average" (Média Móvel Integrada Autoregressiva). - -[Modelos ARIMA](https://online.stat.psu.edu/stat510/lesson/1/1.1) "relacionam o valor presente de uma série a valores passados e erros de previsão passados." Eles são mais apropriados para analisar dados no domínio do tempo, onde os dados são ordenados ao longo do tempo. - -> Existem vários tipos de modelos ARIMA, sobre os quais você pode aprender [aqui](https://people.duke.edu/~rnau/411arim.htm) e que você abordará na próxima lição. - -Na próxima lição, você construirá um modelo ARIMA usando [Séries Temporais Univariadas](https://itl.nist.gov/div898/handbook/pmc/section4/pmc44.htm), que se concentra em uma variável que muda seu valor ao longo do tempo. Um exemplo desse tipo de dado é [este conjunto de dados](https://itl.nist.gov/div898/handbook/pmc/section4/pmc4411.htm) que registra a concentração mensal de CO2 no Observatório Mauna Loa: - -| CO2 | YearMonth | Year | Month | -| :----: | :-------: | :---: | :---: | -| 330.62 | 1975.04 | 1975 | 1 | -| 331.40 | 1975.13 | 1975 | 2 | -| 331.87 | 1975.21 | 1975 | 3 | -| 333.18 | 1975.29 | 1975 | 4 | -| 333.92 | 1975.38 | 1975 | 5 | -| 333.43 | 1975.46 | 1975 | 6 | -| 331.85 | 1975.54 | 1975 | 7 | -| 330.01 | 1975.63 | 1975 | 8 | -| 328.51 | 1975.71 | 1975 | 9 | -| 328.41 | 1975.79 | 1975 | 10 | -| 329.25 | 1975.88 | 1975 | 11 | -| 330.97 | 1975.96 | 1975 | 12 | - -✅ Identifique a variável que muda ao longo do tempo neste conjunto de dados. - -## Características dos dados de séries temporais a considerar - -Ao observar dados de séries temporais, você pode notar que eles possuem [certas características](https://online.stat.psu.edu/stat510/lesson/1/1.1) que você precisa levar em conta e mitigar para entender melhor seus padrões. Se você considerar os dados de séries temporais como potencialmente fornecendo um "sinal" que deseja analisar, essas características podem ser vistas como "ruído". Muitas vezes, será necessário reduzir esse "ruído" compensando algumas dessas características usando técnicas estatísticas. - -Aqui estão alguns conceitos que você deve conhecer para trabalhar com séries temporais: - -🎓 **Tendências** - -Tendências são definidas como aumentos e diminuições mensuráveis ao longo do tempo. [Leia mais](https://machinelearningmastery.com/time-series-trends-in-python). No contexto de séries temporais, trata-se de como usar e, se necessário, remover tendências de sua série temporal. - -🎓 **[Sazonalidade](https://machinelearningmastery.com/time-series-seasonality-with-python/)** - -Sazonalidade é definida como flutuações periódicas, como picos de vendas durante feriados, por exemplo. [Veja](https://itl.nist.gov/div898/handbook/pmc/section4/pmc443.htm) como diferentes tipos de gráficos exibem sazonalidade nos dados. - -🎓 **Outliers** - -Outliers estão distantes da variância padrão dos dados. - -🎓 **Ciclo de longo prazo** - -Independentemente da sazonalidade, os dados podem exibir um ciclo de longo prazo, como uma recessão econômica que dura mais de um ano. - -🎓 **Variância constante** - -Ao longo do tempo, alguns dados exibem flutuações constantes, como o uso de energia durante o dia e a noite. - -🎓 **Mudanças abruptas** - -Os dados podem exibir uma mudança abrupta que pode precisar de análise adicional. O fechamento repentino de negócios devido à COVID, por exemplo, causou mudanças nos dados. - -✅ Aqui está um [exemplo de gráfico de séries temporais](https://www.kaggle.com/kashnitsky/topic-9-part-1-time-series-analysis-in-python) mostrando o gasto diário de moeda em jogos ao longo de alguns anos. Você consegue identificar alguma das características listadas acima nesses dados? - -![Gasto de moeda em jogos](../../../../7-TimeSeries/1-Introduction/images/currency.png) - -## Exercício - começando com dados de uso de energia - -Vamos começar criando um modelo de séries temporais para prever o uso futuro de energia com base no uso passado. - -> Os dados neste exemplo foram retirados da competição de previsão GEFCom2014. Eles consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014. -> -> Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, "Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016. - -1. Na pasta `working` desta lição, abra o arquivo _notebook.ipynb_. Comece adicionando bibliotecas que ajudarão você a carregar e visualizar os dados. - - ```python - import os - import matplotlib.pyplot as plt - from common.utils import load_data - %matplotlib inline - ``` - - Observe que você está usando os arquivos da pasta `common` incluída, que configuram seu ambiente e lidam com o download dos dados. - -2. Em seguida, examine os dados como um dataframe chamando `load_data()` e `head()`: - - ```python - data_dir = './data' - energy = load_data(data_dir)[['load']] - energy.head() - ``` - - Você pode ver que há duas colunas representando data e carga: - - | | load | - | :-----------------: | :----: | - | 2012-01-01 00:00:00 | 2698.0 | - | 2012-01-01 01:00:00 | 2558.0 | - | 2012-01-01 02:00:00 | 2444.0 | - | 2012-01-01 03:00:00 | 2402.0 | - | 2012-01-01 04:00:00 | 2403.0 | - -3. Agora, plote os dados chamando `plot()`: - - ```python - energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![gráfico de energia](../../../../7-TimeSeries/1-Introduction/images/energy-plot.png) - -4. Agora, plote a primeira semana de julho de 2014, fornecendo-a como entrada para o `energy` no padrão `[de data]:[até data]`: - - ```python - energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![julho](../../../../7-TimeSeries/1-Introduction/images/july-2014.png) - - Um gráfico bonito! Observe esses gráficos e veja se consegue determinar alguma das características listadas acima. O que podemos deduzir ao visualizar os dados? - -Na próxima lição, você criará um modelo ARIMA para gerar algumas previsões. - ---- - -## 🚀Desafio - -Faça uma lista de todas as indústrias e áreas de estudo que você consegue pensar que se beneficiariam da previsão de séries temporais. Você consegue pensar em uma aplicação dessas técnicas nas artes? Em Econometria? Ecologia? Varejo? Indústria? Finanças? Onde mais? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Embora não os abordemos aqui, redes neurais às vezes são usadas para aprimorar métodos clássicos de previsão de séries temporais. Leia mais sobre elas [neste artigo](https://medium.com/microsoftazure/neural-networks-for-forecasting-financial-and-economic-time-series-6aca370ff412) - -## Tarefa - -[Visualize mais séries temporais](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/1-Introduction/assignment.md b/translations/br/7-TimeSeries/1-Introduction/assignment.md deleted file mode 100644 index 2626fc430..000000000 --- a/translations/br/7-TimeSeries/1-Introduction/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Visualize algumas séries temporais adicionais - -## Instruções - -Você começou a aprender sobre previsão de séries temporais ao observar o tipo de dados que requerem esse modelo especial. Você já visualizou alguns dados relacionados à energia. Agora, procure outros dados que possam se beneficiar da previsão de séries temporais. Encontre três exemplos (experimente [Kaggle](https://kaggle.com) e [Azure Open Datasets](https://azure.microsoft.com/en-us/services/open-datasets/catalog/?WT.mc_id=academic-77952-leestott)) e crie um notebook para visualizá-los. Anote quaisquer características especiais que eles possuam (sazonalidade, mudanças abruptas ou outras tendências) no notebook. - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita Melhorar | -| -------- | ----------------------------------------------------- | --------------------------------------------------- | --------------------------------------------------------------------------------------- | -| | Três conjuntos de dados são plotados e explicados no notebook | Dois conjuntos de dados são plotados e explicados no notebook | Poucos conjuntos de dados são plotados ou explicados no notebook ou os dados apresentados são insuficientes | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/1-Introduction/solution/Julia/README.md b/translations/br/7-TimeSeries/1-Introduction/solution/Julia/README.md deleted file mode 100644 index 11d857da2..000000000 --- a/translations/br/7-TimeSeries/1-Introduction/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/1-Introduction/solution/R/README.md b/translations/br/7-TimeSeries/1-Introduction/solution/R/README.md deleted file mode 100644 index 61f470bb3..000000000 --- a/translations/br/7-TimeSeries/1-Introduction/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/1-Introduction/solution/notebook.ipynb b/translations/br/7-TimeSeries/1-Introduction/solution/notebook.ipynb deleted file mode 100644 index 1a00901a9..000000000 --- a/translations/br/7-TimeSeries/1-Introduction/solution/notebook.ipynb +++ /dev/null @@ -1,170 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Configuração de Dados\n", - "\n", - "Neste notebook, demonstramos como:\n", - "- configurar dados de séries temporais para este módulo\n", - "- visualizar os dados\n", - "\n", - "Os dados neste exemplo são retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014.\n", - "\n", - "Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "import os\n", - "import matplotlib.pyplot as plt\n", - "from common.utils import load_data\n", - "%matplotlib inline" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Carregar os dados do csv em um dataframe do Pandas\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2698.0\n", - "2012-01-01 01:00:00 2558.0\n", - "2012-01-01 02:00:00 2444.0\n", - "2012-01-01 03:00:00 2402.0\n", - "2012-01-01 04:00:00 2403.0" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
load
2012-01-01 00:00:002698.0
2012-01-01 01:00:002558.0
2012-01-01 02:00:002444.0
2012-01-01 03:00:002402.0
2012-01-01 04:00:002403.0
\n
" - }, - "metadata": {}, - "execution_count": 7 - } - ], - "source": [ - "data_dir = './data'\n", - "energy = load_data(data_dir)[['load']]\n", - "energy.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Plote todos os dados de carga disponíveis (janeiro de 2012 a dezembro de 2014)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernel_info": { - "name": "python3" - }, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "nteract": { - "version": "nteract-front-end@1.0.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "dddca9ad9e34435494e0933c218e1579", - "translation_date": "2025-08-29T23:21:07+00:00", - "source_file": "7-TimeSeries/1-Introduction/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/7-TimeSeries/1-Introduction/working/notebook.ipynb b/translations/br/7-TimeSeries/1-Introduction/working/notebook.ipynb deleted file mode 100644 index 4dc93de59..000000000 --- a/translations/br/7-TimeSeries/1-Introduction/working/notebook.ipynb +++ /dev/null @@ -1,63 +0,0 @@ -{ - "cells": [ - { - "source": [ - "# Configuração de Dados\n", - "\n", - "Neste notebook, demonstramos como:\n", - "\n", - "configurar dados de séries temporais para este módulo \n", - "visualizar os dados \n", - "Os dados neste exemplo foram retirados da competição de previsão GEFCom2014. Eles consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014.\n", - "\n", - "1Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016. \n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernel_info": { - "name": "python3" - }, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "nteract": { - "version": "nteract-front-end@1.0.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "5e2bbe594906dce3aaaa736d6dac6683", - "translation_date": "2025-08-29T23:21:43+00:00", - "source_file": "7-TimeSeries/1-Introduction/working/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/7-TimeSeries/2-ARIMA/README.md b/translations/br/7-TimeSeries/2-ARIMA/README.md deleted file mode 100644 index 0d3888f8f..000000000 --- a/translations/br/7-TimeSeries/2-ARIMA/README.md +++ /dev/null @@ -1,405 +0,0 @@ - -# Previsão de séries temporais com ARIMA - -Na lição anterior, você aprendeu um pouco sobre previsão de séries temporais e carregou um conjunto de dados mostrando as flutuações de carga elétrica ao longo de um período de tempo. - -[![Introdução ao ARIMA](https://img.youtube.com/vi/IUSk-YDau10/0.jpg)](https://youtu.be/IUSk-YDau10 "Introdução ao ARIMA") - -> 🎥 Clique na imagem acima para assistir a um vídeo: Uma breve introdução aos modelos ARIMA. O exemplo é feito em R, mas os conceitos são universais. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -Nesta lição, você descobrirá uma maneira específica de construir modelos com [ARIMA: *A*uto*R*egressive *I*ntegrated *M*oving *A*verage](https://wikipedia.org/wiki/Autoregressive_integrated_moving_average). Os modelos ARIMA são particularmente adequados para ajustar dados que apresentam [não-estacionariedade](https://wikipedia.org/wiki/Stationary_process). - -## Conceitos gerais - -Para trabalhar com ARIMA, há alguns conceitos que você precisa conhecer: - -- 🎓 **Estacionariedade**. No contexto estatístico, estacionariedade refere-se a dados cuja distribuição não muda ao serem deslocados no tempo. Dados não estacionários, por sua vez, apresentam flutuações devido a tendências que precisam ser transformadas para serem analisadas. A sazonalidade, por exemplo, pode introduzir flutuações nos dados e pode ser eliminada por meio de um processo de 'diferença sazonal'. - -- 🎓 **[Diferença](https://wikipedia.org/wiki/Autoregressive_integrated_moving_average#Differencing)**. Diferençar dados, novamente no contexto estatístico, refere-se ao processo de transformar dados não estacionários para torná-los estacionários, removendo sua tendência não constante. "A diferença remove as mudanças no nível de uma série temporal, eliminando tendência e sazonalidade e, consequentemente, estabilizando a média da série temporal." [Artigo de Shixiong et al](https://arxiv.org/abs/1904.07632) - -## ARIMA no contexto de séries temporais - -Vamos detalhar as partes do ARIMA para entender melhor como ele nos ajuda a modelar séries temporais e fazer previsões com base nelas. - -- **AR - de AutoRegressivo**. Modelos autoregressivos, como o nome sugere, olham 'para trás' no tempo para analisar valores anteriores em seus dados e fazer suposições sobre eles. Esses valores anteriores são chamados de 'lags'. Um exemplo seria dados que mostram vendas mensais de lápis. O total de vendas de cada mês seria considerado uma 'variável evolutiva' no conjunto de dados. Este modelo é construído como "a variável evolutiva de interesse é regredida em seus próprios valores defasados (ou seja, anteriores)." [wikipedia](https://wikipedia.org/wiki/Autoregressive_integrated_moving_average) - -- **I - de Integrado**. Diferentemente dos modelos semelhantes 'ARMA', o 'I' no ARIMA refere-se ao seu aspecto *[integrado](https://wikipedia.org/wiki/Order_of_integration)*. Os dados são 'integrados' quando etapas de diferenciação são aplicadas para eliminar a não-estacionariedade. - -- **MA - de Média Móvel**. O aspecto de [média móvel](https://wikipedia.org/wiki/Moving-average_model) deste modelo refere-se à variável de saída que é determinada observando os valores atuais e passados dos lags. - -Resumindo: ARIMA é usado para ajustar um modelo ao formato especial de dados de séries temporais da forma mais precisa possível. - -## Exercício - construir um modelo ARIMA - -Abra a pasta [_/working_](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA/working) nesta lição e encontre o arquivo [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/7-TimeSeries/2-ARIMA/working/notebook.ipynb). - -1. Execute o notebook para carregar a biblioteca Python `statsmodels`; você precisará dela para modelos ARIMA. - -1. Carregue as bibliotecas necessárias. - -1. Agora, carregue várias outras bibliotecas úteis para plotar dados: - - ```python - import os - import warnings - import matplotlib.pyplot as plt - import numpy as np - import pandas as pd - import datetime as dt - import math - - from pandas.plotting import autocorrelation_plot - from statsmodels.tsa.statespace.sarimax import SARIMAX - from sklearn.preprocessing import MinMaxScaler - from common.utils import load_data, mape - from IPython.display import Image - - %matplotlib inline - pd.options.display.float_format = '{:,.2f}'.format - np.set_printoptions(precision=2) - warnings.filterwarnings("ignore") # specify to ignore warning messages - ``` - -1. Carregue os dados do arquivo `/data/energy.csv` em um dataframe do Pandas e dê uma olhada: - - ```python - energy = load_data('./data')[['load']] - energy.head(10) - ``` - -1. Plote todos os dados de energia disponíveis de janeiro de 2012 a dezembro de 2014. Não deve haver surpresas, pois vimos esses dados na última lição: - - ```python - energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - Agora, vamos construir um modelo! - -### Criar conjuntos de dados de treinamento e teste - -Agora que seus dados estão carregados, você pode separá-los em conjuntos de treinamento e teste. Você treinará seu modelo no conjunto de treinamento. Como de costume, após o modelo terminar o treinamento, você avaliará sua precisão usando o conjunto de teste. Você precisa garantir que o conjunto de teste cubra um período posterior ao conjunto de treinamento para garantir que o modelo não obtenha informações de períodos futuros. - -1. Aloque um período de dois meses de 1º de setembro a 31 de outubro de 2014 para o conjunto de treinamento. O conjunto de teste incluirá o período de dois meses de 1º de novembro a 31 de dezembro de 2014: - - ```python - train_start_dt = '2014-11-01 00:00:00' - test_start_dt = '2014-12-30 00:00:00' - ``` - - Como esses dados refletem o consumo diário de energia, há um forte padrão sazonal, mas o consumo é mais semelhante ao consumo em dias mais recentes. - -1. Visualize as diferenças: - - ```python - energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \ - .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \ - .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![dados de treinamento e teste](../../../../7-TimeSeries/2-ARIMA/images/train-test.png) - - Portanto, usar uma janela de tempo relativamente pequena para treinar os dados deve ser suficiente. - - > Nota: Como a função que usamos para ajustar o modelo ARIMA utiliza validação dentro da amostra durante o ajuste, omitiremos os dados de validação. - -### Preparar os dados para treinamento - -Agora, você precisa preparar os dados para treinamento realizando filtragem e escalonamento dos dados. Filtre seu conjunto de dados para incluir apenas os períodos de tempo e colunas necessários e escale para garantir que os dados sejam projetados no intervalo 0,1. - -1. Filtre o conjunto de dados original para incluir apenas os períodos de tempo mencionados por conjunto e apenas a coluna necessária 'load' mais a data: - - ```python - train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']] - test = energy.copy()[energy.index >= test_start_dt][['load']] - - print('Training data shape: ', train.shape) - print('Test data shape: ', test.shape) - ``` - - Você pode ver a forma dos dados: - - ```output - Training data shape: (1416, 1) - Test data shape: (48, 1) - ``` - -1. Escale os dados para estar no intervalo (0, 1). - - ```python - scaler = MinMaxScaler() - train['load'] = scaler.fit_transform(train) - train.head(10) - ``` - -1. Visualize os dados originais vs. escalonados: - - ```python - energy[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']].rename(columns={'load':'original load'}).plot.hist(bins=100, fontsize=12) - train.rename(columns={'load':'scaled load'}).plot.hist(bins=100, fontsize=12) - plt.show() - ``` - - ![original](../../../../7-TimeSeries/2-ARIMA/images/original.png) - - > Os dados originais - - ![escalonados](../../../../7-TimeSeries/2-ARIMA/images/scaled.png) - - > Os dados escalonados - -1. Agora que você calibrou os dados escalonados, pode escalar os dados de teste: - - ```python - test['load'] = scaler.transform(test) - test.head() - ``` - -### Implementar ARIMA - -É hora de implementar o ARIMA! Agora você usará a biblioteca `statsmodels` que instalou anteriormente. - -Agora você precisa seguir várias etapas: - - 1. Defina o modelo chamando `SARIMAX()` e passando os parâmetros do modelo: parâmetros p, d e q, e parâmetros P, D e Q. - 2. Prepare o modelo para os dados de treinamento chamando a função `fit()`. - 3. Faça previsões chamando a função `forecast()` e especificando o número de passos (o `horizon`) para prever. - -> 🎓 Para que servem todos esses parâmetros? Em um modelo ARIMA, há 3 parâmetros usados para ajudar a modelar os principais aspectos de uma série temporal: sazonalidade, tendência e ruído. Esses parâmetros são: - -`p`: o parâmetro associado ao aspecto autoregressivo do modelo, que incorpora valores *passados*. -`d`: o parâmetro associado à parte integrada do modelo, que afeta a quantidade de *diferença* (🎓 lembre-se de diferença 👆?) a ser aplicada a uma série temporal. -`q`: o parâmetro associado à parte de média móvel do modelo. - -> Nota: Se seus dados tiverem um aspecto sazonal - como este -, usamos um modelo ARIMA sazonal (SARIMA). Nesse caso, você precisa usar outro conjunto de parâmetros: `P`, `D` e `Q`, que descrevem as mesmas associações que `p`, `d` e `q`, mas correspondem aos componentes sazonais do modelo. - -1. Comece definindo seu valor de horizonte preferido. Vamos tentar 3 horas: - - ```python - # Specify the number of steps to forecast ahead - HORIZON = 3 - print('Forecasting horizon:', HORIZON, 'hours') - ``` - - Selecionar os melhores valores para os parâmetros de um modelo ARIMA pode ser desafiador, pois é um pouco subjetivo e demorado. Você pode considerar usar uma função `auto_arima()` da biblioteca [`pyramid`](https://alkaline-ml.com/pmdarima/0.9.0/modules/generated/pyramid.arima.auto_arima.html). - -1. Por enquanto, tente algumas seleções manuais para encontrar um bom modelo. - - ```python - order = (4, 1, 0) - seasonal_order = (1, 1, 0, 24) - - model = SARIMAX(endog=train, order=order, seasonal_order=seasonal_order) - results = model.fit() - - print(results.summary()) - ``` - - Uma tabela de resultados é impressa. - -Você construiu seu primeiro modelo! Agora precisamos encontrar uma maneira de avaliá-lo. - -### Avaliar seu modelo - -Para avaliar seu modelo, você pode realizar a chamada validação `walk forward`. Na prática, modelos de séries temporais são re-treinados cada vez que novos dados ficam disponíveis. Isso permite que o modelo faça a melhor previsão em cada etapa de tempo. - -Começando no início da série temporal usando esta técnica, treine o modelo no conjunto de dados de treinamento. Em seguida, faça uma previsão para o próximo passo de tempo. A previsão é avaliada em relação ao valor conhecido. O conjunto de treinamento é então expandido para incluir o valor conhecido e o processo é repetido. - -> Nota: Você deve manter a janela do conjunto de treinamento fixa para um treinamento mais eficiente, de modo que toda vez que adicionar uma nova observação ao conjunto de treinamento, remova a observação do início do conjunto. - -Este processo fornece uma estimativa mais robusta de como o modelo se comportará na prática. No entanto, isso tem o custo computacional de criar tantos modelos. Isso é aceitável se os dados forem pequenos ou se o modelo for simples, mas pode ser um problema em escala. - -A validação walk-forward é o padrão ouro para avaliação de modelos de séries temporais e é recomendada para seus próprios projetos. - -1. Primeiro, crie um ponto de dados de teste para cada passo do HORIZON. - - ```python - test_shifted = test.copy() - - for t in range(1, HORIZON+1): - test_shifted['load+'+str(t)] = test_shifted['load'].shift(-t, freq='H') - - test_shifted = test_shifted.dropna(how='any') - test_shifted.head(5) - ``` - - | | | load | load+1 | load+2 | - | ---------- | -------- | ---- | ------ | ------ | - | 2014-12-30 | 00:00:00 | 0.33 | 0.29 | 0.27 | - | 2014-12-30 | 01:00:00 | 0.29 | 0.27 | 0.27 | - | 2014-12-30 | 02:00:00 | 0.27 | 0.27 | 0.30 | - | 2014-12-30 | 03:00:00 | 0.27 | 0.30 | 0.41 | - | 2014-12-30 | 04:00:00 | 0.30 | 0.41 | 0.57 | - - Os dados são deslocados horizontalmente de acordo com seu ponto de horizonte. - -1. Faça previsões em seus dados de teste usando esta abordagem de janela deslizante em um loop do tamanho do comprimento dos dados de teste: - - ```python - %%time - training_window = 720 # dedicate 30 days (720 hours) for training - - train_ts = train['load'] - test_ts = test_shifted - - history = [x for x in train_ts] - history = history[(-training_window):] - - predictions = list() - - order = (2, 1, 0) - seasonal_order = (1, 1, 0, 24) - - for t in range(test_ts.shape[0]): - model = SARIMAX(endog=history, order=order, seasonal_order=seasonal_order) - model_fit = model.fit() - yhat = model_fit.forecast(steps = HORIZON) - predictions.append(yhat) - obs = list(test_ts.iloc[t]) - # move the training window - history.append(obs[0]) - history.pop(0) - print(test_ts.index[t]) - print(t+1, ': predicted =', yhat, 'expected =', obs) - ``` - - Você pode observar o treinamento ocorrendo: - - ```output - 2014-12-30 00:00:00 - 1 : predicted = [0.32 0.29 0.28] expected = [0.32945389435989236, 0.2900626678603402, 0.2739480752014323] - - 2014-12-30 01:00:00 - 2 : predicted = [0.3 0.29 0.3 ] expected = [0.2900626678603402, 0.2739480752014323, 0.26812891674127126] - - 2014-12-30 02:00:00 - 3 : predicted = [0.27 0.28 0.32] expected = [0.2739480752014323, 0.26812891674127126, 0.3025962399283795] - ``` - -1. Compare as previsões com a carga real: - - ```python - eval_df = pd.DataFrame(predictions, columns=['t+'+str(t) for t in range(1, HORIZON+1)]) - eval_df['timestamp'] = test.index[0:len(test.index)-HORIZON+1] - eval_df = pd.melt(eval_df, id_vars='timestamp', value_name='prediction', var_name='h') - eval_df['actual'] = np.array(np.transpose(test_ts)).ravel() - eval_df[['prediction', 'actual']] = scaler.inverse_transform(eval_df[['prediction', 'actual']]) - eval_df.head() - ``` - - Saída - | | | timestamp | h | prediction | actual | - | --- | ---------- | --------- | --- | ---------- | -------- | - | 0 | 2014-12-30 | 00:00:00 | t+1 | 3,008.74 | 3,023.00 | - | 1 | 2014-12-30 | 01:00:00 | t+1 | 2,955.53 | 2,935.00 | - | 2 | 2014-12-30 | 02:00:00 | t+1 | 2,900.17 | 2,899.00 | - | 3 | 2014-12-30 | 03:00:00 | t+1 | 2,917.69 | 2,886.00 | - | 4 | 2014-12-30 | 04:00:00 | t+1 | 2,946.99 | 2,963.00 | - - Observe a previsão dos dados horários, comparada à carga real. Quão precisa é essa previsão? - -### Verificar a precisão do modelo - -Verifique a precisão do seu modelo testando seu erro percentual absoluto médio (MAPE) em todas as previsões. -> **🧮 Mostre-me a matemática** -> -> ![MAPE](../../../../7-TimeSeries/2-ARIMA/images/mape.png) -> -> [MAPE](https://www.linkedin.com/pulse/what-mape-mad-msd-time-series-allameh-statistics/) é usado para mostrar a precisão da previsão como uma razão definida pela fórmula acima. A diferença entre o valor real e o previsto é dividida pelo valor real. "O valor absoluto nesta fórmula é somado para cada ponto previsto no tempo e dividido pelo número de pontos ajustados n." [wikipedia](https://wikipedia.org/wiki/Mean_absolute_percentage_error) -1. Expressar a equação em código: - - ```python - if(HORIZON > 1): - eval_df['APE'] = (eval_df['prediction'] - eval_df['actual']).abs() / eval_df['actual'] - print(eval_df.groupby('h')['APE'].mean()) - ``` - -1. Calcular o MAPE de um passo: - - ```python - print('One step forecast MAPE: ', (mape(eval_df[eval_df['h'] == 't+1']['prediction'], eval_df[eval_df['h'] == 't+1']['actual']))*100, '%') - ``` - - MAPE da previsão de um passo: 0.5570581332313952 % - -1. Imprimir o MAPE da previsão de múltiplos passos: - - ```python - print('Multi-step forecast MAPE: ', mape(eval_df['prediction'], eval_df['actual'])*100, '%') - ``` - - ```output - Multi-step forecast MAPE: 1.1460048657704118 % - ``` - - Um número baixo é o ideal: considere que uma previsão com um MAPE de 10 está errada em 10%. - -1. Mas, como sempre, é mais fácil visualizar esse tipo de medida de precisão, então vamos plotar: - - ```python - if(HORIZON == 1): - ## Plotting single step forecast - eval_df.plot(x='timestamp', y=['actual', 'prediction'], style=['r', 'b'], figsize=(15, 8)) - - else: - ## Plotting multi step forecast - plot_df = eval_df[(eval_df.h=='t+1')][['timestamp', 'actual']] - for t in range(1, HORIZON+1): - plot_df['t+'+str(t)] = eval_df[(eval_df.h=='t+'+str(t))]['prediction'].values - - fig = plt.figure(figsize=(15, 8)) - ax = plt.plot(plot_df['timestamp'], plot_df['actual'], color='red', linewidth=4.0) - ax = fig.add_subplot(111) - for t in range(1, HORIZON+1): - x = plot_df['timestamp'][(t-1):] - y = plot_df['t+'+str(t)][0:len(x)] - ax.plot(x, y, color='blue', linewidth=4*math.pow(.9,t), alpha=math.pow(0.8,t)) - - ax.legend(loc='best') - - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![um modelo de série temporal](../../../../7-TimeSeries/2-ARIMA/images/accuracy.png) - -🏆 Um gráfico muito bom, mostrando um modelo com ótima precisão. Parabéns! - ---- - -## 🚀Desafio - -Explore as formas de testar a precisão de um modelo de série temporal. Tocamos no MAPE nesta lição, mas existem outros métodos que você poderia usar? Pesquise sobre eles e faça anotações. Um documento útil pode ser encontrado [aqui](https://otexts.com/fpp2/accuracy.html) - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Autônomo - -Esta lição aborda apenas os fundamentos de Previsão de Séries Temporais com ARIMA. Reserve um tempo para aprofundar seu conhecimento explorando [este repositório](https://microsoft.github.io/forecasting/) e seus diversos tipos de modelos para aprender outras formas de construir modelos de séries temporais. - -## Tarefa - -[Um novo modelo ARIMA](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/2-ARIMA/assignment.md b/translations/br/7-TimeSeries/2-ARIMA/assignment.md deleted file mode 100644 index 83b348fd8..000000000 --- a/translations/br/7-TimeSeries/2-ARIMA/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Um novo modelo ARIMA - -## Instruções - -Agora que você construiu um modelo ARIMA, crie um novo com dados frescos (experimente um destes [conjuntos de dados da Duke](http://www2.stat.duke.edu/~mw/ts_data_sets.html)). Anote seu trabalho em um notebook, visualize os dados e seu modelo, e teste sua precisão usando MAPE. - -## Rubrica - -| Critério | Exemplar | Adequado | Precisa Melhorar | -| --------- | ------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------- | ----------------------------------- | -| | Um notebook é apresentado com um novo modelo ARIMA construído, testado e explicado com visualizações e precisão declarada. | O notebook apresentado não está anotado ou contém erros | Um notebook incompleto é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/2-ARIMA/solution/Julia/README.md b/translations/br/7-TimeSeries/2-ARIMA/solution/Julia/README.md deleted file mode 100644 index c6cc02525..000000000 --- a/translations/br/7-TimeSeries/2-ARIMA/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/2-ARIMA/solution/R/README.md b/translations/br/7-TimeSeries/2-ARIMA/solution/R/README.md deleted file mode 100644 index fa8879f6e..000000000 --- a/translations/br/7-TimeSeries/2-ARIMA/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/2-ARIMA/solution/notebook.ipynb b/translations/br/7-TimeSeries/2-ARIMA/solution/notebook.ipynb deleted file mode 100644 index d11f7e5f2..000000000 --- a/translations/br/7-TimeSeries/2-ARIMA/solution/notebook.ipynb +++ /dev/null @@ -1,1125 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Previsão de séries temporais com ARIMA\n", - "\n", - "Neste notebook, demonstramos como:\n", - "- preparar dados de séries temporais para treinar um modelo de previsão de séries temporais ARIMA\n", - "- implementar um modelo ARIMA simples para prever os próximos passos do HORIZON (tempo *t+1* até *t+HORIZON*) na série temporal\n", - "- avaliar o modelo\n", - "\n", - "Os dados neste exemplo são retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014. A tarefa é prever valores futuros da carga elétrica. Neste exemplo, mostramos como prever um passo no tempo à frente, usando apenas dados históricos de carga.\n", - "\n", - "Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "## Instalar Dependências\n", - "Comece instalando algumas das dependências necessárias. Essas bibliotecas, com suas respectivas versões, são conhecidas por funcionar com a solução:\n", - "\n", - "* `statsmodels == 0.12.2`\n", - "* `matplotlib == 3.4.2`\n", - "* `scikit-learn == 0.24.2`\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 16, - "source": [ - "!pip install statsmodels" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "/bin/sh: pip: command not found\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 17, - "source": [ - "import os\n", - "import warnings\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import pandas as pd\n", - "import datetime as dt\n", - "import math\n", - "\n", - "from pandas.plotting import autocorrelation_plot\n", - "from statsmodels.tsa.statespace.sarimax import SARIMAX\n", - "from sklearn.preprocessing import MinMaxScaler\n", - "from common.utils import load_data, mape\n", - "from IPython.display import Image\n", - "\n", - "%matplotlib inline\n", - "pd.options.display.float_format = '{:,.2f}'.format\n", - "np.set_printoptions(precision=2)\n", - "warnings.filterwarnings(\"ignore\") # specify to ignore warning messages\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 18, - "source": [ - "energy = load_data('./data')[['load']]\n", - "energy.head(10)" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2012-01-01 00:00:002,698.00
2012-01-01 01:00:002,558.00
2012-01-01 02:00:002,444.00
2012-01-01 03:00:002,402.00
2012-01-01 04:00:002,403.00
2012-01-01 05:00:002,453.00
2012-01-01 06:00:002,560.00
2012-01-01 07:00:002,719.00
2012-01-01 08:00:002,916.00
2012-01-01 09:00:003,105.00
\n", - "
" - ], - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2,698.00\n", - "2012-01-01 01:00:00 2,558.00\n", - "2012-01-01 02:00:00 2,444.00\n", - "2012-01-01 03:00:00 2,402.00\n", - "2012-01-01 04:00:00 2,403.00\n", - "2012-01-01 05:00:00 2,453.00\n", - "2012-01-01 06:00:00 2,560.00\n", - "2012-01-01 07:00:00 2,719.00\n", - "2012-01-01 08:00:00 2,916.00\n", - "2012-01-01 09:00:00 3,105.00" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Plote todos os dados de carga disponíveis (janeiro de 2012 a dezembro de 2014)\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 19, - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "## Criar conjuntos de dados de treinamento e teste\n", - "\n", - "### Dividir os dados em treinamento e teste\n", - "\n", - "Para treinar e avaliar um modelo de aprendizado de máquina, é importante dividir os dados em dois conjuntos: um para treinamento e outro para teste. Isso ajuda a garantir que o modelo seja avaliado em dados que ele não viu durante o treinamento.\n", - "\n", - "### Escolher a proporção de divisão\n", - "\n", - "A proporção de divisão entre os conjuntos de treinamento e teste pode variar dependendo do tamanho do conjunto de dados e do problema específico. Uma divisão comum é 80% para treinamento e 20% para teste, mas outras proporções, como 70/30 ou 90/10, também podem ser usadas.\n", - "\n", - "### Garantir aleatoriedade na divisão\n", - "\n", - "Certifique-se de que os dados sejam divididos de forma aleatória para evitar viés. Isso pode ser feito usando funções como @@INLINE_CODE_1@@ ou bibliotecas como @@INLINE_CODE_2@@.\n", - "\n", - "### Manter a consistência\n", - "\n", - "Se você estiver trabalhando com múltiplos experimentos ou comparando diferentes modelos, é importante usar a mesma divisão de dados para garantir consistência nos resultados.\n", - "\n", - "### Validar os conjuntos de dados\n", - "\n", - "Depois de dividir os dados, verifique se os conjuntos de treinamento e teste representam bem o problema. Por exemplo, certifique-se de que ambos os conjuntos contenham uma distribuição semelhante de classes, se estiver lidando com um problema de classificação.\n", - "\n", - "### Exemplo de código\n", - "\n", - "Aqui está um exemplo de como dividir os dados usando @@INLINE_CODE_3@@:\n", - "\n", - "@@CODE_BLOCK_1@@\n", - "\n", - "### Considerações finais\n", - "\n", - "Dividir os dados corretamente é um passo crucial no processo de aprendizado de máquina. Uma divisão mal feita pode levar a resultados enganosos e prejudicar a performance do modelo.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "source": [ - "train_start_dt = '2014-11-01 00:00:00'\n", - "test_start_dt = '2014-12-30 00:00:00' " - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 21, - "source": [ - "energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \\\n", - " .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \\\n", - " .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 22, - "source": [ - "train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']]\n", - "test = energy.copy()[energy.index >= test_start_dt][['load']]\n", - "\n", - "print('Training data shape: ', train.shape)\n", - "print('Test data shape: ', test.shape)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Training data shape: (1416, 1)\n", - "Test data shape: (48, 1)\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "source": [ - "scaler = MinMaxScaler()\n", - "train['load'] = scaler.fit_transform(train)\n", - "train.head(10)" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-11-01 00:00:000.10
2014-11-01 01:00:000.07
2014-11-01 02:00:000.05
2014-11-01 03:00:000.04
2014-11-01 04:00:000.06
2014-11-01 05:00:000.10
2014-11-01 06:00:000.19
2014-11-01 07:00:000.31
2014-11-01 08:00:000.40
2014-11-01 09:00:000.48
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-11-01 00:00:00 0.10\n", - "2014-11-01 01:00:00 0.07\n", - "2014-11-01 02:00:00 0.05\n", - "2014-11-01 03:00:00 0.04\n", - "2014-11-01 04:00:00 0.06\n", - "2014-11-01 05:00:00 0.10\n", - "2014-11-01 06:00:00 0.19\n", - "2014-11-01 07:00:00 0.31\n", - "2014-11-01 08:00:00 0.40\n", - "2014-11-01 09:00:00 0.48" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Original vs dados escalados:\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 24, - "source": [ - "energy[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']].rename(columns={'load':'original load'}).plot.hist(bins=100, fontsize=12)\n", - "train.rename(columns={'load':'scaled load'}).plot.hist(bins=100, fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - }, - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vamos também escalar os dados de teste\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 25, - "source": [ - "test['load'] = scaler.transform(test)\n", - "test.head()" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-12-30 00:00:000.33
2014-12-30 01:00:000.29
2014-12-30 02:00:000.27
2014-12-30 03:00:000.27
2014-12-30 04:00:000.30
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-12-30 00:00:00 0.33\n", - "2014-12-30 01:00:00 0.29\n", - "2014-12-30 02:00:00 0.27\n", - "2014-12-30 03:00:00 0.27\n", - "2014-12-30 04:00:00 0.30" - ] - }, - "metadata": {}, - "execution_count": 25 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 26, - "source": [ - "# Specify the number of steps to forecast ahead\n", - "HORIZON = 3\n", - "print('Forecasting horizon:', HORIZON, 'hours')" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Forecasting horizon: 3 hours\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 27, - "source": [ - "order = (4, 1, 0)\n", - "seasonal_order = (1, 1, 0, 24)\n", - "\n", - "model = SARIMAX(endog=train, order=order, seasonal_order=seasonal_order)\n", - "results = model.fit()\n", - "\n", - "print(results.summary())\n" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " SARIMAX Results \n", - "==========================================================================================\n", - "Dep. Variable: load No. Observations: 1416\n", - "Model: SARIMAX(4, 1, 0)x(1, 1, 0, 24) Log Likelihood 3477.239\n", - "Date: Thu, 30 Sep 2021 AIC -6942.477\n", - "Time: 14:36:28 BIC -6911.050\n", - "Sample: 11-01-2014 HQIC -6930.725\n", - " - 12-29-2014 \n", - "Covariance Type: opg \n", - "==============================================================================\n", - " coef std err z P>|z| [0.025 0.975]\n", - "------------------------------------------------------------------------------\n", - "ar.L1 0.8403 0.016 52.226 0.000 0.809 0.872\n", - "ar.L2 -0.5220 0.034 -15.388 0.000 -0.588 -0.456\n", - "ar.L3 0.1536 0.044 3.470 0.001 0.067 0.240\n", - "ar.L4 -0.0778 0.036 -2.158 0.031 -0.148 -0.007\n", - "ar.S.L24 -0.2327 0.024 -9.718 0.000 -0.280 -0.186\n", - "sigma2 0.0004 8.32e-06 47.358 0.000 0.000 0.000\n", - "===================================================================================\n", - "Ljung-Box (L1) (Q): 0.05 Jarque-Bera (JB): 1464.60\n", - "Prob(Q): 0.83 Prob(JB): 0.00\n", - "Heteroskedasticity (H): 0.84 Skew: 0.14\n", - "Prob(H) (two-sided): 0.07 Kurtosis: 8.02\n", - "===================================================================================\n", - "\n", - "Warnings:\n", - "[1] Covariance matrix calculated using the outer product of gradients (complex-step).\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Crie um ponto de dados de teste para cada etapa do HORIZON.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 28, - "source": [ - "test_shifted = test.copy()\n", - "\n", - "for t in range(1, HORIZON):\n", - " test_shifted['load+'+str(t)] = test_shifted['load'].shift(-t, freq='H')\n", - " \n", - "test_shifted = test_shifted.dropna(how='any')\n", - "test_shifted.head(5)" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
loadload+1load+2
2014-12-30 00:00:000.330.290.27
2014-12-30 01:00:000.290.270.27
2014-12-30 02:00:000.270.270.30
2014-12-30 03:00:000.270.300.41
2014-12-30 04:00:000.300.410.57
\n", - "
" - ], - "text/plain": [ - " load load+1 load+2\n", - "2014-12-30 00:00:00 0.33 0.29 0.27\n", - "2014-12-30 01:00:00 0.29 0.27 0.27\n", - "2014-12-30 02:00:00 0.27 0.27 0.30\n", - "2014-12-30 03:00:00 0.27 0.30 0.41\n", - "2014-12-30 04:00:00 0.30 0.41 0.57" - ] - }, - "metadata": {}, - "execution_count": 28 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 29, - "source": [ - "%%time\n", - "training_window = 720 # dedicate 30 days (720 hours) for training\n", - "\n", - "train_ts = train['load']\n", - "test_ts = test_shifted\n", - "\n", - "history = [x for x in train_ts]\n", - "history = history[(-training_window):]\n", - "\n", - "predictions = list()\n", - "\n", - "# let's user simpler model for demonstration\n", - "order = (2, 1, 0)\n", - "seasonal_order = (1, 1, 0, 24)\n", - "\n", - "for t in range(test_ts.shape[0]):\n", - " model = SARIMAX(endog=history, order=order, seasonal_order=seasonal_order)\n", - " model_fit = model.fit()\n", - " yhat = model_fit.forecast(steps = HORIZON)\n", - " predictions.append(yhat)\n", - " obs = list(test_ts.iloc[t])\n", - " # move the training window\n", - " history.append(obs[0])\n", - " history.pop(0)\n", - " print(test_ts.index[t])\n", - " print(t+1, ': predicted =', yhat, 'expected =', obs)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "2014-12-30 00:00:00\n", - "1 : predicted = [0.32 0.29 0.28] expected = [0.32945389435989236, 0.2900626678603402, 0.2739480752014323]\n", - "2014-12-30 01:00:00\n", - "2 : predicted = [0.3 0.29 0.3 ] expected = [0.2900626678603402, 0.2739480752014323, 0.26812891674127126]\n", - "2014-12-30 02:00:00\n", - "3 : predicted = [0.27 0.28 0.32] expected = [0.2739480752014323, 0.26812891674127126, 0.3025962399283795]\n", - "2014-12-30 03:00:00\n", - "4 : predicted = [0.28 0.32 0.42] expected = [0.26812891674127126, 0.3025962399283795, 0.40823634735899716]\n", - "2014-12-30 04:00:00\n", - "5 : predicted = [0.3 0.39 0.54] expected = [0.3025962399283795, 0.40823634735899716, 0.5689346463742166]\n", - "2014-12-30 05:00:00\n", - "6 : predicted = [0.4 0.55 0.66] expected = [0.40823634735899716, 0.5689346463742166, 0.6799462846911368]\n", - "2014-12-30 06:00:00\n", - "7 : predicted = [0.57 0.68 0.75] expected = [0.5689346463742166, 0.6799462846911368, 0.7309758281110115]\n", - "2014-12-30 07:00:00\n", - "8 : predicted = [0.68 0.75 0.8 ] expected = [0.6799462846911368, 0.7309758281110115, 0.7511190689346463]\n", - "2014-12-30 08:00:00\n", - "9 : predicted = [0.75 0.8 0.82] expected = [0.7309758281110115, 0.7511190689346463, 0.7636526410026856]\n", - "2014-12-30 09:00:00\n", - "10 : predicted = [0.77 0.78 0.78] expected = [0.7511190689346463, 0.7636526410026856, 0.7381378692927483]\n", - "2014-12-30 10:00:00\n", - "11 : predicted = [0.76 0.75 0.74] expected = [0.7636526410026856, 0.7381378692927483, 0.7188898836168307]\n", - "2014-12-30 11:00:00\n", - "12 : predicted = [0.77 0.76 0.75] expected = [0.7381378692927483, 0.7188898836168307, 0.7090420769919425]\n", - "2014-12-30 12:00:00\n", - "13 : predicted = [0.7 0.68 0.69] expected = [0.7188898836168307, 0.7090420769919425, 0.7081468218442255]\n", - "2014-12-30 13:00:00\n", - "14 : predicted = [0.72 0.73 0.76] expected = [0.7090420769919425, 0.7081468218442255, 0.7385854968666068]\n", - "2014-12-30 14:00:00\n", - "15 : predicted = [0.71 0.73 0.86] expected = [0.7081468218442255, 0.7385854968666068, 0.8478066248880931]\n", - "2014-12-30 15:00:00\n", - "16 : predicted = [0.73 0.85 0.97] expected = [0.7385854968666068, 0.8478066248880931, 0.9516562220232765]\n", - "2014-12-30 16:00:00\n", - "17 : predicted = [0.87 0.99 0.97] expected = [0.8478066248880931, 0.9516562220232765, 0.934198746642793]\n", - "2014-12-30 17:00:00\n", - "18 : predicted = [0.94 0.92 0.86] expected = [0.9516562220232765, 0.934198746642793, 0.8876454789615038]\n", - "2014-12-30 18:00:00\n", - "19 : predicted = [0.94 0.89 0.82] expected = [0.934198746642793, 0.8876454789615038, 0.8294538943598924]\n", - "2014-12-30 19:00:00\n", - "20 : predicted = [0.88 0.82 0.71] expected = [0.8876454789615038, 0.8294538943598924, 0.7197851387645477]\n", - "2014-12-30 20:00:00\n", - "21 : predicted = [0.83 0.72 0.58] expected = [0.8294538943598924, 0.7197851387645477, 0.5747538048343777]\n", - "2014-12-30 21:00:00\n", - "22 : predicted = [0.72 0.58 0.47] expected = [0.7197851387645477, 0.5747538048343777, 0.4592658907788718]\n", - "2014-12-30 22:00:00\n", - "23 : predicted = [0.58 0.47 0.39] expected = [0.5747538048343777, 0.4592658907788718, 0.3858549686660697]\n", - "2014-12-30 23:00:00\n", - "24 : predicted = [0.46 0.38 0.34] expected = [0.4592658907788718, 0.3858549686660697, 0.34377797672336596]\n", - "2014-12-31 00:00:00\n", - "25 : predicted = [0.38 0.34 0.33] expected = [0.3858549686660697, 0.34377797672336596, 0.32542524619516544]\n", - "2014-12-31 01:00:00\n", - "26 : predicted = [0.36 0.34 0.34] expected = [0.34377797672336596, 0.32542524619516544, 0.33034914950760963]\n", - "2014-12-31 02:00:00\n", - "27 : predicted = [0.32 0.32 0.35] expected = [0.32542524619516544, 0.33034914950760963, 0.3706356311548791]\n", - "2014-12-31 03:00:00\n", - "28 : predicted = [0.32 0.36 0.47] expected = [0.33034914950760963, 0.3706356311548791, 0.470008952551477]\n", - "2014-12-31 04:00:00\n", - "29 : predicted = [0.37 0.48 0.65] expected = [0.3706356311548791, 0.470008952551477, 0.6145926589077886]\n", - "2014-12-31 05:00:00\n", - "30 : predicted = [0.48 0.64 0.75] expected = [0.470008952551477, 0.6145926589077886, 0.7247090420769919]\n", - "2014-12-31 06:00:00\n", - "31 : predicted = [0.63 0.73 0.79] expected = [0.6145926589077886, 0.7247090420769919, 0.786034019695613]\n", - "2014-12-31 07:00:00\n", - "32 : predicted = [0.71 0.76 0.79] expected = [0.7247090420769919, 0.786034019695613, 0.8012533572068039]\n", - "2014-12-31 08:00:00\n", - "33 : predicted = [0.79 0.82 0.83] expected = [0.786034019695613, 0.8012533572068039, 0.7994628469113696]\n", - "2014-12-31 09:00:00\n", - "34 : predicted = [0.82 0.83 0.81] expected = [0.8012533572068039, 0.7994628469113696, 0.780214861235452]\n", - "2014-12-31 10:00:00\n", - "35 : predicted = [0.8 0.78 0.76] expected = [0.7994628469113696, 0.780214861235452, 0.7587287376902416]\n", - "2014-12-31 11:00:00\n", - "36 : predicted = [0.77 0.75 0.74] expected = [0.780214861235452, 0.7587287376902416, 0.7367949865711727]\n", - "2014-12-31 12:00:00\n", - "37 : predicted = [0.77 0.76 0.76] expected = [0.7587287376902416, 0.7367949865711727, 0.7188898836168307]\n", - "2014-12-31 13:00:00\n", - "38 : predicted = [0.75 0.75 0.78] expected = [0.7367949865711727, 0.7188898836168307, 0.7273948075201431]\n", - "2014-12-31 14:00:00\n", - "39 : predicted = [0.73 0.75 0.87] expected = [0.7188898836168307, 0.7273948075201431, 0.8299015219337511]\n", - "2014-12-31 15:00:00\n", - "40 : predicted = [0.74 0.85 0.96] expected = [0.7273948075201431, 0.8299015219337511, 0.909579230080573]\n", - "2014-12-31 16:00:00\n", - "41 : predicted = [0.83 0.94 0.93] expected = [0.8299015219337511, 0.909579230080573, 0.855863921217547]\n", - "2014-12-31 17:00:00\n", - "42 : predicted = [0.94 0.93 0.88] expected = [0.909579230080573, 0.855863921217547, 0.7721575649059982]\n", - "2014-12-31 18:00:00\n", - "43 : predicted = [0.87 0.82 0.77] expected = [0.855863921217547, 0.7721575649059982, 0.7023276633840643]\n", - "2014-12-31 19:00:00\n", - "44 : predicted = [0.79 0.73 0.63] expected = [0.7721575649059982, 0.7023276633840643, 0.6195165622202325]\n", - "2014-12-31 20:00:00\n", - "45 : predicted = [0.7 0.59 0.46] expected = [0.7023276633840643, 0.6195165622202325, 0.5425246195165621]\n", - "2014-12-31 21:00:00\n", - "46 : predicted = [0.6 0.47 0.36] expected = [0.6195165622202325, 0.5425246195165621, 0.4735899731423454]\n", - "CPU times: user 12min 15s, sys: 2min 39s, total: 14min 54s\n", - "Wall time: 2min 36s\n" - ] - } - ], - "metadata": { - "scrolled": true - } - }, - { - "cell_type": "markdown", - "source": [ - "Compare previsões com a carga real\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 30, - "source": [ - "eval_df = pd.DataFrame(predictions, columns=['t+'+str(t) for t in range(1, HORIZON+1)])\n", - "eval_df['timestamp'] = test.index[0:len(test.index)-HORIZON+1]\n", - "eval_df = pd.melt(eval_df, id_vars='timestamp', value_name='prediction', var_name='h')\n", - "eval_df['actual'] = np.array(np.transpose(test_ts)).ravel()\n", - "eval_df[['prediction', 'actual']] = scaler.inverse_transform(eval_df[['prediction', 'actual']])\n", - "eval_df.head()" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
timestamphpredictionactual
02014-12-30 00:00:00t+13,008.743,023.00
12014-12-30 01:00:00t+12,955.532,935.00
22014-12-30 02:00:00t+12,900.172,899.00
32014-12-30 03:00:00t+12,917.692,886.00
42014-12-30 04:00:00t+12,946.992,963.00
\n", - "
" - ], - "text/plain": [ - " timestamp h prediction actual\n", - "0 2014-12-30 00:00:00 t+1 3,008.74 3,023.00\n", - "1 2014-12-30 01:00:00 t+1 2,955.53 2,935.00\n", - "2 2014-12-30 02:00:00 t+1 2,900.17 2,899.00\n", - "3 2014-12-30 03:00:00 t+1 2,917.69 2,886.00\n", - "4 2014-12-30 04:00:00 t+1 2,946.99 2,963.00" - ] - }, - "metadata": {}, - "execution_count": 30 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Calcule o **erro percentual absoluto médio (MAPE)** para todas as previsões\n", - "\n", - "$$MAPE = \\frac{1}{n} \\sum_{t=1}^{n}|\\frac{actual_t - predicted_t}{actual_t}|$$\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 31, - "source": [ - "if(HORIZON > 1):\n", - " eval_df['APE'] = (eval_df['prediction'] - eval_df['actual']).abs() / eval_df['actual']\n", - " print(eval_df.groupby('h')['APE'].mean())" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "h\n", - "t+1 0.01\n", - "t+2 0.01\n", - "t+3 0.02\n", - "Name: APE, dtype: float64\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 32, - "source": [ - "print('One step forecast MAPE: ', (mape(eval_df[eval_df['h'] == 't+1']['prediction'], eval_df[eval_df['h'] == 't+1']['actual']))*100, '%')" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "One step forecast MAPE: 0.5570581332313952 %\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 33, - "source": [ - "print('Multi-step forecast MAPE: ', mape(eval_df['prediction'], eval_df['actual'])*100, '%')" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Multi-step forecast MAPE: 1.1460048657704118 %\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Trace as previsões versus os valores reais para a primeira semana do conjunto de teste\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 34, - "source": [ - "if(HORIZON == 1):\n", - " ## Plotting single step forecast\n", - " eval_df.plot(x='timestamp', y=['actual', 'prediction'], style=['r', 'b'], figsize=(15, 8))\n", - "\n", - "else:\n", - " ## Plotting multi step forecast\n", - " plot_df = eval_df[(eval_df.h=='t+1')][['timestamp', 'actual']]\n", - " for t in range(1, HORIZON+1):\n", - " plot_df['t+'+str(t)] = eval_df[(eval_df.h=='t+'+str(t))]['prediction'].values\n", - "\n", - " fig = plt.figure(figsize=(15, 8))\n", - " ax = plt.plot(plot_df['timestamp'], plot_df['actual'], color='red', linewidth=4.0)\n", - " ax = fig.add_subplot(111)\n", - " for t in range(1, HORIZON+1):\n", - " x = plot_df['timestamp'][(t-1):]\n", - " y = plot_df['t+'+str(t)][0:len(x)]\n", - " ax.plot(x, y, color='blue', linewidth=4*math.pow(.9,t), alpha=math.pow(0.8,t))\n", - " \n", - " ax.legend(loc='best')\n", - " \n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "No handles with labels found to put in legend.\n" - ] - }, - { - "output_type": "display_data", - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAA4QAAAHjCAYAAAB7INHwAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nOzdd3xV9f348de592bvhDBkhhEggCICIqCCgoJ7K462Wm1rtV+7tFpb/XVpq6211tFaR93WPVBQQXAwFBXUMMLeSHZyM26Se+/5/fG+J+ecDJYhN+P9fDx45JxzRz6xac59fz7vz/ttmKaJUkoppZRSSqnuxxPtASillFJKKaWUig4NCJVSSimllFKqm9KAUCmllFJKKaW6KQ0IlVJKKaWUUqqb0oBQKaWUUkoppbopDQiVUkoppZRSqpvyRXsAh1uPHj3MQYMGRXsYSimllFJKKRUVn3/+ebFpmtktPdblA8JBgwbx2WefRXsYSimllFJKKRUVhmFsa+0xTRlVSimllFJKqW5KA0KllFJKKaWU6qY0IFRKKaWUUkqpbqrL7yFUSimllFJKqa6ioaGBnTt3EggEmj0WHx9Pv379iImJOeD304BQKaWUUkoppTqJnTt3kpKSwqBBgzAMo/G6aZqUlJSwc+dOcnJyDvj9NGVUKaWUUkoppTqJQCBAVlaWKxgEMAyDrKysFlcO90UDQqWUUkoppZTqRJoGg/u7vi8aECqllFJKKaVUN6UBoVJKKaWUUkp1UxoQKqWUUkoppVQnYprmQV3fFw0IlVJKKaWUUqqTiI+Pp6SkpFnwZ1UZjY+PP6j307YTSimllFJKKdVJ9OvXj507d1JUVNTsMasP4cHQgFAppZRSSimlOomYmJiD6jO4P5oyqpRSSimllFLdlAaESimllFJKKdVNaUColFJKKaWUUt2U7iFUSqluYv16+O9/ITsbfvxjiIuL9oiUUkopFW26QqiUUt3Es8/Cjh3wxRfw5pvRHo1SSimlOgINCJVSqhsIBGDzZvt84UKor4/eeJRSSinVMWhAqJRS3cCmTeDsX1tVBUuWRG88SimllOoYNCBUSqluoKCg+bX5891BolJKKaW6Hw0IlVKqG1i/vvm13bvhq6/afyxKKaWU6jg0IFRKqS4uFIKNG+1zj+Mv//z57T8epZRSSnUcGhAqpVQXt3071NXZ52efbR/n58POne0/JqWUUkp1DBoQKqVUF+dMF83IgDPPhLQ0+5quEiqllFLdlwaESinVxTkDwtxciImBk0+2ry1ZAhUV7T8upZRSSkWfL9oDUEopdfiYZvOAEGDGDHjjDQgGoaEB3n4bZs2C2lr7XyDg/mr9a2iAkSNh6tTo/ExKKaWUajsaECqlVBdWVATl5XIcDMp+wscfl8CuulqCxXAY1q2Dr78Gr/fA3nf7dhg8GI444vCNXSmllFKHn6aMKqVUF+ZcHSwpgS1bYPNm2LNHgrlQSFYR6+oOvrjMunVtO1allFJKtT9dIVRKqS7MCghNE3w+d8uJlBTo1UsCRa8X9u6Fk06ChAT7X3y8+7iiAl59VV5fUCDPV0op1T3V1Ei16pwcyM6O9mjUodKAUCmlujArIKythaQkOc7MhCuvlCCvoADuvtt+/vjxMHp06+8XCsG8ebKvcPdu8PslsFRKKdX9vPqqZIv4fHJfGTAg2iNSh0JTRpVSqouqqoJdu+TY74esLDkePhzS0yEuDsaMgb597dfMm7fv9/R6Ydgw+9yZkqqUUqr7qK6WSUWQPepPPy371lXnowGhUkp1URs22MdVVdKDEOxKowCGIdVFLV99JSt/++J8vQaESinVPa1dK9sRLLW18OSTMgGpOhcNCJVSqouyZm5DIUnn8fmkB+GgQe7nTZ7sTvvcX6P63FwJJAE2bpSZYaWUUt1Lfr59bO1PLy+Hp56SQmWq89CAUCmluihr9c7vl32DADk9/PjMBtfzYmOlL6Hl44/3PcObmAj9+slxfT1s29aGg1ZKKdXh1dRI1WqQycbvfU/uJSBVrJ97TiYjVeegAaFSSnVBDQ32zbqyMhIQLlxI7vWnyAbCX//aFfWdfLLc1K3Xvv/+vt9/+HD72FqJVEop1T2sWyc9bAGGDpUqoxdfbK8UbtoEr73mTilVHVe7BoSGYXgNw1hpGMbcJtfvMwyjynEeZxjG/wzD2GgYxieGYQxyPHZL5HqBYRintt/olVKq89iyRVI5TTNSUIZiWLaUYWaBTO3eeadUh3n0UQiFSEuT1FHLe+/tOxW0aUCoN32llOo+1qyxj0eNkq+5uXD22fb1VatgwYL2HZc6NO29QngDsNZ5wTCM8UBGk+d9HygzTXMo8HfgL5Hn5gGXAKOAWcCDhmF4D/eglVKqs7FW7QIBSeOJ37aeLErIpMx+0t69cPXV0mti8WJXcZmKCli2rPX379ULUlPluLRUehkqpZTq+gIB2T8OUnnaOUE4bpy7P+2HH8Knn7bv+NTBa7eA0DCMfsDpwCOOa17gbuCmJk8/G3gicvwScLJhGEbk+vOmadaZprkF2AhMPNxjV0qpzsbaP1hZGWk3sWEDubRSEnTVKpg+nf43nMeo3nZkN39+6yt/hqFpo0op1R0VFNj7A4cMkZ62TtOmyTyjZe5cqUiqOq72XCG8Fwn8wo5r1wNvmKa5p8lz+wI7AEzTDAIVQJbzesTOyDWllFIRpmm3nPD7ITOpDnbsYBiOPhRxcc1f+OqrzL73VPjic6ivZ/v2fd/Ene0nNCBUSqnuYfVq+zgvr/njhgFnnmlPGpomvPACbN/ePuNTB69dAkLDMM4ACk3T/Nxx7QjgQuCfh+H7/cAwjM8Mw/isSDtkKqW6md27pWFwKCRfs/xb8NHAQLayl55sy51JaO16mDOn2WuPDH5OnzUL4fXXYP165r/Vepm4IUPsQjTbtkkakVJKqa6rvt6ecPR4YOTIlp/n8cBFF9kVqa3G9cXF7TNOdXDaa4VwCnCWYRhbgeeBk4DVwFBgY+R6omEYkYxkdgH9AQzD8AFpQInzekS/yDUX0zQfNk1zvGma47Ozsw/LD6SUUh2VtVrn90vfweQdaxnMZh7lak7nLc6vfIwpcwZwcehZbr58Jw/n3MF7zGATg2kghlnMlyZSn37Cyj+9zZ7nFrf4fWJiYPBgOQ6H7T0lSimluqb16+2CY4MGSRui1sTGwuWX222PamvhiSegqqr116joaJeA0DTNW0zT7Gea5iCkKMz7pmlmmKbZ2zTNQZHrNZEiMgBvAN+NHF8Qeb4ZuX5JpAppDjAM0K2qSinl4No/mBHG2LSJNCp4jKvkgbR0gkEpC75gbV8ezryZW3Ke5+KYV5nKx/yT6/maMRSQy+6KRJ64dB51s8+ROuNN6D5CpZTqPpzpoqNHS7XR226DJ5+Eb75p/vykJPjud+UrSOP6J5/UxvUdjS/aA2jFo8BTkRXDUiSIxDTN1YZhvACsAYLAdaZpattLpZRysNpA+P3QJ6MYArWsZCwmBnh9kJzU5BUGZGZBejrhvXvZ8Y0PfziF8khCxpccyQvztzPgnQIGH7WHnIsnMvXUJI4+2r2PcMMG+b6G0X4/q1JKqfbR0GBPOBqG9B88+WTZMpCQIMVjJkyAmTPhqKPse0FmJlxxhXQ5amiQxvXPPy+rh17tFdAhtHtjetM0F5umeUYL15MdxwHTNC80TXOoaZoTTdPc7HjsT6ZpDjFNc7hpmvPaa9xKKdUZlJXJHo1AQG68WWUbSaSGBcyUJ6Slkp5uMHOmew8gAB4v9DkCRo8mJcOHgZQYNfFQSSo7zb58uCqFJ36znmvOLuSDxSbp6dKCAmS/4q5mSfxKKaW6gg0bZA8hwMCBsHChBIMg6aAbNsBXX8Hf/ga//CXMmyf3BYC+fd2N6zduhNdf1x62HUVHXSFUSil1CJzpoh4PpO/Ip5BsaonUBU9L59JL4apI9mgoBDt3SiP7zZutr7FsSRpI0pY6qooDEAxSSSppVGBYL9qxnb/9qJzjvsolN1daGoKsTlpFBJRSSnUdTauL3nef+/EdO2TVMD4eCgvh2WfhpZdgyhRZNRw+HM46C157TZ6/cqX0s50xo/1+BtUyDQiVUqoLsQJCvx8yEmoxi4v4nKmNj8dlp3LeefbzvV6Z6R04UHpHWcJhWLEijtt+G0vVthKqtpSS3VBENcmNweXugkqevXMb0783kI8+ktcVFEgKkVJKqa4jGHTvEx8yBD7/3D7PzJRJyNJSOOII+3p9PSxaJP9GjJDA8IQTpGE9wAcfQFqapJqq6Gn3lFGllFKHj9UwuLoasgK72M4Aqolk5CencMY5PtLT9/8+Hg8ceyycOM1g8MQeHHlBLhOmp/JswtXE0ND4vMfuLibRV9/YmHjPHlmdVEop1XVs2mQXgunfH774AkpK7MeTkyElBWpq4PrrYdKk5vsD162Df/4T3nhDAkzr/d58s8WaZaodaUColFJdRCAgjX/9ftmXkVm8gU0MadwLSFoal112cO85e3bkwOtla98pVP/1IebwXOPjNdUm//7OEoYNs19jrVIqpZTqGpzpoqNGSSqoJSHBDv4aGmDpUrjuOrj3XjjvPFkBdCovl3vV8uWyylhaKo3rd+w4/D+HapkGhEop1UVs3GhXFyUcomF3EWVkND5+wowYBgw4uPccOxZ697bP59WdxFUXVpFBWeO11xelELdna+O5tp9QSqmuIxRyr+ANGACfOpq+JSXZbSUAXn5ZCpylp8O550pgeN11uCYOPR7Zb15SImmjCxbAPffICqNqfxoQKqVUF7F+vQSElZWQGi5nnZlLPAF5MDaOy67PPOj3NAw49VT7fOVKqP7dX/lRqr1KaJrwxu9XysZDJLXIalyslFKqc9uyRaqIguwPXLcOiork3DBgzBjpNWgJBOCZZ+xzn09SSG+7Df7wB9lD6PPJquLgwdLAvqwM3n8fXnyx/X4uZdOAUCmluoiCArvdRELFXnbRFx/SqnVETh3jjjm0BoHHH2/P/pomvLMik3P+czpD2NT4nFUl/Ql8JFPGDQ2wdeu3+lGUUkp1EE3TRd94w24/kZAgAd5FF8keQssLL7S8n3zQILjmGqlQevHF0rZo4EAJLMNhWSlcu/aw/jiqBRoQKqVUFxAKScqo3w9gUlYUJM5aHQQuu8JzyA3j4+Jg+nT7/MMPoe6M8/n5SV+6nrf8oyChvcWAFghQSqmuIBx2B2h9+sCKFfZ5cjJMnSpfL7nEvl5TA8/ZiSTNpKTAGWdImuikSZCdLde/+UYCTk0dbV8aECqlVBewfbvM2FZWQqg6wJ5gVmO6aE9vCTN/Oupbvf/MmXbRgLo6KSF+7HM/5fj4zxqfU0kya19aDeFwY/qqUkqpzmvbNru5fO/esjWhsFDOPR7o0QOOPFLO58yBxET7tc89B1VV+35/jwcmTpT3jo+XVNSKCnjrrbb/WVTrNCBUSqkuwNluorZMAsE4JKfnkrEF+JLivtX7Z2ZKGwrLu+9CKKsnP73rCLyRtFQfQb4q60dgyeeUldl7TJRSSnVO+fn2cV6e7POrqJDzxEQ47jjZDwjSZP6ii+znV1VJ6uj+jB0rgWH//rIiWVQEX30Fa9a03c+h9k0DQqWU6gLWr5d00XAY/H6DOOoxMEmglnOuzNj/GxyAWbPs49JS+M9/oP+Pz+TCUZJPZAAGYb74sApKSrT9hFJKdWKm6Q7KsrKksJglORmmTHG/5rLLZJuB5Zln9p/+mZ4OOTmyV71nT0kbBelPqKmj7UMDQqWU6uRM0w4IqypCmKFQ4/7Bs3md1PNntsn3ycmRggKWJUvgkUcNrnllNqk+uWvHE2CtmUvZa4spWBtuk++rlFKq/W3fbqd8ZmfDhg125ofXKymekye7X5ORAeefb59XVLh7Frbm6KPla69esvXBNOV7a+po+9CAUCmlOrmiImn0W1kJ5SUhvASJpw4DkzlHrnE3EvyWrr1WigpYPvoIXvqoF9dcIxVrrDTVT/f0Z/vLKxpLlSullOpcnKuDeXkyCWgFhElJMHx4pBhMkw3j3/mOtJKwPP20VMDel3Hj5KvHIyuRVoVSTR1tHxoQKqVUJ2e1m6ishPq6MLHU4yXIdBbR97xj9/8GByEtDW65xR1jLl4M1eOmMqCXBKFx1LGDfmxbsJ6Ni3a06fdXSil1+Jmmu91EcrJkojQ0yHlSEkyZbMKNN8qy4IwZ0mUeKTRzzjn2a0tL4dVX9/39BgyQverWe2c4djpo1dHDTwNCpZTq5Kx00fIyE1+4nngCGMDlPC11vdtYRoYEhT172tc++MAg76IxmB5vY3XTT0LHsOaXjzU2rFdKKdU57NplF4/JzJS2RtbqoM8n+wQnBz+Av/5VnrhwIfzoR42v/+537WIzAE8+afcubIlhSHEZSzBo32OqqzV19HDTgFAppTo5qwx4dVU4ki4aYDT5jOlVZG/MaGOZmfDrX8tMsGVbWSqZw3sSRx0A5aTz2tphhB/692EZg1JKqcPDuTo4ciQsX+5OF01JgSPfu8f9opdekka1yF7AM8+0HyoqkpW+fbHSRkH2L06fTmP/XE0dPbw0IFRKqU7M74cdO2DPHiAUIoYG4qjncp7GOON02ZBxmGRlwa23yldLUu4R+BN6EYPkFS3nONbe+Jg0s1JKKdXhNU0XjY2VSUdrxTA5GSaN9uOd38Ky3U9/Kj2QgO99z30L+u9/7ZTTluTlufceFhXB8cfb55o6evhoQKiUUp3Yhg2yP6Oy0oRQiARqOILdTGfRYUkXbapHD1kptPZ7pKQYpOb0oAG5qweI45+1V8E112ineqWU6gS++QbKyuQ4LQ02bbJXB2Nj5d+UyvktbwdYuRKeeAKAvn3htNPc7/v2261/35gYGD3a/VbTp2vqaHvQgFAppTqx9eth82YwwyY+giQQYA7P4Y31ySb/dtCzpwSF6elynjs6loakdALEAzCfWWx/bx08+mi7jEcppdShc64OjhgBn33mThcFk8kf39X6G/z6141lQq+6yr1K+PjjjQuILXLucsjPl5jzvPM0dfRw04BQKaU6sfz8SBPfkLSbyKSUs3kdpk2TvJ520ru3FJpJS5PZ49wj46nzJFJHPHXEcRc3wi9+ATt3ttuYlFJKHZym6aKGIStzxcVynpQEIzIKydrymf2k2FhpSmjZuxfuvBOQ6qEzHa1wd+6Ed95p/fs7C8s0NMhY+vbV1NHDTQNCpZTqpOrrYdGiyJ6MUIg46riQF0mipl3SRZs64ggJClNSICfHICE1htpIQLiQk1lRmQs/+IGmjiqlVAdVWGgHfykpkoFSXi73mbg4Seuc4p/vftE558Avf+m+ds898mLg+993P/TYPopPp6fD4MH2+cqV8rVp6ujcuYfww6lWaUColFKd1KZNUgocTDDDJFPFHJ6XB08/PSpj6ttXgsLUVMgd4QVfLLUkUEYm9/BzwvPmS/1xpZRSHY4zHXPoUAnICgvlPDkZCAWZsuoB94uuugp+9SuZFbTU18NNNwES4J10kv3Q1q3SpaI1zrTRlStlDtHnk9RRK/306681dbQtaUColFKd1BtvyEyppIuGmcECerNXaoQ7p1jbWf/+cPPNUjEuIcULhodKUlnBMbzBWVKFbvfuqI1PKaVUy5zpouGwrAw69w+m1u5ldJ0jXbR/f9mvnpzcmCba6OWX4YMPALj6avdDjz7a+iqhMyAsL5cAEmTCcepU+zFNHW07GhAqpVQn9corkc35Iek/eC0PyQNRSBdtauBA+M1vYMgQA2JjMYFisvkDv6G6vB6uvVZTR5VSqgMpLpbtfyDB3+bNEAhIfZiEBPB6YVLle3hw/O2+8kp5AODyy2HCBPebRtpQ5ObCCSfYlzdubGxZ2MyAAe52RlbaKGjq6OGiAaFSSnVCBQVSYRRMCIcYxFbG8pU82AECQoCcHNlWkp7hAV8MIbxsJYdbuEOmdp97LtpDVEopFeFcHczJkXNnMRlqa5m65wX3i6680j72eODee92Pr1olDQhpvkr4yCMtzwsahru4jDMg1NTRw0MDQqWU6oQefBCCQSI5NyYXEblJp6fD5MnRHJrL9OkwezZ443yEjBhM4Dnm8DLnwk9+Yk9HK6WUiipnQFhfL7eXwkIJ0JKSgOJiJrHcftLJJ8OgQe43mTwZLrnEfS3ShiIvD447zr68bh0sXdryWJxpo1u32n0RQVNHDwcNCJVSqpMpLJSy3Va6aBx1fJ9H5MFZs2QKtYPIzpZGwxMmGBAbh4lBGC+383s+Ks2DW2+N9hCVUqrbKyuDPXvkOCFB0kXDYVkhTEgAjxEmr3wpmTgis6blQy1/+Yu7DUVhIdxxB3Dgq4R5edLNwuJcJQRNHW1rGhAqpVQn8+KLUFUVuYmGQwxlI72I7PrvIOmiFsOA3FyYNAmye3kIxyUCsIc+3M2N7H5svuS/KqWUihrn6mC/frLHr7xcMlGSk4HycqbUv28/KT0dzj235TcbMABuvNF97e9/h82bOeooGD/evvz117BiRfO3iImRyURL04BQU0fblgaESinVidTWSuG26mrADOM1g8zkXQyQO+OsWVEeYXMjRsjNe+pUSMqIw4jcwfMZxVxzNvz2t1EeoVJKdW/OgDAQkK+FhXJbSUgAiouZwhL7SZdd5l4FbKqlNhSRILGlVcKWjBvnHl99vftxTR1tOxoQKqVUJ/Lmm1BaajWjD5NKBdOQst5MnuwuzdZBDBoks705OdCzl0FKD0lprSCdF7iI8hffhS++iO4glVKqm6qogJ075Tguzm7zUFQEiYngCdaTVrmDPBxLcK2li1qSkuDPf3Zfe+UVWLyYY46Bo46yL3/xRcu3AGdhmYYGyM9v/pymqaPz5u17WKplGhAqpVQnEQ7Ds8/KDGgoBEY4SBalHM9H8oQoNaPfH59PGhwbBhx7LMRlJGN45fazljzmcroUHVBKKdXunKmW2dmwY4esEvr9kXTRkmIms9RuN3H00e6qL6257DKYONF97ac/xQiHDmiVMC0Nhgyxz1etav6cllJHm64kqv3TgFAppTqJDz+UWdzqagCT5HAluRSQSCS/p4PtH3TKzZWvPXvC6NEGyT3iAAgQz7/5IYF3FsPixVEbn1JKdVfOdNHaWvlaVCTtBePjTSguYTKOcqD7Wx20tNSG4ssv4fHHmTRJCsdYPv1UgrmmnHHnypUtF6Dp29cudhoK2Suc6sBpQKiUUp3EM8/I15oaIBwmgzKO4ku5OHAgjBoVtbHtjxUQWsc9+iU0VkNdxwhe5Ry45RZtVq+UUu3I74ft2+U4JsadLpqUBEaVH6M+wHEskwfi4uDSSw/8Gxx3HMyZ4752660Y/soDWiV0po2Wl7ce7A0dah9v3Hjgw1NCA0KllOoE1qyR2dFQCOrqINGoJZY6O130jDMkJ7ODSk2FPn3k2OuF8883SMyUggRhvPydnxNa/qlsklRKKdUu1q615+HS06GkxG43YfUeHMVq0qmQJ513HmRkHNw3+ctfIpVpIgoL4U9/4vjj3ZOFS5bA+vXulw4Y4N4a37TaqEUDwm9HA0KllOoEnKuDpmmSHiwmjnomEKnX3UH3DzoNH24fjxkDg0fEyZQ0sIkhPMsc6UsYCkVphEop1b04C7VYFTqtJvBxviCUlbmrix5ouqhT//7N21Dcey/G5k3N3q5pP0HDcK8StlZ/rHfvSACLrG5WVBz8MLszDQiVUqqDC4fh44/luKoKYr1hEkOV5LCFZGqkDNz06dEd5AFwBoRbt0qGaFy6PWt8NzcRyl8Nzz3X/oNTSqluprraTsH0+WDbNjluTBctKwXTtAPCQYMO/V5z002y2c8SaUMxfbp7BXD+/OZzgs59hNu2SaXtpgxDVwm/DQ0IlVKqg9u2zSokIzO4SR6Zxj2ayFTpjBn77gfVQfTta8/g7t0rFUePOTYGYmMB2EVfHuYHcNttWiZOKaUOM2e6aGKiTDiCZHQmJwPFxWRQxgjWyQNXXmmX8zxYLbWhePVVPB8scrXPLS2VAjNOeXmyddHSUrVR0IDw29CAUCmlOjgrpcfaPxhfX4mBY9a2A1cXdTIM936RDRvgjjsgJtVeJfwHP6VmyzetdypWSinVJpzVRa1Jx9pauc/EBmugpsZuN2EY8L3vfbtveOmlMhPo9LOfcdqp7iXBpr0EY2Jg9Gj7vLW0UWeLik2bJLtGHRgNCJVSqoOzAsLqatk/GF9XQTLVjLKaBJ92WvQGd5CcAWFBgewlnDnL1zj9W0Q293ID/P739icUpZRSbaqmBjZvlmPDsBvTFxXZvQcBe+Jx5kyp8PJttNKGIvfjxxg82L60aJHd/sLiTBtdvVqC1qZSUmQvIcjr9+z5dsPtTjQgVEqpDs4KCKuqIIYGvATpy06yKJG7pHNfRgc3dKidcbR5s5QRv/NOiHWsEj7K99mz14D77ovSKJVSqmtbt85eQYuNtQOswkJISgxDSQkewkxiuTxwKMVkWjJpkjSsdzB+cyuzT6xpPK+thQ8+cL/MWVgmGHSvbjpp2uih0YBQKaU6sEBAUitNU2Z048IybXoMn2NAp0kXtcTH2zfsYBBeeEHaUZx7gbdxH2QF6dzFjXDXXXa5O6WUUm3GGVBZewfDYbnPxFSVQyjEaPJJxS9VX84+u+2++Z13uttQFBUxa/XfXE95+233S9LS3Cmh2n6ibbVrQGgYhtcwjJWGYcyNnD9jGEaBYRj5hmE8ZhhGTOS6YRjGfYZhbDQM4yvDMMY53uO7hmFsiPz7bnuOXyml2ps1i9vQAA31JvH1fmJpYJxVUKYTtJto6rTTGuvIsGMHLFwIv/sdJGYmgGFgYvA6Z7OqfKAEhUoppdpMba3ssQOZbNy9W45LSyPZ+8WSLjqVSHnryy93V3X5tvr3l6qjDn0e+QPjhtq9IpYvb15N1Jk2unKlXRDHacAAqZgKsH17y6mlqrn2XiG8AVjrOH8GGAGMARKAqyPXZwPDIv9+ADwEYBhGJnA7cCwwEbjdMIyD7I6plFKdhzWLW1MD4VCYeGpIoZLhrIfsbJgwIboDPARZWXDWWfb5Rx9Jz6iLLvE0rhL6SeUubiR87326EUQppdrQujTM7GEAACAASURBVHV2awePxw6sioshKaYO/JUATGapPHDVVW0/iJtugn797POGBmZveajxNByGd991v8QZEFZUwJYtzd82Jka6Y1jv0dJzVHPtFhAahtEPOB1oLB1nmubbZgTwKWD9ZpwNPBl5aDmQbhhGH+BU4D3TNEtN0ywD3gNmoZRSXZRz/6ARChFHPT0opj87ZHXwUEuAR9lRR7lv7i+9BNdeCxl94sEwCONhBRN4K3AS/PGP0RuoUkp1Mc50Ub/fPg4EwFtWAkAWJeSyHsaPhyOPbPtBJCY2a0Nx8qd3EFNb2XjeNG20f393z0JNG2077flJ4l7gJqBZEdhIqugVwPzIpb7ADsdTdkautXa96fv9wDCMzwzD+KyoqKhtRq+UUlGQny+znIEAxIYDeAkxji+kDHgn2z/Y1BlnyCInSEHRjz6CCy70QEIiAJWk8U+up+bfT9n5TUoppQ5ZIGAHScGgFJEByUKprzcbq4s2tptoq2IyLbn0UikyE5GKn+NDixvP16yRPrwWw2ieNtoSDQgPXrsEhIZhnAEUmqb5eStPeRD40DTNj9ri+5mm+bBpmuNN0xyfbX3aUEqpTqa0VLIl6+ogWB8m3qwhGT95rJW8mJkzoz3EbyU2Fi66yN7vsXmztKHoOzgWPB6C+NjOAP4buhxuvz26g1VKqS7AmS5qmnaSSWkpJIX8UF8PRNpNxMfDJZccvsEYRrNVwtmbH4BQsPG8aU9CZ0C4bVvzfYYAPXtKCwqAkhKtTXYg2muFcApwlmEYW4HngZMMw3gawDCM24Fs4OeO5+8C+jvO+0WutXZdKaW6HGf/wVBDiHgCpFJJHmvghBMgNTW6A2wDvXu72ygWFMCUqR68SVKBroI0nuJydj+zCL7+OkqjVEqprsGZLlppZ2dKcFgqWXUewhzLJ3DBBZCefngHdMIJOJsQTmlYREpNYeP522+7i8eMHOmub7NqVfO3NAz3KqEmmOxfuwSEpmneYppmP9M0BwGXAO+bpnm5YRhXI/sC55im6UwlfQP4TqTa6CSgwjTNPcA7wCmGYWREismcErmmlFJdTn6+3Airq4FQmDgC9KCYwWzu9OmiTuPHw6hRcmyacrMfNDwOvF7qiaOSVO7jJ3DrrdEdqFJKdWJ1ddLGCGQhsLxcjsNhKC0KNl44ii9JoerwpotaDAO+853G01gamFk3t/F89273XGBMjGSSWL74ouW31bTRgxPtagT/AnoBywzDWGUYxm2R628Dm4GNwH+AHwOYplkK/AFYEfn3+8g1pZTqcvLz5abdUG/iMRtIo4JRrMFHqEsFhIYB55xjT0QnJ0NWD4O4VJkGriCNBcxg5Zs7YOnSKI5UKaU6L2e6qGGA1yvHFRXgqyxpXIqbzFJp+nfiie0zsCuucJ3O3vYQ1AUaz5sWl3E2qV+9uuXWEs6ehZs2SdCrWtfuAaFpmotN0zwjcuwzTXOIaZpjI/9+H7lumqZ5XeSxMaZpfuZ4/WOmaQ6N/Hu8vcevlFLtIRyWG10gAA11drroSNZCbq57+rMLiI+Hiy+W/SyGAT16QN/B8eD1UUsi9cTwN35B+OZft9x8Siml1D4500UDdryF12PiiRSTgcj+wSuvlD/G7WHwYJg6tfH0KL6kT71dTebdd6UXr2XsWHtowaD757IkJUGfPnIcCMAu3WC2T9FeIVRKKdWCbdskVbSmBsLBMHHU2QHh7NnRHt5h0a+fXSenf38wMUjpIR3sK0hjHSOY+1EqvKM7BZRS6mA400VDISm2YinbWSXd6oFsihhmbILvfa99B+hIG/VgMrvkGUAm/yorYdky+6lpaa5th5o22gY0IFRKqQ4oP19mPuvqTAiFSKKadMpl/+Csrtt+dcoUGDZMUplyciApKwHTF0M1yQTx8gDXUXPz7zX/RymlDkJBgdxTwE4VBYkD/dvtMpyTWYoxexb0bdbV7fC68EJXtZhZJU9DVXXjedO0UWe10VWrWk4c0YDwwGlAqJRSHVB+vqS5BOvCgElPCsllA774mPbb1xEFhgHnny8lw3NypIBASo84whhUkkoJWTz+5dHSyV4ppdQBcaZVOvfcxXiCeMvt5cIpLIGrrmrHkUWkp8PZZzeeDmYLw0P2oD/8EKqq7KePG2cfV1RI26KmBgyQewjAzp3uNFnlpgGhUkp1QM79gz6CZFEi6aInnggJCdEe3mGVlCTVzuPj5YaemB6HGROLn1TCGDzDZey+5Z/2dLdSSqlW1dfD+vVybJp2M3qAmk17GivNeAkxsccWOPPMKIwSV9oowGm7HoFIE4L6enj/ffuxfv0gK8s+b6n9hM8nE4sgSSUtBY1KaEColFIdTF2dpPcEAhAOmSRQSzJVEhB24XRRp8GDJfYdOlRmeJOz4gjixU8K9cTyj81nwH//G+1hKqVUh+dMF42JsSuNhkKwe72dljmWVSR/5zyIjY3CKIFTTpGu8tZp7Wt4Ksobz51po4bhThtdubLlt9S00QOjAaFSSnUw69ZJMZlggwnhEGmUk0Cgy+8fbGr6dMjLk0pxaVmxmDHxVJCGCSzkZL649eXGQghKqY7LNOHLL2H+fPD7oz2a7seZLupMrIitq8R05GFGLV3UEhMDc+Y0nmZTzISgXU3m889h71776c6AcNs2d6EciwaEB0YDQqWU6mAa9w8G5M7dkyKGsQHfwH4wfHiUR9d+PB646CIYPVpmgzN6xVJLAtUkAfC3wssJ3/9glEeplNqXDRvg97+HO++Ef/0L7r5bO8e0J2e6KLgDKrNJhDTlqGoYNaqdRtaKpmmjO/4NQek5YZruItMjR7rq0LSYNtqjB6SmynFZGZRq9/IWaUColFIdzNdfR/YP1ocxgD7sIY81sjrYXn2hOojUVLjmGtkrkpzuIybORzFZmEABw5n7h5VSk1wp1aF88w3cd58Eg/n5kvmwaRPMmwdvvhnt0XUfGzbYPfwSEhxJFeEw3xTYfzt7UsjgH3eADJSjj3YFpdPDC4irLGo8d6aNxsTAmDH2eUtpo4ahq4QHQgNCpZTqYD77TNJ6wkGTBGpIINCt9g82NWKEVB4F6NE3lhqSqSYRgPv936Hmwf9Gb3BKKRe/H556Cm6+GVaskH1qW7fa+9YCAVktnD9f60K1h/x8+9j63wAgruwbiuuSG8+nxnyCccnF7TiyVhiGa5UwkVqm1cxrPN+40e6nCO600dWr3RVULRoQ7p8GhEop1YGUlsL27RCqDwFhMignlnpyvDvgpJOiPbyo+dGPoHdviEv0kZIYZi+9MYFSMln47N79vl4pdXjV18PcufCLX8C770rwYZqwY0fzVZqqKgkaH3pI2gGow6OhwZ0u6qwuam7bjjPf5MTpXju3Mtouu8yVDXPa3sdc+8Xn2fEhY8faTw0G3QGwZcgQ+zmbN7sDYyU0IFRKqQ7E2j/YENk/mE0huazHN3VSx7lZR0FMDFx/vTRUzuwTS4B4SskEYOnqNHeDKqVUuzFNWLIEbroJ/vc/d52nigopCjVjhqT2zZwJGRnyWEEB7NoFDz8M772nq4WHw4YNEqiD3D7KrYKdpsnOLfWNz0vBz8SrRrf/AFvTt6/80kQcyydkVNszB/PnSxsJkJ9ryBD7pS2ljSYmwhFHyHFdnU5CtEQDQqWU6kA+/VRmdYMNJgYmvdjbrdNFnU47TWrq+BJiiTMaKCWTAHEsD08gtGBRtIenVLezejX89rdSLMZZ4dHjgaOOkq1gw4fLRM6MGXDDDTBokPwLhSR9zzSl6biuFrY952qZFUABUFlJcW1i4+k0z0fEzJ5Bh+JIG/UR4pSy5wGpRlRYKBVHLc600VWrWi5apGmj+6YBoVJKdSBLl0I4bBIOhYmlodv1H9wXqyJ5VhYkJpg0EEspmVSSwurnvor28JTqNnbtgr/+Ff78Zyn373TMMfCb30jAFxMj10aMgOOPh4EDYfJkSE+Xa6WlkhEB8iH/4Ycl3VRXC7+9hgZZhQVJlywuth8zdu10pYvOOKa042WgnHsuJCU1np5W+TxU2j1LnGmjzoCwosK9x9CiAeG+aUColFIdRDgsM+7BWvk0lEY5cdQzuFeNTLcrZsyAnBxIz/RiArUk0EAMSxYGtJa9UodJfb3sbS4pgUcfhVtukb6CTkOGSCD4k5/A4sV2FndmphSFsvZwXXAB+Hzyr29fCQ6TI7VNTBM++ggefFBXC7+tjRvtdNGMDKn6atm92c7rTcHPxEuHtfPoDkBSkvyyROSxhgEBe0PkwoV2AZl+/aBXL/ulK1Y0f7v+/SE2Vo537dIWtk1pQKiUcgmHpcrlCy/Ali3RHk33smGDVOgL1ln7B4sYTgHeWTO7XbuJ1iQnw7Rp0HtwIh7C1BFHgHiWluTqtK9Sh8HGjXD22TB9uqzEPPmkuyhHdjZcdx3cfrukh777rgSPYK/qx8fbz+/RQ/YSWtavl8/9Rx5pXysqktXCd97R1cJD5WxG71Tvr6Os3D6fxmJizj6tfQZ1sBxpowYwe+/jEJZfvupqmTwAuT1OnGi/7NNPm88Per0weLAcm6YUl1E2DQiVUo2sDf6vvy698J54Qv9otqcFC+RGFWww8RImkzJNF23B7NmQmuElMSaIiYGfZNYyktJXFkd7aEp1Kdu3ww9/KIU6ysvlQ3h+vqwA7t4tgdxdd8GkSfKhPD9f0t4tZ50l1YGbOussKfQBMgk5dy5ceCFceql7tfDjj2W1cMeOw/6jdinBoPR9tDibsRvf7HGli87M2SRpFx3RtGmytBcxu/516S4f4exJ6AwIS0ul52VTzrTRltJKuzMNCJVSBALSKPjf/5ag0BIKwbPPwp490Rtbd7JsGYSDIcImeAmRTjkjWeeeTlf07CkZtEnJ8rGmlkRMDJa/vGs/r1RKHai9e+HHP5ZJQauxOUjgFxcnH7r/+U9pH1FdLXsAX33Vft7EidISoCXJyXDmmfb5Z5/JB/SRI+H//s+dIV9UBP/5j6wWOsehWrdxo51OmZ3t3ue5d7NdkTkFPxMuGNjOozsIHg9cfnnjaT92cWTdZ43nS5bYlVMHDpSf1dJS2mjTfYS6y8CmAaFS3Zhpyj6Qe+91p1gkJMi+D5CbypNPuibl1GEQDsvserBWPvEkUkUqleRMzJYqKspl4kTo0UcqVtQTSx0xLFmZaFeoUEodstJSuPZaWSH0R+p4xMTIql7fvnJ/8Hrlw/gDD0gF4Ouvh8pKeW6/frKSvy+nnGLfZwCef17uQQkJsvJ42WW6WnionOmiPp99b6+pClNRYufgTmcRMeec3s6jO0hXXOE6nb3nscbNkaGQZNbAgaWNZmbKnlWQ4jPOyrjdnQaESnVThYXw2GPw0ksyu2sZN05Kg191lV10rKpK0kedz1Nta9MmmQkP1oXwYJJJObmsxzv7lGgPrUMaNw4yjkggzmjAxKCKFJYFxxP+8ONoD02pTq2yUvYEbtsmgaFpSjGO6dNlf+DFF9vVQ8FuPv/RR9KHcNUqCfZ8vn1/n9hYKTZjWb/e3UNuxAhZLXSuMhYXy2phS83HlQgGYe1a+9w5mWsWF+MJ2wHhjLTP4Nhj23F0h2DkSJgwofF0Ju/iLbNLpraWNlpc3LwOgmFotdHWaECoVDdTXy9NgB94ALZuta/36gVXX21Xek5Lg+9+V2ZrQWbSnnrKrlqm2tbChdJuIhh0povq/sHW9OkDQ4YYJMZLc60qkqkklTXProryyJTqvGpqJAjbsEGqMNbWSmA3caLU9xg5En79a9lnPmeOpI5WV9sVG4NBua9cdpnsLXRWtmzJ1Kmy4mj53//cBWsSEiRovOwySEmRa6Ypew6tlEjltmmT/d+mVy930FO82W7bkEolE87sLUu9HZ2juEw6FUypeRerJ+FXX9lbXXJy3Ak1n37a/K00IGyZBoRKdSNr18J990kTYKtJbWysxBzXXis5+E49e0r6vjXTu2sXPPec+4at2sayZRCuayCMgccKCFN3u2ZGldsJJ0BKunyYCZBACIOl7+kytlKHor4efv5zWX0zTZkE9HrlT9CIEe6tzD17wi9+IROLOTn2imFKigSJ9fVSqfqcc+APf2g9zdPjkRVHy+7dcn9qasQIaWdhtRZwVphUbs500fh4u0qr3w/+YjulvkNXF23qkktcS86zS5+R2YsIqydh07TRFSuap40OHmwX7d6yRT/PWDQgVKobKCuDZ56RAjEVFfb1UaMkPXTKlNYnCQcMkBu29Qd040Z47TXdjN2Wysrkv2swEMTAxEuIbArJOTW3c8zeRsn48ZDVPwEPYUJ4qCaJJbsHaQMzpQ5SMAi/+pUUdwG5T4TD0mQ+I8M9MWjx+6XQy/jx8nn99NPhiCOav+/rr8sq329/23LV6rFjJeCzvPJKy6t/CQnufYnOgiJKhELudFHn/T5UUYW33m6+N8O7WHJ7O4MePeQXLOIEPiSxwq529/bb9mcSZ0BYWOguqAPye9SvnxzX1+ueVIsGhEp1YcEgfPCBVIJzlqDOzJQMjEsusfcJ7suIEdKHyrJqlewlUW2joMDeP+glTCp+8liL97RToz20Dm3oUOjdN4ZEnxTi8ZPKGvIof21xdAemVCcSDsNtt9krbsGgBBJHHy2fw8eNgzG+tbJn4IUX4J13CC1Zzv/u3UPVHj/U19Ont8n998Nbb0nKqbNYjPU95s2Diy6SLBXnhKJhyL3IUl4O8+e3PNYhQ6TXoTXO995ru/8OXcGmTXZdrT59ZF+mpWSLHR2mUsnEExMO7ANAR+FIG42jnhnlL4EpqU7bt9uB8JAh7t+//aWNavsJoQGhUl3U5s2SzrNggV2q2+uVwgDXXw/Dhh3c+x1zDJx8sn3+8cfuflPq0H3+OfgrwgTDjnRR1sKpGhDui8cDxx8PiUmyfF1ttZ94Ydt+XqmUAgnM7rjDPcFXVgZjxkh6pq+8iMvmXQ55efKB/OKLYdYs3p36O7bd9gj8415i7vojc27sR3zfLBJHD+Y7fz+aNwMzuYm76LnnS/m0vmuXbCgsLeHJx4Pcf797HEOGuFd25s61q5s2deqp8v99kP1jmhBgc6aLJifbWZWVlVBdZK8OTmMxvrM7eHXRpk4/XZarI2bVvAIVlY3nVnEZw3DvtGip2qjuI2xOA0KlupjqanjxRXj8camyZRk6VPZgnHSSu0LcwTjxRPcf2nnz5IasDl1dnaRphevqCOPBS4g0yskbYcoUr9qnE06AtCz5hW4gljpiWfppjL1xRinVItOEv/9dtgBYAgEYNAj6xhXD++9z+txr6fneM67X5TOKpUxuPD+LN+gd3i0lSbdsgVWriPtoARd9/ite3z2e3xT9H/2+WQG7dsrjX+fzxD3FPP6Y+1P6hRfaGfKBgHtcTtnZze9DuoWhebpold1ukEBVAzE1dn7tDBa4G0F2BnFxrg2n4/mM7Cq7jOg779h/9p2TC3v3Nk8L7ddP3g6kz7JWUNeAUKkuJRSCO++ERx6RVJFgUDb5X3yxTO5+23Z2hgFnnCGTxZZXXpE0FXVoNm6UG1awNoiXMAbQi0IGnTkm2kPrFMaMgeyBCcQiy+CVpLKs7mjCy1vIE1JKNfrPf2RfucU0YXB6KQM2LIT588jYnc+ZvOl6TRE9eJVzG88nsIKxfNnq94ghyDm8zsuczxU8JRdDUor0gRvW88K9uxuf27u3ZLBYFi6UPWAtmT5dCqaALEA6V8a6qy1b7Gqvffq4t4mUb2uSLppXLdWAOhtH2qgHk1nFTzdGgWVldnrosGF2v0Fonjbq8ciqNMjvfUt7W7sbDQiV6kJeeQXefFMqta1dC19/Lfv/hg+3i8J8Wx6PzOQOGiTnoZB8qNi9e58vU60oKIDCQpNgfRgvIXwEOYbPdf/gAYqNhaPHeUiKl1JxVSRTRgbrnv0iyiNTquN65hl4+GHHhSo/UwtfIW3JW7BH/pjP4TnisPsM1Y07jueOvJP6QcOhzxH061nPadmf2Ust++AlzP9xHxfwkut73vXzPbx92TONVWTOOccO9EIhyXZpSVKSZKxYnKtD3ZWzN2NGht1/sLISaorsipzTWIzvzNl0SpMmufI9Z4fehLLSxnNNGz10GhAq1UXs3Qv332+3kxgwQG4KL74o5cEXLWq78so+n/SFskqA19fDk09KxpA6cOFwpKDMrgaCePEQIo0K8uK3wOTJ+38DBcje1sQUKYHY2H5iXsV+XqVU9/Tqq5IqCkCVH9YXcE7Bn6nbubfxObmsZxLL5WTyZMz57/DajUsoOutquPxyEn/yfS5Z/wd8hbslvzMQkJvQ+vWSA79wocxQPv443Hsv/O53GNdey03x/2Q28+zBmCb/79lhLBr2A/jgA9LS4DRHJ4Tly5s3F7dMmmRvKSsvl9Y93VXTdNFae7sg/sowsVUljeczea/zpYtaDMO1SjiMDQyptvetLFpk75t0po3u2dN80rppQNjd0441IFSqC7AKA1gBWWqqO12irAweewxuukkKwVhB47cRHy9/l9PS5Ly6Gp54wr1vQe3brl1ykwr46wEDD6YUlJmaJUtf6oBMngzpfeLxECaMQRXJLN16hHsTrVKKd9+FO+4wwV8ps1EFBZzpf5a+7KKaZAAMTL7Dk9RPOYndz3/Ilw98zOu1p5C/WtJMDEOqhVp/+wFZJezZU3L1jjlGNqufey5873vS2+i22+DBB/Gs/prbZy7jRD5ofGkYD7/e8SM+mXYTXHUVsyeWuN77+edb/rDu87nrbn3wQffdC7Z1qx0INU0X9e+pwgjLbHAqlUzI2iLRdGd1+eWNhwZwWslTUCelVevqYPFieSw31/07+skn7rfJyLCrkVZWSqXv7kwDQqW6gHfflZshSErntGkSII4b535eYSE89BDceqtUtvy2M2KpqfDd70pfH5CA9KmnWu4hpZpzt5uQG3Y2hQw69+goj6xzSUuD4aNjSfDa7SfyGUXl64uiPDKlOo4PPzD57Q0VmOsKZCWvys9JLORcXuF1zqaIHuykH77eWfzvB+/zx2kLeCj/eF562eDzz+33Oflke//VQRs8GN87b3HnU/2ZmGDnODYQwy/4G18+/jnxY0dwbvJ7gNyg1qxxp0M65eXBwIFyXFcH779/iOPq5Jz/fXr1khUxkECnttiOkqezCN/pp3bu/rY5OVJNLGIW86HEXgG10kY9HumRadlf+4nunjaqAaFSnZzfD3/9q50O2r+/VBMdMAB+9jO4/XZpQO+0c2djFg/5+d8uMMzOhiuusCuX7t4Nzz3XdumpXdm6dVC4J0gwaOKJBIQTWIF3didpFtyBTJ0KSYlyXEMSITwsf35rVMekVIdgmiy55xN+fvo6/Ot2UlllUEoGyVSRQC03cB+bGMKupOFUDhtPjytOx99zSIsbz0ePdn0WPzSGQezlF/HXDWczJtfeoxggnhv4BwXFmUz7yyx6f/iiRDS0vkpoGO5m9StWtF6IpqsKhyVotlh9CEGyg+L8drA0gwVSGa6zc6SN9qKQY/wfYE0gfPqpnRziTBu1MnKcNCC0aUCoVCd3113S3gkgMRF++EOp1mYZOhRuvhluucX9xw+kOuhf/iKVSb9Nc9b+/aWSqdUbatMm2T7S3XPy96W8XLbcFG2tJoQXD2HiCTCh7zeds/pblJ16KiRmSJptEB8B4li6zGib/GilOimzNsC/xj7EnF/0YVd1GmVk4CeFdCo4jmXsYADFSQNh8BDIGcyICSmNNWKSk6V42PjxMGsWXHmlpIq2VYGyxL4Z/GPFZIadPLCxkkwVyVzP/eygPxdtv1saEn79Ndu3hlrte9u3Lxx1VOTnNVtvat9VOdNFe/d2N6OvKg5g1EuEmEolE3yrukZ/2wsusKsPAadV/a9xv0o4LFtYQQrqpaTYL2u6Sjh4sP25ZevW7l2YSANCpTqx5cvlfglyk5482b0h3ykvT7Zx/PznEsA5rV0Lv/893HOPlPA+FMOHw9ln2+dffSWV31TLCgrk5lNUZGIgeyHSKWfEjH7RHlqnlJMD/YdJ+wkTqCSNpdVHEl6ljTJV9/XOd57hz1/NpgFf47VsipnJuxg5g1iTdyHxIweT1ieJ0aPl/vDDH8q2gl/9Cr7/ffm7PmWKfHhuq2DQkpoKD7yQzYBT8+CIvmAYlJHBj3mQvuxkaLgAvlwFc9/ixXt30dDQ8vvMnCl7CkEmN7/NBGdn40wX7d/fbqFQWQmBEntT/3QW4Zs2Vf6jd3ZpaVKSNmI6i/CV2kvD1mcPr3ffaaNxcfbnoYaGQ//80xVoQKhUJxUIwB//aM9o9e4tKaL72hpgGHD00fCnP8F117lXEgFWrpQPAg88YO9BOBjjxsGMGfb5kiXdu/LbvqxbByUlJg2BcGO6aDZFDLpwwn5eqVpiGDDhWA+JcXb7iVIy2fDsiiiPTKno2L6yhPte6UsdsuQXSz2D2czd4//H9/83i+G3z2Ho0SmMGCETKr/9rdSD6dfPtfhy2GVmwoP/8tBrbB/Z35CSSiE9uY4HOZXIJ/vKCkpeep/3zvxHi+Ws09Ikbdwyf373SA5omi7qDJiLiyGhugumi1ocaaOp+Dmu3P4f/auvJAMH3GmjO3bYGVUWTRsVGhAq1Undfz9s2ybHcXFw1VWyb/BAGIYUGfvzn+Hqq5s3rF++XGaHn3vu4G+qJ5wAxx5rn7/zzqEFl11ZXZ2UUi/aXEXQ9DQWlBnr/RrvSSfu59WqNSefDEkpMiNSTyz1xLBkblmUR6VU+6uuhmdu+IR14VwA4gkwyLeb199J5NQVfyJj+lgWL7ZX/CZOlCySaOndWwqeZfaJh9xhkJPDDl8Of+dnjMSOeN54J47qEce02KDw+OMlzRVkH6GzEE5XtW2bXVm1Vy/3yqi/PIhR7Qci6aKs6LztJloyc6bd+wo4pWGu7MWIeO89+TpypP17Ac1XCTUgFBoQKtUJrV0rm+wtxxwD559/FZMnqQAAIABJREFU8O/j9Upz37vvlkrOzkwS05RqXffdJ30GD5RhSNrq8OFybjUXbi3VpzvatEn+uxRu8mNiRFJGTU4YXWaXbFUH7fjjIb1PHB5MwnioJoll67Ok8pJS3UQ4DC88UsmXS6upJR4fITIo45zTG+hxipSefvZZO7skNhbmzInigCMGDJDslJQUAzKzYNRoNvU4lpWMIxT5uFpNEm8WHSubGa+4AirsfqOxsRIjWBYu7PoVr53pooMH270IKyuhvqxJddG84fKkrsJqiBxxIh8QW2b30nz3Xfnq9cpnJEvTgPCII+wV8T17um/rLA0IlepkQiGpHGrd6LKypPG8VeXzUMTEyD7zv/0NLrxQitNYPv9cis4czGdqj0daUCUlyXlRkT1bp2T/IMA39r2LZPyMPUP3D34bMTFw5Ph4Ejzyfw4/KXxpjsH/1odRHplS7WfRItj0/KesCQ3HADIoxevzctFfJXdu9WrpHW854wzo0SM6Y21q2DCZhExIQD7wDxzEluGz2JUwjHDkI+s7nEoJmfD003DkkXbPJWDsWHsrRHU1fNiF/6/fNF00HLYzevbuhcSAnVrbqZvR74sjbTSRWqZWvNU4+7xmjVRUB3fa6LZt7kq0Ho+7jcqmTYdzwB2XBoRKdTKPPWbPAsbEyCRpbm7bvHd8PJx1lqSSOtNPN26UFhV797b+2qaSkiQotCxb1r3TMSymKQFhrb+B8trYxnTRHhQz8JLjojy6zm/KFHtCo5Z4Gojh02f1F091DwUFsPitaopWbKOIHqRRTiwNTJ1i0ndoAqGQ9Iq19OgBp58evfG2ZMwYmZxsnORMTqFi2HhWZc8kbHgJ4uNhfkAt8VIFZPp0uOkmqKvD43G3oVi61JVF2KWsX2+vZvXs6Q5kqvxhPJXyg6dSyXg+61r7By1HHSWTAhGnmPNde0ytiehRo+wJapD2JE6aNqoBoVKdyrZt8Mgj9vmoUa6MiTaTkQG/+Y30nLLs3StB4cHMng0f7q7w9cordnns7mrXLpm5LlpdiIkHT6R30pjELXhHjYjy6Dq/GTMgOUM+SYbxUUMCSz8KaQ8U1eWVl8PLLwPLlrE6lEsiNSRSA74YLv7dSAAWLJC/QZZLL5VUy45m4kSZmLRaAvhiPNQm9+TLwedhpmWwhjz+xK2UkS7/3777btm8np/P4MEwIvKnNBi0Uwe7gvJyWfV84AF45hn7em6uFFKBSLpoZaCxGfBJvI8vKx2O66ITjo5Vwql8TEKZ/QtuBYRerxS9s3zyifstmgaE3fF2oQGhUp2EacL/+392QJWaCjfeePiqwSUkwC9/KfuyLH4/3HEHfPHFgb/P7NlSRc56/RtvdM8/tpZ16+Rr4YYKwtg13KeMD7R9TfduaMAAyMmT9hNhDKpIZln5CMz13agOvep2gkEpAlZbXE3tinx20o90KjCAgXlJTDw+Hr9fJuUseXnuCbuO5sQTZRLS+rOYng6lNfHkDzwNc0Qe2xjI77id3fSRJ3z5pWwWu+ceTp0Zbgwmv/5aqkt2Vn6/ZNg8/LCsnL73nrtSptcrQb2113/PHkiss1fJZrBANvbvqwR5Z3bppY0zB/HUcXz1fKiVD0rr10t/QXCnjW7ZYjevB/ndstKmq6oOLhuqq2jXgNAwDK9hGCsNw5gbOc8xDOMTwzA2GobxP8MwYiPX4yLnGyOPD3K8xy2R6wWGYXSB7ppKHZiXXrL3fXg8sqfekSlxWHi9cM017tTP+nq4916ZaW5NeTk8/risMn79texLtG7Oq1fLfbu7svYP7t5jB38+gky/uFcrr1AHwzBgwiQfibFSMaOaRL6hFxuf0v4nqut6+23YvRtYtowNoUGRYNCEmBguvnEAHo8U97ImFD0e2W7Q0eegZs+Gm2+WY49H9geWlHqYV3gM72VcxKveC5jBAn7Iv7iLG3m0/nJe+cXH5M/6JT1jSqmslC1lb73VuSYia2tl//7jj8vi59tvNw9qk5IkyPnRj9zVRSsrwRdJF02jQtJFu+L+QUufPnDKKY2np/CuFC6IsFaIR49210fQaqNuvv0/pU3dAKwFrFqGfwH+bprm84Zh/Av4PvBQ5GuZaZpDDcO4JPK8iw3DyAMuAUYBRwALDMPINU0z1M4/h1LtqqQE/vEP+3zYMGkY3B4MA847T4rXPPaYbFo3TXjiCZlhu/hi+0PFrl2SxvL663bRmw8+kFnpadPg/ffl2ty5MHCgpKZ2JxUVMrNrlpVTWJ+GB6kAkEkpgy6ZFOXRdR3Tp8PT93soL4EQMQRIYNmbxQz7Y7RHplTbW7UqsiequprQii8oZjI+ZEIkcUAPzjgv9v+zd97xUZVZH//eKZlk0nsBkpDQQXoXpSPoKlZ0UbGtrmVddXd1d33fXVdd17K6vupr3dXXCtjQdW10QUGa9JIQCC0kJCG9TcrMff84M3NnIDQNmZTn+/nkw9yZO5MTIPe55zm/8zvs2wfffGO8Z8oUmTfYHrjiCqnavPCCJIUJCbImVlXZaIxIobomko8briCeIkJxZ7ybwLXlIIWRwbhsdiwWqaCmpclalp4um6rJyQH90fxoaBB/gG3bJCFxNnNnGxwsld1zzhHDUJNJztu0SV6vrISmugaodwBud1GL5pcwdUhuukmGTwJjWU1oyUFqUrqAxcKiRbKxbbHIHOZVq+Qt69ZJ4dRDjx4ycgvk7993rmVnoNUqhJqmdQUuAv7lPtaAScBH7lPeAi51P57pPsb9+mT3+TOB+bqu1+u6vg/YA/gUgRWKjslf/mK4a9vtIhX1navjS02N6ON9XbRagvHjxc3UV6L6xRfw0kvSu/DHP0ol8YMP/K2+6+pkZ3r8eOMGpL5eel06w+BgXzzVwcodh2jC6hWM9oktxhwTGbC4OhqDB0NyWhAaOk5M1GBn1Y4ocDgCHZpC0aIUFooMH4DvVxPqrKAe90XaauXimxMICYG33zYqZOHhssnXnrjhBpm1C7IBGRvr3lDUTBAWjh4aTpGWRCXG7CSTq4nwsgNQXkZTo4u9e0Wh8u23Yqxz9dWBX4eamsQN8/33pWfyo49knfBNBq1WSQBnz5b5wJddJsmLR3WTnW2YyxQUQGij4aIzlcWy+EZ28PXlssu8NxhBNDLBtQyOSpVw/36j4ucrG927VzYWPKSnG5vbhw51vvuT1pSM/g/wAOD5K44FynVdd0/CIQ/o4n7cBTgE4H69wn2+9/lm3qNQdEgWLzZctTVNlB++g989NDTIInfxxXDXXbLzNWeOSE48GvrToqhINCpz5kgm56OzGThQZKCetaW4WOSjM2bI5tyJLqAffyyynSuvNJzjDhyA7747g7g6AN7+wd3lOH36B0cOUyKHliQyEnoPsWPX6tHRqCGUTc4B1CxaFejQFIoWo75eql6NjUBNNWk/fEIOPrq3pCSuvs7K6tX+ErirrvJ3XGwv3HEHPPusFIMuu0wcsUeNkk1Ss90GkZGUWBIpJQbPqhVKDRZHNRQX46yr95sxV1srI5Xuussttz0DamqMgfA/hupq+PRTSQLnzZN5gr6zes1mMca56iqRzM6aJQPWLc3o+n74wXhcVgbWqjKgk8hFPVitcPfd3sNpLJJ7GV1uSjzmMuec47+p7es2arMZI0saGvxUp52CVpGMapr2M6BI1/UfNE2b0Arf7zbgNoBUX+98haKdUV0tC5YnJ0tNhV/9yv8cl0v6C15++fhG6J075evFF2X3a+JE+erb95jeEV0X67JXXjGyN5AM8xe/kA9wW9GlpIhZ2aOP+l8wCwrkYmqxyO5taqohY6mogK++gksvlUT13/+W55ctk53OlJQW+etq0zQ0QG4u4HRy+IgJfBLCqXPakG6pgzBunMai+To1NdBAELXYWf/uD0y4ZHKgQ1MofjK6LlJ8T4UjdP0KBjeu5RXcZTSrlTEXxRIUJEPoPaSlScGoPaJpYnLma3QGkkw99xzU1Jipr4+gIesoPbJWM871DRVEsYu+rHaNwVEaQr2Wgi0mkfpGox6yfr1UC+++WzYtTScplRw4IMoYj0vlpElSbQ0PP/2fIzsbPvnk+IRS06B7d9l47dfPPYvxFOi6kRBWVoKryQnVMjR4Essw4+qY4yaa49ZbxYWotpaRrCOisYTKsjKIiWXRItlQsFrFbXT1annLunUwfbrxEV27yr0MSJUwsRO19rdWD+G5wCWapl0IBCM9hM8BUZqmWdxVwK6Axyv2MNANyNM0zQJEAiU+z3vwfY8XXddfA14DGD58eDtqI1Yo/Hn8cSPpCg4WyWZUlBzrulzUXnjh9Bqg9++XauH//Z/0YEyYABOHVzF065uYX3vZGG54LP/6F+TkUPPWRyxYGce8ebLxFhIiMXlUeI2N4ob2hz+IvKe0VHZwPVXDuXNh5kwxgcvOlmqZ0ykSGc+FuiOzd69bBpR3iFJXpDcdDDU5GDKrhQZJKryMGAFxCSaK94ELE7XYWb2ikQmBDkyhaAFWrzaGkms11Vy9/ne8zSzjhKQkJl9g4bHHJFHwMGfOyROe9siAAaJcefppKC/XsA/N5GjGHLI3wL1H/kAIdbzBzewnHUrgHHsFey/7HR+vSvJ+Rl0dPPWUmKX9+c/+/ZW6Ln/Xn38uyacvS5ZIT9rMmXDBBc1X8Dw0NsLChcePPEhNlcrVgAEnbgU5Efv3G5sCBQVgb6ryvjaFJbL76zt1vSMTHQ033ggvvYSVJiaxjE8LkyAmhrw8jV27JNEeMcJICHNypKrq8TPo1s2oGh461LZdeFuaVrks6Lr+R13Xu+q6no6YwizTdf1aYDlwpfu0GwB33YDP3Me4X1+m67rufv4atwtpd6AncIxPkELRMVi3ThYgD5MmSRIHsjjdfjvcc8/xyaDFIjuWkyadeCRF0b4aPnhqP3dMyWHaff14eNdVrOQ86jl+IFUxcTy/YiAX9tnLc0/UeXsTzWapCIaGyliJYcOkcrh2rSR7SUkSg4fcXPmZNE0qhR7JUnFxx5oTdSI8ctGmnH2UEuN9PjO+ArO1g92htQEyMsRu30ojLszSR1jUA/1gO/afVyiQKpXvNXPK4beIqj/CQtzG61Yrsb3iWLTIfyj7RRfJvLqOSFoaPPSQj9okKopdE+/i0VGfU0osM/hKXFeB7YciuPnlEbw87j1Skv1rBhs3wjXXSE9fY6OYjPzpTyLtPDYZ9FBXB/PnwwMPyBrXnJtpYaEIcHyTwYQEuPNOKWyNHn3mySD4y0VLSiCoRsZNdCq5qC/33ON9OI1FoguullKsRzY6cKDIQz34yka7+ZSc8vLOZqBtj9Z2GT2W3wPzNU37K7AJeN39/OvAO5qm7QFKkSQSXdd3aJr2AbATaALuUg6jio5IQ4Msbp7qWlKSGMnk5Yl680QjH6ZPlwXGsyjW18uCtnw5rFzupPJAqWRgPtPhK4jkP1zMf7iYEOoYw/dMTNlNGgf4MH8sXzGDJizgALJ2yZ12ZBSaJgnfdddJgvrFF8b3fOYZMQCYPds/1rlzpecjNFR6QN59VxbPFStkrmJUlNzAeL4qKiTBvfhi6NKOu4V1XeYhAZTsLqHR59I7dGgb931vp4SEwKDhQXy/qJKKRiv1BJNHF/a9t5qMP14d6PAUih9FdbUkK561oU9SOec9fT9vcjUN7g29+rgUnJipMopFXHSRyCI7MnFxkrz9z/+4DbzMZvJ6TuLhLpu5f82VDM7fzCaGoKPxVeNkbnjuOuZPfp//nf4uH3xtmNHU1srn/PWv4uh9bL9lVJRUA0tKpO3B829RXCyKnZ49Ze3r0UOu/WvWSALf1GR8xsiRsl7/VGWMZxRVRQW4nDpapbjPeeWinS0h7NVLJLKff84wfiCGUkoLCyEsjMWL4de/lu6XIUMMR9H16w0T1thYWTvq6kQJ5XCcvVnPbY1WTwh1Xf8G+Mb9OJdmXEJ1XXcAV53g/Y8Bj529CBWKwPPss8bulNUqydUbb0h7X3NW1CNHyoWuTx//5202GB+3g/Elr+Dc9C4bq3qwnIl8wwSKSDjuc+qiUliWcDvLwsNl9arM9fYjAOByEbRnJz+b7uS6V8aRmibJzMCBshh7nOxcLlGaXnKJyGE88tDPPxcpjsUiC9iWLbLb7XJJ4ti7d/OSm7174ckn26/U6fBhtwtcVRVlpS50jAHBE2Z3ggbKADF6NMyLgIoSj2w0lNWfFJLxx0BHplCcOS6XuDh7Er3oaLg8+3Fcjno+cout6i2hFLvi6B9nvG/mTBnd0NZnDrYEYWHixPnKK8acuTJ7Vx6dupJfHPkr2xc20oiVvWTyCZdx7tJVPLA5g8kPfsyflownO9vdi+dO8goLJcdIT5dNyQsvhHPPNdapqVOlOujplweRIT78sCQdwcFGTxqIAc5llx2/Vv8YjhyRtcXz2K7Vem8QprJYpDujO+E4o3vvhc8/x4yLySzlw/IYaKjnyBEb27bJ/cqIEUZCmJ0tG9BRUfI70rWrMdfx8OHOo7gNdIVQoVAcw86dssCALEoRETLaoa7u+HN795ZE8DjXUc9ch1deEY9twAyMYAMj2MD9/J1d9GU5E1kechH7owdLRmf1kYxarNCrJxw8CEePEkEls/iAWXxAzNdl8Jcb5fPd2ospU2T9efFFqXCC2KFXVPib3cybB/37y+OwMEl46+tFnpOXJ9KfY29cjhyR5HHIkB/1VxpwNm50P8jN5SjGnZrZojHx0g5uBx5AevWC7j0tHCrRcWKWPsItdq5rajp5s49C0QZZuhT27ZPHFgv8fHIRIWNeYBnjKSSRemwcsaXTNVnzVp4uv1wSkM6E1Srma++9Jz17AHXOIF5KeoRhN22kaO5SqHewiSFsYggJJUXU/vYL4noGURg+kvJyY8PO6ZS/87g4Ud+kpfl/r5QU+M1vZJzF3LmyXIIkle+8I2t4ZqZci/r0kcT8TAxomsPhkITFd65kURHE1olcNIpyhvEDXDi7c17nJk2Spsxt25jKYj7kKvkL6tqNRYskIRw0SCqFDQ2yib1hg9zDgMhGPQnhwYOdJyFsp/vtCkXHxOWS5vjGRkmk8vNFlnJsMpiSInKWd945JhlsaJAXunaFa6/1JoPHomka/Wakc9dn0/mochofrUrhrnuD6Nfv2BNNpIxJ4/4bivlCu5jbeZUYxNKaN9+EyZP9Bh4OHQoPPui/4CUl+Usu8vIME1OzWSqIngSwslIW4O7dJfmLjTXe59H/tzeqqnwSwr17KcSwLesSW/+j+kYUp0dqKqSdE0EI9bgwUYeNDQ3nULti/anfrFC0IbKyxAjaw89+BslvPwl1dcznGhzYOKKl4LIFk54u58ya1fmSQQ+aJu0Ms2cbzzmdsKZ+KM5f3AapqZQTxQaG809u5V2uY1eOmcQ93zGyTwV2u1TzkpPlKy8Pfv5zSTKbG6/Uv784b994o5iU5OaKyMblkj7/7GxJNOz2M/9ZqqtlDZk3T1pJfvlLMcDxVEArKiSp0So6uVzUg6ZJlRAYzGbiKYbio+BysmSJ/JvYbDKv1oPqI1QVQoWiTfHPf8LmzZIENjZKMuXb/BwZCbfcItbYQcf6v6xfL9rSE3W+A8THywfcdptkXW7S02W20003STVvxQpZxIYPh8mTNczmGTD7E7nDcC86gNirjRwppcCBAwHZTXvoIfjHPyShNZmk7XD3btmsNJvl5/jZz0SiERUlVdEffpCfKThY5kJFR0s++9pr8q22bRPpTfJpTmjQdZF77NghefKUKadn493SfP+9W8XjctF130qOcq73tYFDzCd+o+InY7HA8BEmvnrPRW0tuDBTQSQb3vqO8yePCXR4CsVpUVYmgg8PQ4fCsC5H4OWXyaEHqxnLERLRQ0KJjdUIC5Pk5cILAxdzW2HGDFlLXn1VEjSTCQ5VRBJzyfVs/+IQpfvKvTMLHQRzuCaIzO+X8fg1QRwaMIMFn5i8JjENDdLOsXSprHHHVguLi8Ws+5xzZK3JyZFqZWqqJIJvvikbmz//uSyXJ5LwlpcbTtzZ2eJ2eTIKCiDcVg/1Yvk9hSVy8bvggh/999bumT0b/vhHTEVFTGUxc12z4ehRjpoS2bxZfodGjDCS6l27ZEM6IsLfr+DQIXey3Qnk1iohVCjaCA6HFPeOHpVju92wQrbZpOA3Z04zTmR1dbI6PfPMiSfDjx8vtqSXX95MJulPYqLkfccxbZqI7i++2N/a9MABGDtWtk5nzvR+xt/+JqMnQkNlIb3oIpGGglxkZ8ww1Cz9+8simJcn53z0keSto0aJDMczTHjJErj++pOGT1ERbN0qX2VlxvMVFbJj3Jo4HMaCQ34+5roqnJ7LrqZx7iWxJ3yvomXo0we6dXFRnIMhG13u4PxAB6ZQnAZNTVIZ8oz3SUpyj5X7/VNQV8cL/EqSQc0MwTbS0uQa6THJUEgbXWSkmM14/NRKy010PTeNpJ6hlHy7i4q6ILqQRwa5hOgOsueBOaOUn193MUvWR/kKYdi6VZK622+XNUXTxD104UL597JY5Lpz6aWSZHz/veE8eviwjMcYMEBylq5dZQM4K8tIAI8cOb2fq1s3aRs5fBj0I2In65WLnj9BfujOSnCwzLN6+GFJCJkNhUWQkMDChRpDh0qF0GqVzXePbHTSJEnm4+Mlwa+rk3+fuLhTf8v2jpKMKhRthKeeMpJBk0kqYWazSH4+/VT6F45LBr/7TsTwf//78clgZKQ0GO7YIc0G11xzymTwlPTpIyvf5GOGe9fUSKBPPOFd+cxmuaja7VIFvOgi4/SiInE+9WAywVVXGeEdPCg/WlAQTJxonLdypXFj5EtZmbz2v/8rLm8rVvgngyALbWvLP9atM5Lg9JIf2EF/72smq5kJk1WF8GyTmQkZA8Ox0oQLM3WE8F1eGnpRcaBDUyhOyddfG6YkNpskItYSqQ6uZjTvcw06JgixExKi8cADKhlsjr59Zb5gTIz/8/G947j3neEsve5NHuIRMsn1vubM3U/Z3//FoJDd9Owp13LfauHzz8tG7TPPiMu2x0XUbpdk79prJSd55BH5/r5s3w7/9V8yJeG++6SCuWLFiZNBk0muZRdeKD2LL78sm64jR7rnTFZIQtjp5aK+3HEHBAUxgO0kUwAN9VBezrJlotoJDpbbJw/ezVs6p2xUJYQKRRtA10VO4sFuF7XH++/LohEff8wbqqsl2Tv/fKP72ZcbbpAmhuee4/jGwJ9ITAx89ZVkqMf+EH/8o5Qxm8narrnG/3jevOM/dsYM43jpUpGcTppkyDUcDkkUQXrzvv9eFtJ//EOkOL7mNSA5cWqqcXyicR1ng8ZGic/DeQfeZSNDvcfhkRo9erRePJ2V5GRI7xuC3dKACw0XJnLJ4OC8VYEOTaE4KQ0N/nPmrrjCndA89RSbHH34A0/KSCBNg2Ab118vrpeK5unSBf7yF0mi+vWTzol//AMuvCKEsHdeZtCHf+L2qPe5hdfpyy6ZW1hXh2XB+/TY/QVjRjTS1CT7n7ou69G334qMdNMmSTIyM8XQxjcBTE+XpfG++6TC60HXj9+49OCpMs6cKa6pr74qsf/859Jf79kcXrIEcDZBlchopuBe5FRCKFKl2bPRcLuuAhQWUVZmjOsYMcI4fdcuw8HXNyE8lWS3o6AkowpFG+CTT/x3BkeOFFlJs7r1JUtkku3+/ce/1rWrNN35ZlZnA6tV7ET795fE1HcWxrvviqT0k0/8Vr+MDBlc70mStm6VXdIBA4y3Dhtm9E64XCIdveMOeX7DBtmBfecdqSDu39/8AODQUPnMgQPlol5bK4t+Q4OMr9i/H6/pwtlk82ZD6poUXk3G1gXs5Vnv6737B7XbMRrtCU2T/w+J0Y1UFHtko6Gs+qiAtHtO/X6FIlDs3WtUnbp3dycZBQVseHEtL3APubj7wENCSE7W+MMfAhZquyE6Gu6++wQvXnkl2qhRpM+ZQ/o38yghhu8Zw0aG0rhxI4kHDnLhJZex8XASO3b4L3sbN4q88Nprm3cR1TTpWxs4UGYXfvKJsT6AVH979pQksHdvSSxPNaNQ191ma5WVgG7IRfv06TzWmKfi3nvhzTeZxiLeZo6M0aqtZdEiO6NGSXJtsRgGQD/8ABMmyK2Uh86SEKrbEYWiDfDkk0ZyExQkkpDjksGKCkkEp05tPhn85S9FHnq2k0Ff7rxTJu56mh09rFkjW2++w5nwd3wD6Q/0RdOk78IzCLi4WIqRaWli/b1jhyy869b5J4PBwbLY3ngjPPCA9Nh43EtDQ/1HMS1Z0nwi2ZK4XP4Gr+fp37KJIdThdrUxmxk1vpNMu20DZGZCjz4WNHRc7j7CVRtsJ+65VSjaAFlZxmNPxWntffN5oeE2CkimDjtoGvHdbMya1blbxlqMbt1kkXj8cWItlfyML7ifvzONRUSU5GJ56w1GOr/nogt177JntYqKp6JCjNmef95oFTgWi0UkvU8/LX3y114rlb9XX5VK4MyZks+dzsD6rCxR0VCu5KInZNAgmDiR3mTTDXdmV1jIsmWi4gkJ8frhAYZsNCHBaGEpLDRGaXVkVEKoUASY9evFZdND9+7+fXOATHTv31+mvR9LRoZsOb7yilhktTaTJklfYe/e/s/n5cG4caJ7dTN6tJ+5KUuW+E2tACSB87VKX79eqoMul5HI5ebKgulpzP/97+U9mZnND68fN85waz1wQHbezyY7dhhSoOhoGLDzA5ZgaLlMQRbGjTu7MSgMMjOh26AYQnDgxEQTZlY7BuNYtzXQoSkUzeJyiVrCQ58+sPqzo7z4YQIuTBwgHQ2dhAQICzMdJ8lX/ATMZvjDH2D1aujZkxAcnMd3/IZ/cJVrPilL3yZhyXtcOrmKSy8VZaIngXO54O23Rdq5efOJv0VoqFSipk+X65P5DNvJGxulyoiue52/lVz0BNx3HxowjUVyXFZKVWkDa9fK4ciRxqlgtL07AAAgAElEQVQ7d0rl1mQy3EZdLnfi3cFRCaFCEWCeeMKQBZlMonDwJjUlJWIZd/HFYiXmi2fWztatzWSQrUzPnlIVPNbmurZWmgcvuwzy8tA0WSg9uFzwwQfHf1zv3v7afk2TRVPTJOcNCpLd1auvlp3zU83eDQmBc41pDyxdevaqhLruPy9snGUNpg/msxZjYGRwmMVvV1JxdomOhm7pZqLtDeho6GhUEMkPb6qEUNE2OXxYetVAqhXbt8Mrf9iH7nJRTRglxJJgKSW0SxSDB8vgc0ULM2KESFJuuQUAMy4Gso3beYU79j3A3e+N5uWx7/DeOy769PF/68GDIuh56inD2fSnouuySfD00yIEWrAAqKkGp9OQi8bESG+GwuCii6BHDyMh1HUoLmaR+3DIECMhdzqNucGdrY9QJYQKRQA5eNDfbTMmRpIcQBro+vWTnrxj6d1b3FWefdbQVwaaqCipZN7TTGPWp59K5vb881x4gdOvkLlggfReHMv06SIV1TSpKt5+u6zPGRnGjMIzYexYYw5hXp7/7ntLsmeP0Q8aeng3Q+6fgu5wkIX7jkHTSOoWRELC2fn+iubp0QO6p8rOi1c2uqiF7tQUihbGVy7qcMA/n69FzxYDsUN0I4FC7ClRoJmMNUPR8oSFiTLno4+8rREakEIByWU7Yc4cet10Lm/9aj133+1v5K3rsuF59dV4q1E/htJSmer085+LxHT+fK9KFMqlOjiVxSIX9Z3npBBMJrjnHjLJJcPjIltczDfLnDQ0iInfOecYp3tko53NaVQlhApFAHnqKUObrmkifwypLJTJ81dddbye0iNl2bxZMpy2hsUiw55ee+34JojqarjnHoInjOaKkcZ2W2UlfPnl8R/lqQI+/DDcfLNU+CZNMl5fseLMdP02G5x3nnF8tqqE3urgnj2MffdOrA01HKQbR3HPHLTbGTpcXXpbm8xM6DEsEgtNODHRSBDL96W5DRkUiraFJyE8cMA9x277DnA5AR0XGnarE+LiSEgIvECkU3DFFbBli+g8j2XNGsxjR3HDyluY93yx3ygDkLEhd90l4ydO93LT0CBr1L33yubos8/6j//1UlHOUDbyC9ztJEou2jw33giRkUaVsKmJ2rxSVrnNpn1lo9u3S1XX11jm4MGz7z0QaNRdiUIRIKqqpHDmcSoLDobf9P5CqoIff3z8GwYOlG3Gxx+Xk9syt94qjX+jRh3/2oYNXPX3kZgPH3Tf4MgIiub8PTTN31zHd/xhdbX/WIfTYdQoo6B65Ij0+p0OxcUiI1m9Wiq6X30l/Rvz58Nbb4khwHPPwYMPSv/Iso9LWfZ+EXMbr+AX/JO7eFFmhdntmEKClaInAGRkQExaBOHmOlyY0YE99ODQB2f4n0ihOMuUlcleYEOD9DTZtVrYnUMQDQxiCyZ0SE4CzcQVV6iCUKvhMZx54onjZ/rqOrzxBmmTe/DPPs9w/31NXkWKh88+g1mzZDOzOXRd1qQnn5Qk8Pe/FyFQc2tjXBzMmVHMB45LeI1fEkup/Ec4tm1DIYSFwa23GgkhQGERixdJltecbDQszPDLq67u+HuHKiFUKALE88/7X2DGn1NC4m0zRR/ii9UqZbL162X+Qnth4EBYtQpeeuk4s5sE1xGmHHlHVr+KcvbvlxbEU5GU5D9IdvHiM9u1CwqC8eON42XLTm00uW0b3H+/7NC+/DK88Ya4oy5YIMOIlyyRRXvDBqkOlh6opHLXYYL1WmoIox4b5USBPRSCQwgORvUPBgC7XUwCusXVoQM6Jmqxs3r+wUCHplD44akOFhbKBpa2cwdmVwO/4++s5lywBkFcHFarvwGXohUwmyVT27lTLEGPpbIS0wO/4+pHB/D+L5f5VZ4Ajh6F3/5WNg89xmNFRbKxeNVVMkL4ww+bTz6CgsSh9PnnZe35dcy7ZLDPOOG886R1Q9E8d99NqjmfXuyWY0cdK/9TTl2dJH/9+xunNicb7eh9hCohVCgCgGeenqc6GGTV+fXh3/sPNgIYPlwG4/z5z8fvSLYHzGYZJLhrl6x2PsxmrmyB79kDuXuZ96/qE3yIP76Dlw8cgJycMwtpxAgjPy0uloTvRNTUiPr12H+W5nA4oCKvAg4cQMNFPMUAVBDJwejBEByMpsmO47EGBIrWITMTeve3oAFOTDiwsXxtSMfXAinaFZ6EMD8fIoPqYHcO/dlBGTEcJNVbHZw61T2oXtH6ZGaKxGfhQv8p9B6ys0m5fjIvHvgZf7ol3ztI3sOiRdIZcuedMibphReanyYFsoH44IPyrf72Nxg7Rse8c5s0Fvqi5KInJzUVrriCC1jofcpx6KjXj8A3ed+2Te7TOtM8QpUQKhQB4N13ZffXU53qGVnE+L1v+J/0+OOiifTtdm6vpKRId/1//iMXZaA/OxmI2+WxrIzv38oh95F3T5l9DRwoNt8eFi8+s1AsFv82kGXLTvwt33vPp3kfSeaSkmSwfZ8+Uq0cORLOPx+S6/bS6+Ay+rGTy/mEG3mLCCrYmzyOiJRwUlLkR+/fX6pVitYnMxO6DEkkBJGNgsaq6kHUbz/DXQWF4izhcEhi0NQkG1ZhB6V3cDgbeJ+rvdVBQI2aaAtMmya9hc8+2+wgSO3LL5h5TzofnvMI54/2b3qvqJBKVHMqlcRE6Z1fsEBUKZeff5Twz+dJL1yXLrIQ/vCD/5tUQnhq7r2XqfjcNFRWsHh+CeCv3Glqkt9DVSFUKBRnDV0X6aFn1ITF7OKGo89IX4iH2bPFPKajNYf87Gcitfnd78BsliqhB5eT+Q/tFPeYrSceB6BpMGWKcbx+vSG9OV2GDjWUNaWlzc+L2rzZ38l0wgSR6vz97/Doo/Bf/yU/xt13w6zgz4j+ci799O30Iptz2Mr/cC9r064mJCWG4GAxtbFYZHCxIjCkpYEtzEpiaBVO929cOZFsfH1ToENTKABRPLhcsmFot9Rj3rMbDZ1EjrCasd7q4IAB0m6uaANYreL+kpMj/fO+je8AjY3E/+9DPPNRGn+buJioqOYVCcHBcOGF0mXxnwWN3DlgJamv/bfIWhIS5L7grbfEpeZY+vYVK2XFyRkzhpRRqfTHMBBY9WU5NTWy4Rsba5yakwPJycZtWH6+cd/WEVEJoULRyixbJhcaT1UqyVTM5Q6f0RLh4ZJ1dFRCQ+Xn27CBicOrSaTQ+9Ln/IyKtbskY/v9741BXMdw/vmGgtbp9B/dcTqYzf6OpcuX+1/oa2pkV9ZDbKysxc3y0UesuvGfuHSoIpz1jOBxHuRo2nCIi/ee1q+frOXTpp1ZrIqWw2qVKm2PNM/4CRN1hPDtV1UBjkyhEDxy0YICiKjMA5eT3mTzNTPQrTZvdVCNmmiDxMdLj8GGDf6Db91ohUeY9vQ0PiyfxgXnGJPOhw6VrpBFr+7jkeSXGfm3SzHFx0rD+2OPyeedTNYeFCRaUsXpcd99frLRhqIKVvxHmjZ79jRO27NH7hVSUuTY6TRGSnVEVEKoULQyTz8tO8C6DiacTKn6mBR8dvwefti4AnVkBg/GvGYVV18XJHOCgAaCWMDlcuV96ikYMAC+/vq4t9rtMG6ccbxsWfM7d9XVstv65z9LE361T5vioEHeeysqKvzVN++95191vOUWjnOMA+CDD6i9+ibWuoaxmcF8xBXkkwJp6d4Pt9vhgQfgzTebbzVRtC6ZmdBrRJR7/IQZHRMLczKbH4apULQiTifs3i3rw5EjEFF2AIABbOPfzBQdoWYiJsZfJaFoYwwdKvKS994TeecxRP+whMfe7MJ/Mu5h4d2f81rQr7jktz2xD8iQpsJ//1tsyE+G3S4D159/XnaYL730LP0wHZDLL2dK8k7jWHex6AUZTOybEObkyH1aZ5GNqoRQoWhFdu6UzT6pDupENR3lKj7EKzAZMAB+9avABdjamM1c+uJUQob192o4P2AWjbg1Gvv3y6DdsWPhmWcgN9f7Vl9zGU8vhi/r18su+htvyJzDhx6S6txvfysN/Q6Hf5Xwm2+gsVHaQXylouPHn6CNc/58mD2bt12z+YBZbGAYVpoISu/iTQanTJEJIrNmeXNeRYDJzISQrrHEmCpxuZfAvXo6+Z/8hMnRCkULcPCgXJeKiyHI7CToqGwUlhJDDaEQJT1qV1xx/JhXRRvDM1g4K0v6C2y2405J/vB5Ym+8GF588QRDBo9h8GBRzixbJr0On38uPQvuvnzFaWK1knDvbAZj9IqsWW+msqTRLyEsK5O/5s5iLKNuURSKVuSJJyQZdDpBczYxrGkNQ3wuSrz4Yqdb6SMi4OIrbZDZAzJ7UGztwlIm+5/0/ffSsJeZKQODHn2UrhU76NfXkNF4zGUcDlGk3nGH9OH40tAgM6AefFASynfflWSyqUmqhytXwuuvG+fHxJxAKjp3LuWz7+TPzj/xKH+SsRJAWNcoiI0jJUU2bp94QlREirZDSgoEh2ikJ9TgcvcR1hLKpn+r8ROKwOLrLhrRVAq6i3T28RUXSkJhC8ZshssvD2ycijMgLAz++lfZDT7TGSEJCXDddTLctqAANm2SRWXixGYTTMUZcOutTAsyBkI2NbpY/thqUlP9Dd1zclSFUKFQtDBFRTKzzukE3eUitLGc6SwkGreN5fXXS3NcJ8TrlhcVBQP6M7fvo+jaCS5PmzeLBnTAAKa+eqUskiVH2bNH56uvJIF7//1Tf8/6eli6VL7ee08qhA8/LP9OHm655XhHUP2dd/nsug+4XP+ID5jlrTIFxUZgT4nm5pvFUHXs2DP+a1C0AiaTDKnv1Ufq8k7MODGzal0HM3BStCt0XRJCl8vdP1iVB0AU5eSSARFSHZw8WW0ytUsyMsQydPHiE7sBWa3iXvb44zIZvaBA5lNdf73YWytajuhoplyXhAnD4nXRu0WYTTrduxun5eTIpnV4uByXl/u3nnQkVEKoULQSTz8tSYjTCVpjIwPZwgjWy4sREdIz10lJTfXpCTSZ2WkfwbZ520+ZIA85+CmxO1bg+moh2e9v5o6rSzi4owp8HFtHjBAzl9/8RhS5xxIcLOqeXbtEZrpwoZicduly/Lqd+/QCbpvj4BH9v6kggmrcw6WiohkxIYx586QFJDj4x/9dKM4+mZmQ2DeWIBq8Cf36Q0nN+78rFK1AcbHI00pKJDkMKZL+wd30khMiZXiqGjXRzpkyRTY1n3sOeveWReZXv4LPPpP/AMuXi8P4kCGqz+AsE/P7WxmGYR6wvjiNsq/XHmcso2mdo0qotkQVilagvh4+/FAWemejE5urlqFsNKyPH3200+8Azp4N331nHL+3sS8DV6yQxppPP5Xd1W+/9btpN+OiL7v4NzOpbIxAa9SJrsrBbDFhiwnj1zdVcdVD/TCF2OjfX75Hfr5UahcuhOxsudiHhsLRo/KZ9fVyzqJFkiBOnixr+PoX1vD2u11wIv0adYTgxExwXARTLg3h1VfV+t1eyMgALSaGaO0gRXoc0MgeZ3cc2/cQPLBXoMNTdEJ83UUjg2rRqquIopy1jJKLVHg4ffp0jLG0nR6rFX79a/lSBI5evZg69EPWb5RDFyaWPbKCni+O9p5y4IC0mnTrJqpfgLy8jmkQpxJChaIVeOklqKwEp1OHhkZ6k80QNmOnTqah3nlnoEMMOCNGSOVm7145Xr5cbo6SU1ONxbOoSHZSFyzAtXgpbzf9nH9xC1WInkNHo4pwxjWt4pGiP5P65CF4OUIyuuhoCA4mxWZjTnAwc3rbOJgaz+L9PXl59UBoigZdQwfsWgOmmiYqak0seFdjwSs1cMi4XOpANeH06mtl5EVhzJ6tksH2RGwsREZpJIbXUlip4UKjjmB2/XsHQ1RCqAgA2dmyYVhQAMkO8bbXkZtUwsLAZGbWrONH3CkUih/PpD+P48lLnTgxA7BwTRRPW/YD6YAouvbtUxVChULRArhcxky7JkcjVhoYwQYGsUWefPHFjjeA/kfgMWV79FE5drmkF++ee3xOSkiAX/yCg9N+wV8ebGDr6iooKyO0vIZqwtBwkc5+XuNWgnDPoaislOpiM6QCIziHb7ifGBLYQX+cmGkqduEqLvTrL/AljhKGTI4leUw8ERGS0yvaD5ommw+pKU1srZSb7kaC2LCsgiF/CnR0is5GTY3cZJaXi0IhrEQMjg6QJidERBIc7O+srFAofjpRl5zPqNi5rC7pDcAmBlP/8hskJDzi9RPIyYELLpBNX5cLDh+WPzvaJnAH+3EUirbHggUiQXQ1OXE1NNGNgyRxhN5kww03+A/U6+RMn+6dPgHAJ59Aba1xrOsivZ09G7ZmBUFMLGT2IKJfV8Ljgzm360GSraVsYfBpfb9aQnidWwBIpIi+ZHEDbzGTTxnD96SQ73d+EA3cob3KzFsTSR4jnefnnivDaxXti8xMSO8Tgobu3R1evS0iwFEpOiOe6mB+PkSEuTAVFWChSWaaAkRGMGHCCWahKhSKH4+mMXV2gvdQR2PpW3n07ObwPpeTIypfT1dPQ4O/+VxHQSWECsVZ5vnn5U9nbT1mnIxiLf3ZgSUyDJ58MrDBtTFsNrjySuO4ulpGLYGMkPjVr+SvzGFcqzGZ4Jd3mJlzeygRE4bBVVey+Mb34LbbpKJ4EuYym1JivMe/4+8E0UgspSRSyHvM5m3mcBP/x3W8yweWa5n0yiwKEiXhDAmB4cNb7MdXtCIZGRCcnkQYxviJzSVd0R31gQ5N0cnwlYtGOEuhqQkdZD6txQohIUyfHuAgFYoOyoQ/nYfVR6S1qG4cPXO+9B7v2SO/nx19HqHSqSkUZ5G1a2HHDtAbGnA26SRQTAr5MhD1r3+FxMRAh9jmuPJKePNNmQ0IMv89NFRmCx5r99ytm4yKGDgQVq+Gl18GTGZ2NfXi0COv0u2ll+QfISdHtFj19ZJN1tez7WAkK1aNdQ+GdHFe7E6mp0VRnBPG7opEGp1NfBt8Gxfav6GfY7kMJXz4X7yVZ8xIHD3af2aRov0QFgbx3cOIs+RT1RSGjkYx8RQt30HijKGBDk/RSWhqkstTVZVIR9ObZNyEVy4aGUFkpMbo0Sf5EIVC8aMJjw9mzPBGVq6RGdBbGcgdnz4KEy8FzURlpbgAd+sG69bJew4dEt+DjoRKCBWKs8gTTwDo6DV1gIWRrCOSStIHRcHttwc4urZJXBxMmwZfujfoDh6Ehx46/rxZs+Duuw0Z1ciRMHeuDJoHcRK96SazDAQ8ZihgbS3864+A+74/Ohque2I02G9mcj7sflmeX2eew7n3QaSMACM/H/Z8I4+tVtRNWjsnLQ1Soh3sK5Y+wnpsbP38IFNVQqhoJXJzobFRri12O1h259GIlUoipEIYEcnUqarNXKE4m0z7dR9Wrs2VUiCwMz+S4OI8HAniKp6TA336GOd3xAqhkowqFGeJ/fth1SrA4aBJ1winkh7sZSBb0V5+Sa3wJ2H27BO/lpAgPjwPPODfU2OxwKRJxvF338mOe3PMny8jnzzcfLMxgD4lxbCUdjplYL2Hb781Hg8ffvzQekX7Ij0d0t1DiF2YcWHiu2/VLEJF6+EZN5GfD5HB9VBWhhMzXjPRiAglF1UozjLnz4zGFm/0kC9hKhmHjQU/J0dEQp41/+hRqKtr7SjPLiohVCjOEo8/LjMH9dpaXJgZzgZMuBh0TT8YMybQ4bVp+vSBoc0UaS68EN5/H0aNav59EycaBi8NDbBy5fHnbNsmIy08nHceDD7Gg2byZMPefeNGY2D0DvfYSJNJzGQU7Zu0NEjqHYmVRpzu5XDd3rgAR6XoLOi69A/W1IgZckRtPi40DuFuVrKHktTVolyMFYqzjN0O46YYO8y76EtM1ippM6H5AfV5ea0d5dlFJYQKxVmgshK++AKorcWFiWDq6M8OEkOqSHr+wUCH1y647TbD1jk6WnoIH3kEwsNP/J7oaH9d/5IlXgUIIDt6r79uHEdFwbXXHv85iYkwYIA8drkkgfzuO+OzBg0yZKSK9ktUFET1TiKacnRkHuHu2hQai8oCHZqiE1BQIGtFfr4YatmK8qghjEakl4nICK/dvUKhOLtMvbGL/CK6KXVGwIH9gLSuOBwd21hGXWYUirPAM89AXWUDNDTgxMIAthNEI4PuGAvx8YEOr10wfLiYyzz8MHz8sVT/TgffWV1FRbBli3E8b55U+jzcfLMY1jTHpElGlXDLFti0yXhNTQrpOKT1spEQXAVIH2ENoeR8tivAUSk6Ax65aEEBREboaEcKaMDqIxeNZMaMQEWnUHQuxp6rYY2P9h7vphfszQVkMzg3t2MPqFcJoULRwjidMPc9HWpq0QETToaxES0piYH/dXGgw2tX9OsHF10EEWcwHq5nT5ECeli8WP7cvt1fKjpuHAwZcuLPiYszpKS6Lv+uIP2Fp5hmoWhHpKdDt0SRBXkG1K//sjiwQSk6BVlZolooLYUIVznO+iYKSJYXzWYyB9rp0SOwMSoUnQW7HUZMNm42djCA2JJsqBSnupwc6NLF2CjOy/NXILV3VEKoULQwr78Opfl14HLixEwP9hBKDem3TCYyRk0wP9tomn+VcOtW2LcP/vUv47moKLjuulN/1sSJx8u1zjuvZeJUtA3S0iCjlwUNMZYB+O6H4MAGpejwVFZKZfDIETHECi3Lo4xoNNx3mOERTJ+hbtEUitZkwiURECZ9KS5MODF7q4Q5ORAcbIi8HA4xl+koqKuNQtHCvPpCvdd+SkNnFGth8BAGXZYR4Mg6D2PGyJw5D088cfpSUV+io2HYMOM4Pd1fMqJo/8THQ2yfBOzU4HLfjm/OT+hYW7+KNoevu2h4OGgF+TiwYfIkhO7+QYVC0Xqcfz4QF+s9LiIe9uWC7mLvXlkWOqqxjEoIFYoW5MsvYf/uBgB0IJkjxAbXYZk2kf79AxtbZyIoCMaPN45ra43H5557cqnosUyaBMnJIlu96KKWi1HRNtA0SBuRQBwyh8SFmYKmeEq3HQ5wZIqOTFaWGBgePQoRIY00FJdTRKL39UGjQ0hJCWCACkUnJC4OBoyN9EqDcsnAWeuAI4VUV0tFv6P2EaqEUKFoQZ797xKZdwCAJtXBSRPpPSSUYKVCa1WmTDG0/h4iI09PKupLWBjceSfcfz8kJbVcfIq2Q1qGmZTIagCcngH1C/YEOCpFR6WhQQwqCgvlOKK2gGLiseGQJ4KDmX5F2Ik/QKFQnDXGT7FClJjLuDBRTRjk7gVENtpRnUZVQqhQtBBb1tWzaYvxKxVDCV2TnSIXHRTAwDopcXHHzzK8+WZ/KalCAdJHmN61CZAbABcmVi3pYFOHFW2GPXvEpCo/X65H5iP51BLilYuaIiOYMiXAQSoUnZQJE/DKRjXAQTAcPASNjezZI20GnukUhYU+NYB2TqskhJqmBWuatk7TtC2apu3QNO1h9/OTNU3bqGnaZk3TvtM0rYf7eZumae9rmrZH07S1mqal+3zWH93PZ2uaphT2ijbD47/Yg+5yuY90BrMFbcYMQkJN9OwZ0NA6LTNninwUxCCmuWH3CkVyMqT2DcVCEy73bfnaXWdgbatQnAFZWdDUJGNxIiJ0HIdLKMOwux89Sic6+iQfoFAozhrp6ZDaLxyscvNQRCK6swkOHmD3blGTduki5+o6HO4g3QWtVSGsBybpuj4IGAxM1zRtNPAycK2u64OBucB/u8+/BSjTdb0H8CzwJICmaf2Aa4D+wHTgJU3TlG2jIuDUHSxmxTajETmKCnoNtkNKCgMGiIucovXp3h0eewwefBBuuinQ0SjaKmYzpI9KIgqxF3dhYldZAq6GpgBHpuhouFyQnS29SC4XRFBJfl0kdtyNzprG9BuVNl2hCBSaBuMnaBAr93SNWCknCvbmkp8vngQdsY+wVRJCXah2H1rdX7r7y7MNGwnkux/PBN5yP/4ImKxpmuZ+fr6u6/W6ru8D9gAjW+FHUChOypKnN9OAFZD/1P2sOZgnTwBQctEAk5QkswOP7SdUKHxJGxpLgtljLGOiSg8nd/HeAEel6Gjk5ckNZUEBhISA7Wg+1YRhRtQltshgJlxgC3CUCkXnZvx4vAmhjXoxfCoqRK+qZu9elRD+JDRNM2uathkoAhbrur4W+AXwpaZpecD1wBPu07sAhwB0XW8CKoBY3+fd5LmfUygCyldfuvyOuw2KhhA7UVGQmhqgoBQKxWmT3l2jW5xUaVyYacTKuk87iBZI0WbIypL+wcJCcS6uPlRGHXbv6+OH12C3n+QDFArFWWfgQIhODobQUEy4qCBSXsjNJSfn+ISwI0wparWEUNd1p1sa2hUYqWnaAOA+4EJd17sC/wf8oyW+l6Zpt2matkHTtA3FxcUt8ZEKxYlxOlmzz5D42Kklpr/sUwwapCpTCkV7oGtX6JEpq7qnj/DbVeqXV9GyZGVBcbH0EEaENXG42IqdGu/r0+ckBDA6hUIB0id43nl4q4T1BFFNKOTmsidHx26HmBg5t6YGyssDF2tL0eouo7qulwPLgRnAIHelEOB9YKz78WGgG4CmaRZETlri+7ybru7njv0er+m6PlzX9eHx8fFn5edQKDwULtrCYZckhDoQaypH6yIDpAYODGBgCoXitLFaoddw6eXSkaRwy4GYQIel6ECUlkoymJ8v/9/slUVU6BFYcAIQYatnzNVpAY5SoVCA2200JgY0DRv1FJII1VXsWVV43ID6jiAbbS2X0XhN06Lcj0OAqcAuIFLTtF7u0zzPAXwG3OB+fCWwTNd13f38NW4X0u5AT2Bda/wMCsWJWPSvAzQhrjEuTKQmOMBkIjkZEtRmr0LRbkg7L5U4SgD5XT5YG0t1Yc0p3qVQnB5ZWWIkc+SIyEXL95fh8rkNm3JOEdYgVZVWKNoCo0ZBcKgFoqII9iSEQN2ufRw+7J8Q5uUFKMgWpLUqhMnAck3TtgLrkR7Cz4FbgY81TduC9BDe7z7/dSBW0zgyv20AACAASURBVLQ9wG+APwDour4D+ADYCXwN3KXrurOVfgaFolkWrjQaPlyY6XWOGAIoMxmFon2Rfk44ScFlgCSE9djY9klOgKNSdBSysqCkROaWRURAfr7mLxedpUadKBRtBZsNRo8GYmOx0EgVEdRjgwMHyNleryqEPwZd17fquj5E1/WBuq4P0HX9Effzn+i6fo6u64N0XZ+g63qu+3mHrutX6breQ9f1kZ7n3a89put6pq7rvXVd/6o14lcoToSrrIIfjoprjA6EUo29TxqapuSiCkV7IzUVuifXA7K548TEt/+pCHBUio5AXR0cOCByUZMJwrQayupDsCKjTRIoZvAtwwIcpUKh8GX8eCAiEs1idbuNJkBjIzkfbSEx0RgpVlAgfcHtmVbvIVQoOhI731rvHSjsxEyyrRwiI8nIgPDwAAenUCjOiJAQGDIYzLjcc5E01mwJDnRYig5ATo64ixYUQFgYlO4txYQhcJrePRtTTFQAI1QoFMdy3nlgMmsQG4MNh1c2umfpAcxmY0C953e7PaMSQoXiJ7D0wxIa3fMHnZjJ6NYAKLmoQtFeyRiTSCRiGefCzM7CuA5hKa4ILFlZUFYGDgdERkL+IRehvnLRS4ICGJ1CoWiOqCgYPBiIjcVGPUeJpQkzBfvrqc4p6FCyUZUQKhQ/Fl1n6SZxIfTcL2YODkfTZBC6QqFof6RP7E4CMq7IiYnyplDyNh8NcFSK9ozTCbt3i1wUINTuorTKipVGADLIpefsEQGMUKFQnIjx44EQO7ZgMy5MHCUe0Nnz4kK6djXOUwmhQtFJqd68h+11GQDomIiigqDMVJKSIFipzBSKdklaLxvdIisBMZZpwMraD/YHNihFu+bAAakMFhSA3Q5l+ysJ0uvw+IlOD/0ObdjQgMaoUCiaZ/x4+dMUF0MQDYZs9OMtdOtqyEdUQqhQdFLWvbGdOsRh1ImJLhFVYLXSvXuAA1MoFD+aiAgY3KMakB5CHY1vlzUGOCpFeyYrCyorZYB1RAQc3t+AnVrv6xdMcYLZHMAIFQrFiejaFTIygNgYgt3GMjoaOXnBROT8QITbHLiiAqqqAhrqT0IlhArFj2Tlwloa3P2DLkz0yJCdovT0AAalUCh+MoPH2AmhDpDf7U27wwIckaK9ouuwa5chF7XboazCjA1xsx3IVrpcNjKAESoUilMxYQJgsWILtdCIlVJi2Esmzv97u8P0EaqEUKH4EeiOepbvTQU0dMCMk25D49A0lRAqFO2dtPHpxHoH1JvZVxGDo045yyjOnKIiKC+XhDAoCMqLGwlpqjTkonwN06YFNEaFQnFyJkyQP21xYh9fSAL12Mibu5JuSYaCRCWECkUn49CnP3DIlQKIrCzaVIk1OZ7ERLGuVygU7Ze089NIMomxjAsTdXoQO75uxyu9ImBkZUF1tUjJIiIgP9fhHUZvwsWU/kcgOTnAUSoUipPRpw/Ex4MlJgKz5vL2EeaUx9Ft91LveSohVCg6GWvm7cOBZH5OzHSNrQNNU9VBhaIDEBtvok9iGQAuNFyYWPlxcYCjUrRHsrMNuWhwMFSU6wTjAGAUa4m5aEwAo1MoFKeDyQTnnw+ayYTNbqYOO5WEs4ceJH/+T28LcH6+uAq3R1RCqFD8CL5drdGAzI3SMdGjj/QSqoRQoWj/aBqcN6wWEy5ANn2+X6ud4l0KhT/V1ZCXJ+6iZjNUVOiENFV45aIz+AqmTw9ojAqF4vTwyEaDo8VMsJBEcuiJ9avPSAoVN5nGRigsDFCAPxGVECoUZ0hjXiGrjvZ2OxBCEA0kDkoCVEKoUHQUep6bSCTG+IkdhyMDHJGivZGdDbW1MpA+PBwKDjQQ6pT/U0E0MMG+Hs49N8BRKhSK02HYMDGFskXawGSmkESKSKCyKYRue5Z7z8vLC2CQPwGVECoUZ8jWNzZQQRTg7h8MqiUoyk5CAoSGBjg4hULRIqRf0Jt4igBJCI/WhVGU1xDgqBTtiexsqQ4CWCxQXe4kxC0XHc8K7JPHiNOMQqFo8wQFyf5NUJCGFhxEJZE4CGYPPei28j3vee21j1AlhArFGbLmP8U4kMnzLsx0S5abRFUdVCg6DomDkugefASQhLARC2vePxDgqBTtibw8o3+wqgpCnFVuXYnbXfSCCwIYnUKhOFMmTJB+wqAwGyCy0d30olvWIrEURiWECkXnwOVi1dZw6pGLgYZOWl8pC6qB9ApFx8FkgnE9Crz9Xi5MrPiyOqAxKdoPtbVw9CiUlIDVCoUFLkLrSwGIoJKxrFb9gwpFO2PsWOkHttnNYLFSSCJ76EEU5YTu2gDI73xtbYAD/RFYTvaipmnvAKccvqTr+pwWi0ihaMOUrtzO1oZe3v5Bm1ZPXN94QFUIFYqOxvAxNoK211OPDRdmNu4IDnRIinZCUREcOSKD6V0uqKtqJB65S5zMUqyZaZCZGeAoFQrFmRAeLr2Ey5YBNhslTbFk0xsnZrpt/YKs86aDyUReHvTqFehoz4xTVQj3AHvdXxXApYAZyHO/dyZQfjYDVCjaEuve2uUdN6GjEWVvJCTUTFwchIUFODiFQtGidJ9oDKh3YmJvSSSNjSd/j0IBkhB65KLV1RDiqsWk5KIKRbtnwgQZIUOQFR2NfJI5SCpdK7ZDbi7QPmWjJ00IdV1/2PMF9AIu0nX9Wl3XH9R1/TrgIqB3awSqULQFvl/u8OsfTO0mC7yqDioUHY8u088hBbmrd2GipslK1vqqAEelaA/k50Oxe3RlRQXYG0QumkARQ9ik5KIKRTtl/HgxiTJbTBBko5AkMZbhEGzdCnTAhPAYRgNrjnluLaCmqio6BXpVNd8fSMbh7h+0Uk9KX3EbVf2DCkXHwxIdzvCYfd5jJxZWzD0cwIgU7YWsLLdUtA6a6p2ENMq4iQtYiMlqgYkTAxyhQqH4MSQmQp8+7iqhzUYx8eyiD104jJadBQ4HeXkiF29PnElCuAn4m6ZpIQDuPx8DNp+NwBSKtsaeuesoIAndLfwJNjuJ6x4OqAqhQtFRmTS4zDug3oWJ1d85AxyRoq2j67BnjzyuqgKLqx4z8v9mOl/DuHGqx0ChaMeMHw82G2C10GQKYjXnYqOBBGc+7NxJfb2hEGgvnElCeCNwLlChaVoh0lM4DlCGMopOwfcf5vn1D0ZEQEgIxMRARESAg1MoFGeFPuMTCUdkoi7M7NhnD3BEirZOdTUUFkpiWFsLNmctGpDOfnqxW/UPKhTtHG9CiAY2G7vpSRlR7Vo2etoJoa7r+3VdHwv0AC4Beui6PlbX9f1nKziFoi2xZoPZ2z+oA93SzWiaqg4qFB2Z1Av6kuAzoL6gKoyysgAHpWjTFBZCeTnU1ICu69jqRS46na9ljInqH1Qo2jU9e8q9n6YBQTaKSCSbXpIQ5h2C0tKOmxB60HX9ILAOyNM0zaRpmpplqOjwOLL2s6miu7d/0I6DhF7RgOofVCg6Mrah/elnygZkI6hRN7PmP+1MC6RoVQ4fhspKkYuaXE6CdAfglosmJcHAgQGOUKFQ/BQ0TdqAg4IAsxmHJYyVnC8JIcDWreTlBTTEM+a0kzlN01I0TftE07QSoAlo9PlSKDo0G1/fRA2huDCjA0E2jdgkK6ASQoWiQ2O1Mik91zug3omZbz4pDWhIirZNVhY0NYlcVHM2YKOeAWynK4dh2jR3WUGhULRnxo93G8sA2GysYDxxHCWGUnrv+pSBA1ztyljmpIPpj+FVoBaYDKwAzgf+AnzZ8mEpFG2LNV+X+8hFNcIiLYSFQVQUREYGODiFQnFWGTNWw5rbQANBuDCxcbO6oVecmOxsqK+XHkJrkxjKTGORvKjkogpFh2DIEPGQqKgAgoLYWTOAJizcx/8g42svBW1CYIM8A85E7jkWuFnX9c2Aruv6FuAW4LdnJTKFoq3Q2Mj3WVHehNBCEykZQWiaqg4qFJ2B7pMyiEGqgi5M7M6PwOUKcFCKNomuw7594HDIgc1VgwYMZrNUBqdODXSICoWiBTCbYdIk94FmojIoljWMNk54662AxPVjOZOE0IlIRQHKNU2LB2qALi0elULRhij88gdym7p5HUZDTQ7i0sVWVBnKKBQdn7Dxw8hA5hHqaFQ1WMnJUuMnFMdTXg4lJVIhNOlNBFOPhSZ6sAeGD4e4uECHqFAoWojp02VIPQA2G59xsfHiRx+Js1Q74UwSwrXAhe7HC4H3gQXAhpYOSqFoS6x5by9NWHBiBsBqDyIuXiRjqkKoUHQCundndLAxcteJmeXzjwQwIEVbJT9fJGQOB2jOJoKopxe7CaJRjZtQKDoYo0dDaKj7wGpllXWi8WJ1NSxYEJC4fgxnkhBej/QOAtwLLAe2A7NbOiiFoi3x/+zdd3Rc13nu/++eMw0DYNDZAHawiKJEioJIVavLkmwV21KsuMf2spO4XFtOu7lxHKfd6zT/YieOb/yLEjtOcZMsWbZkFauQkigWQSQBNoAESJAEARKVKDOYmbPvH2c4pLooETiYmeez1izOOVPwgLYIvHP2++7n1qdzy0VdDLGqMPG4t/dgZaXP4URk8hnD9ef3nLZBvcNzj4/5HEqmo5YWSKUgnbYEMikiTLCCnd6DKghFCkosBqtWnTwy7AstZ4DTBksUYkForR201vZn749ba//MWvv71truyYsn4i+39zibjs7NFYQljDFjQWmuf1DD4kSKw6qrqinFW/6TIcCOPRGfE8l0tHu3t1wU1+KQwiHtFYQVFd7lBBEpKKd/zpMOlfCLwK1w++1w333wgx/4F+wMncm2EyFjzFeNMR3GmIQxZn/2ODyZAUX8tPO7mxkmfqp/MJyhZo73i6CWi4oUj8orVzGHI4DXR9g1WMbIiM+hZNppa8sOlHEzlJDAgFcQXnvtac1GIlIo3vteCJysppwgP3/Pd7xi8PbbsxsV5oczWTL6V8B1wKeBVcBvAtcAX5uEXCLTwsafHiWNQzq7Q0uoLEpNjfeYBsqIFA+z9iIuoDl3PJEJsPGphI+JZLrJZODQIe8KobEuERJESbCQDrj8cr/jicgkmDED5s49dbx5W8T7UCjPnElBeCdwq7X2EWvtHmvtI8B7gF+bnGgiPrOW516M5paLBsgQqoxRWQnl5d7+MyJSJGprua5uW26DepcAT/7omK+RZHrp7YWBgexAGdebMLqMPTi4sG6d3/FEZJJccsmp+6OjsGmTf1neqjMpCF+rW0pdVFKQRjbvYsfY4lxBWMYoNXNLCQS8q4PqHxQpLldekiJICvAGy2x9XltPyCk7dsDEBGQyloB1iTDBubR6G5ZdcIHf8URkktx006n7ExPw2GP+ZXmrzqQg/BHwM2PMO40x5xhjbgR+mj0vUnA2/2sLLoFcQRgrDVBT5/0no/5BkeJTf9VSaugDvInDuw6WYK3PoWTaaGk5OVDGxck2G6xgJ5x/PpSU+B1PRCbJlVee2n7CWq8gdF1/M52pMykIfw94DPhHYCvwTbytJ353EnKJ+O65x0bIECCF1xTsVMRyewqrf1Ck+Jh1a1nGntzx0HiEAwd8DCTTyt69JwfKuERPHyij5aIiBa28HBobTx339norBvLJ6xaExphrTt6Ay4EngU8Bt+ANl3kie16koNjRMTbun5G7OhhhHFNWTlWV9ynQycJQRIrIBRdwBc/kDtM2wK/uP+FjIJlOOjpOXSGMMk4ZIzRwCNau9TuaiEyySy89dT+ZhCef9C3KW/JGM5D/5TXOn1wkY7L3F521RCLTQNdPNnHEnZUrCOPBBFWzIjiO+gdFilZJCTcvbecv97q4BHAJ8MzPB/j4/yj3O5n4LJGAnh5IJCzGzRAlyQp2EsDqCqFIEbjqKrjnHq8YPFkQfv7z+fP74usWhNZadUpJUdr4gwPAubmCMBoPU1Pr/Vet/kGR4nX+lVXE9o4xQhkuAba1nEnnhRSqHTu8otDNWAK4REhyDru8tWTLlvkdT0Qm2dKl3hYUXV3eFjT790NnZ/78zqifZCKvYuNGi0uACcIYLE5FufYfFBGcS9Yyn1ONg53Hy7xlglLUtm071T/o7Vyb9iaMNjV5U0ZFpKA1NHi3kzIZaG/3L8+ZUkEo8jKp/V1s6V9EgghgiDNEqiROdTXEYt4nQCJSpNaupYktucOJlOH5jRo1Wux27z69f3BCA2VEikwgABdf7BWFa9bA5z4H11/vd6o3b0oKQmNM1BizyRizzRjTaoz5ava8Mcb8hTFmrzFmlzHm86ed/4Yxpt0Ys90Ys+a09/qoMaYte/voVOSX4rLj37YyRiy3XLS8xKWi2iEUUv+gSNFbvpwbw0++ZIP6J+4b8DORTAP79p0qCCOMU8UAM+nRQBmRIrJ8ubfLzKxZcPCg32nOzBsNlTlbksA11toRY0wI2GCMeQg4B5gLLLfWusaYk9debgKWZG/rgH8C1hljqoGvAE14w2y2GmMesNbqp7GcNc892Ac0nJowWhXTclER8TgO11x0guAzaVIEcQmw6alxv1OJjzIZOHQIkgkL1iXGOCvY6X1ooCuEIkVjyZJT97u6vGXk0ah/ec7ElFwhtJ6R7GEoe7PAbwF/aq11s8/rzT7nNuB72ddtBCqNMbOBdwKPWmv7s0Xgo8CNU/E9SJHIZHiutRwXwwQRQqSw8QrtPygiOfHLz6eOHsD7QbZzf578xJdJsX8/DA97A2UMligJr3+wvh7mzPE7nohMkcZGqKz0Wofvuiu/NqefqiuEGGMcvA3tG4F/tNY+b4xZDLzfGPMe4BjweWttG1APdJ328kPZc691XuSsGHj8BXZPLCJJBIuh2gySCM6kutr7lGfmTL8Tiojv1q7lXHZyJPvjp380zJEj+t2/WG3bdmq5qEOGIGlvwqiWi4oUldJS+MY38rO1aMqGylhrM9ba1UADsNYYsxKIAAlrbRPwHeCes/G1jDGfMsZsMcZsOXbs2Nl4SykSz39vD0BuuWhppUN5uSES8a4OBjSGSUTWruUqnswdZjLw+C/T/uURX7W0nJowGskOlDmXVi0XFSlC+VgMgg9TRq21g8ATeEs9DwH3Zh+6Dzg/e/8wXm/hSQ3Zc691/uVf45+ttU3W2qa6urqz+w1IQXvuqQngVEEYqSnXclERean6et5dt4kA3nogF4f1Pxv0OZT4Ze/elw6UmUkP1QzoCqGI5I2pmjJaZ4ypzN4vAa4HdgM/Ba7OPu1KYG/2/gPAR7LTRi8Ghqy13cAvgRuMMVXGmCrghuw5kbfNDgyy8VADFkgSpYwRJkqrcgNl8mVzURGZZMaw5NIZlDIKZCecbc2jZhE5azIZb5pgMmEBlxIS3nYTxniNRCIieWCqeghnA9/N9hEGgB9aax80xmwA/sMY80VgBPhk9vm/AG4G2oEx4DcArLX9xpg/AzZnn/en1tr+KfoepMC1/8fz9FGT6x+siYyScCPU1EAk4o0RFhEBMOvWsuj+/WxjFQCdPSWkUhAK+RxMptSRI9DXBzY7PaKEMa8gXLECyst9Tici8uZMSUFord0OXPAq5weBd73KeQt85jXe6x7OUq+hyOk2/uQwUJNbLhqriZKOQUkJzJ+v/kEROc3atazj+VxBODERYMMGuPrqN3idFJSdO2F0FHBdAriESXn9g1ouKiJ5RL/iigBYy3NbvI/2E5QQIEOwRttNiMhraGridu7DYAHIWPj5fUmfQ8lU27HjVP9gODtQZjm7NVBGRPKKCkIRILF9Ly+OLM72D0aoNoOMRyrVPygir66igsuWDVCCtym9xfD0IwmfQ8lU270bkkkLrkuUBHPpIs4JXSEUkbyiglAEeOHftjFBmAnCuASoLk8znnSoqYFwGGbP9juhiEw34YvXsJj23HH7gZB3tUiKQiYD+/bBRNJCdkP6Fez0+gxWrvQ7nojIm6aCUATY+PAQcGq7idiMUqJRiMVg3jxwHD/Tici0dPXVXMvjucOJJPxSc6+LRnd3dqBM5mUDZdas0XQhEckrKghFkkk2tlUDXv9ghCTU1FBT400OV/+giLyqa6/lPfwUhwygPsJis38/DA0Bros5/QqhlouKSJ5RQShFb/TZbezPzMcCCSLUBocYpTQ3UEb9gyLyqhoaWL0smduPEOCZX6kgLBY7d8L4OOC6hEgRxGUZezRQRkTyjgpCKXrtj3UCkCKEi0N5HMbGDDU13qqf+np/84nI9BW+/kpW0Jo77joaZGDAx0AyZXbuzG5Ib10iJFlAJzHGdYVQRPKOCkIpem3P9wOn+geD8RjhMJSVwdy56h8Ukddx3XXcxEO5w1TK8POf+5hHpoTrwp49MDHhbTsSJeHtP1hbqz4DEck7Kgil6O3d7fX/nCwITXlprn9Qy0VF5HVddRXv5DHCpACw1vLzH4/5HEomW3c39PbiVYZACeNe/+C6dd4PDxGRPKKCUIpbKkV7d1m2fzBKlASJUDy3/6A+6BWR11VRwbnryihnOHdq87NprPUxk0y6jg4NlBGRwqGCUIqau3M3be4i0gTJEKQ8MMZYKkxNDQSD0NDgd0IRme6C11/NBTTnjnsGQhw65GMgmXT79sHICOC6BEkTJcES2jRQRkTykgpCKWpHntjDOCW55aLhUgfHgYoKrxgMBn0OKCLT33XX8W5+hsG7LJhJW+7/qS4RFrJduyAx7g2UCZNiKW3esuGLLvI7mojIGVNBKEVt74Ye4LSBMrGo+gdF5MxcfDGXRV8kQgIAC/ziRyf8zSSTxnWhpQVSE17/YIQE57ALGhuhutrndCIiZ04FoRS19u3jACSzBaEtKVH/oIicmUiEc66aSRWDuVM7dhgyGR8zyaTp7oaeHl4yUOZcWrVcVETylgpCKV7WsvdABBdDiiCGDJlIjMpKb6uJuXP9Digi+cK5/houZmPueOBEkN27fQwkk6azEwYHyQ2UiWigjIjkORWEUrw6OmibmEeKMGAoYQIbChOPe/2DoZDfAUUkb1x3HTfwCA7eZcFMxnLvj3SJsBB1dMDwMOC6OGQoY5RF7NcVQhHJWyoIpWiNPredw9QzQRiAcNQQjRqiUS0XFZEztHIla6v3U8J47tSj9434GEgmS1sbjI24gCVImhXsxAk5sGqV39FERN4SFYRStPY92QWQKwidaIh43HtMA2VE5IwEAiy/YR61HM+d2rsvwJj2qC8orgs7dkA67U2RjZBkJa1eMRiN+pxOROStUUEoRWvvVm8K4ARhLGAjESoqIBBQ/6CInLnA9dfyDp7KHQ+PB9m61cdActYdPQpHjpAbKBNl3JswquWiIpLHVBBK0Wpr98bDTxDGJUCoNEI8DvX1EA77nU5E8s511/EONhBmAgDrWn78n0mfQ8nZ1NEBAwOcNlAm6U0Y1UAZEcljKgilOPX00HZiFhmCuAQIksYp8a4Qqn9QRN6SefNomn+cGKO5U+sfTfgYSM62zk4YHrK5gTIVDDOXLl0hFJG8poJQipK7tZl2GnP9g6EgBBxDWZkKQhF565bc1MhMenLHXUcCHDvmYyA5q/bvh5ETJwfKZDiPHQQq4rBkid/RRETeMhWEUpS617czRoxktn/QCQcpL4dgEObP9zudiOSrwPXXchVPEsAbOjKaCPLMMz6HkrPC2uxAmZT3v22QFKvYDhdd5DWfi4jkKf0LJkVp78Z+4LT+wRKHigqYPRsiEZ/DiUj+uvpq1pmtRPCWilpr+cn3NWq0EHR3w+HDnDZQJts/qOWiIpLnVBBKUWrbmQJOFYThWJCKCm03ISJvU1UVTeclKePUHoSbn02drCEkj3V2Qn8/pw2USXgTRjVQRkTynApCKT4nTtDWG8fFkCaExRAujxKPq39QRN6+xe9azmyO5I57+xz27/cxkJwVHR0wNOiC9QbKVNPPbLpVEIpI3lNBKMVn2zbaWJLbfzAYsBAIUFmp/kERefu8/QjXEyQDQGLC4bHHrM+p5O3q6ICRYe9Sr0OGc2nFzJsHs2b5nExE5O1RQShFZ+z5HRyiIVsQBgiHLCUlXjEYjfqdTkTy3iWXcFFoOyV4vYMWy4M/GH2DF8l09sqBMhnW8IKuDopIQVBBKEWnfX034PUPZggQjgaIx9U/KCJnSTRK0zrnJX2EO3dkSGhLwrx19Kg3VMZmvCuEISa8CaMaKCMiBUAFoRSdtm3ep/YnB8pEsgNl1D8oImfLwltWMo8DueP+IYft230MJG9LRwf09QGuzQ2UWcFOXSEUkYKgglCKy8QEbQcjWCBJGBeHcHmYigr1D4rI2WOuv45LeJ4ISQCS6QC//EXG51TyVnV2wkB/BvAGytRxnNrAAKxZ43c0EZG3TQWhFJfWVva6i0kTxMXBwcUJB2lshJISv8OJSMFYtYoLy/YS49QehI/dP/I6L5DprL0dRoZODZQ5h12wciWUlfmcTETk7VNBKEXF3dpMO43Z/kGHSMjFceD88/1OJiIFJRCg6cpSyjmRO7V/f3bZoeSVkwNlMmmvIAySYRXbtFxURAqGCkIpKt3P7GeM2KkN6SMQj8OiRX4nE5FCM/+21czlIAG8QuLEaIDnnvM5lJyxnh7vZjPehFGHNOt4XgNlRKRgqCCUotK2ZQiAJBFcHCIljgbKiMikMNdfxzo2U4I3XjSZcXjk5xM+p5Iz1dEBA/0Wmx0oE2aC89mhK4QiUjBUEErxcF3a2ry7CaJYIFweZv58iMV8TSYihWjBAi6ceZjYadtPbHh0HNf1MZOcsc5O6D+eBiwOGWbSQzyWgRUr/I4mInJWqCCU4tHeTltyLi4BJghjgHBJkJUr/Q4mIoWq6doK4gznjo8e9XoJJX+0tcHI8MnlohmW0gZNTRAM+pxMROTsUEEoxaO5mTaWnOofdDJgDE1NfgcTkUI19/YLmcshgqQBGBsP8OST/maSN89a2L4d3NMGypzHdi0XFZGCooJQisbYphYO0ZDdfzBAJOwtFT3nHL+TiUihMtdczUVszW0/kXQd1IPfdQAAIABJREFUnnho3OdU8madHCjjZgfKBMhwEZs1UEZECooKQika+zYew2Ky/YOGcEmA+nooLfU7mYgUrJoaLlw8SNlp20+8sHGCZNLHTPKmdXbCwMCpgTLBkxNGdYVQRAqICkIpDtbS1uL9BjaOtwN9pDTIsmV+hhKRYtD0zhrKOYHJHg8MWF54wddI8iZ1dMBAbwqL1z84ix7KZ5bB3Ll+RxMROWumpCA0xkSNMZuMMduMMa3GmK++7PFvGGNGTjuOGGN+YIxpN8Y8b4xZcNpj/zN7fo8x5p1TkV8KQHc3bcMzsHhbTgCEy8KsWuVvLBEpfHNuX0sDRwhnt58YTwR44lfW51TyZuzZA6MnTg2UWUy7t1zUmDd4pYhI/piqK4RJ4Bpr7SpgNXCjMeZiAGNME1D1sud/Ahiw1jYCXwe+ln3uCuAu4FzgRuBbxhhnar4FyWvNzexlKROEyOAQDFgcx2jVj4hMOnP5ZTQ5L1LKKAATNsiGR8Z8TiVvJDdQJnNqoMy5tGq5qIgUnCkpCK3n5BXAUPZms8XcXwO/97KX3AZ8N3v/x8C1xhiTPf/f1tqktbYDaAf0L7O8IfuCN2F0nBIshkjIUlYGCxf6nUxECl5JCReuTFJ+Wh/h3p1p+vt9zCRvKDdQJjthNECGNbyggTIiUnCmrIfQGOMYY14EeoFHrbXPA58FHrDWdr/s6fVAF4C1Ng0MATWnn886lD338q/1KWPMFmPMlmPHjp39b0byTvdznYwRYxxvB/pw1LBggVb9iMjUaHrXTEoZJ0AGgJETrrafmOY6O2GwP4O1vHSgjPYqEpECM2UFobU2Y61dDTQAa40x7wDuBL45CV/rn621Tdbaprq6urP99pKH2pq9C9TjRAGIxBxtNyEiU2b2ey+hnsOUnOwjTDqsf8r1OZW8no4OGDyewsXgkKGW48xYWg2VlX5HExE5q6Z8yqi1dhB4ArgaaATajTGdQMwY05592mFgLoAxJghUAH2nn89qyJ4TeW2Dg+w9Wo4FJk4bKLNmjb+xRKSIrF5NU0krZXgfTk0QZNOTo1jNlpm2du2CsZFTA2UW0oG5WMtFRaTwTNWU0TpjTGX2fglwPbDVWjvLWrvAWrsAGMsOkQF4APho9v4dwK+stTZ7/q7sFNKFwBJg01R8D5LHXnyRNpbkBsoYYygrD7B8ud/BRKRoOA5NayzlDOe2nzhyMMPevb6mkteQGyiTPjVQ5hx2aaCMiBSkqbpCOBt4whizHdiM10P44Os8/1+AmuwVw7uBPwCw1rYCPwR2Ag8Dn7HWZiY1ueS/5mbaaWQUbwf6cNClvBwaGnzOJSJFpem2esKkCJICYGzU5fHHfQ4lr6q31xsoY08bKLOKbRooIyIFaaqmjG631l5grT3fWrvSWvunr/KcstPuJ6y1d1prG621a621+0977C+stYuttcustQ9NRX7Jb+ObW+hibm6gTCQC8+ZBNOpzMBEpKjPeeznz6CKGt+XEeMph44a0z6nk1ZzqH/QGyoSZYE1wB5x/vt/RRETOuinvIRSZavs29+NiSGQHyoRLHM491+dQIlJ8Fi2iqXJfro8wRYjtz4+RTPqcS16howOG+tJYAtmBMn3MWT0TwmG/o4mInHUqCKWwjY+zd79DBocUIQBKK4MsW+ZzLhEpPsZw4bogZYxg8IaVDB5Ps3Gjz7nkFVpaIDHm5iaMzqabskvO8zuWiMikUEEoha2lhXZ3EUkiuDiAoaYuyLx5fgcTkWLU9L75BMkQwbssOD5mtR/hNJPJwLZtYNPeiAKHDEvZg1mngTIiUphUEEpha25mL0sZI4YFgo63hZQKQhHxQ+17rmA+ByhlFIDxdJDNz2jN6HRy8CD09lrcjHcVN0ia89ihCaMiUrBUEEpBsy80s5clpwbKhC11dVBT43MwESlOtbU0zT5COScAr49w/84Ex475nEtydu2CoWMTuBgCuERIsrLsIDQ2vvGLRUTykApCKWjdm7oYJp7rHyyJGRobwZg3eKGIyCS58LIoJYzj4C1JHBtK8atf+RxKcnbuhKH+DJYAQdLUcpzZa2brB4eIFCwVhFK4MhnaW5NMECGDA0BFraPloiLiq6b3LyaApYRxAMbGYP16n0MJAK4LmzZBKukNlAmSpo5jzLhsid/RREQmjQpCKVx797J3Yj5JwtmC0FA7M6SCUER8VX3zxSwKdOa2nxh3w2x7fhxrfQ4mHDjg9RDaVBqbLQiX0EbJZWv8jiYiMmlUEErham6mjSUkKMHFYAKGuhlGBaGI+CsWo2lBH6XZ7SfSBDnWlaC11e9gsmsX9Pa4uK7N9Q9eQLMGyohIQVNBKIWruZlWVjCBt5FwNOQSjUJDg8+5RKToXXhVOREmCJEGYPxEmscf9zmUsGXLS/sHGzhE/UwX6ur8jiYiMmlUEErBGt/SSgcLyWT/b15ebpkzB8Jhn4OJSNG78APLMEDs5PYT47DxOdffUEXOdWHDBmBiItc/OJ+DzFijTxFFpLCpIJTCZC37XhgiQTQ3UKaqNqDloiIyLVRetZrG0AHKsttPjNsIu5oTHD/uc7Ai1tUFXV02WxAGCJGmgS5m3qLloiJS2FQQSmHq6qJteMZLJozWzI6qIBSR6cFxaFo2QhmjOGRIEyTRP8ZPfuJ3sOK1bRsc78lgXe9K7Sy6qQiMMuuuq/wNJiIyyVQQSmFqbmYHK0nj4OJgjKG6RgNlRGT6uPDaShxcSk8uGz2R4dFHfQ5VxB55BNzEBBmc3HLRhefGcKrifkcTEZlUKgilMDU38yKryeBggUh2oIwKQhGZLi786EoMlgoGMVjGkgHa9rh0dPidrPhY6+0/yEQKNztQZh4Habyx0e9oIiKTTgWhFCT7QjN7WZpbLhovcykrg8pKn4OJiGTFVy9iSewIpYzhkCZBFHf4BPfe63ey4tPZCYcOZrCZNBkcKhmkgkEWf/hSv6OJiEw6FYRSkI5uPcwQFa8YKGOMz8FERE4yhqZVEzi4lDFKGofEsRF+9SvIZPwOV1weeQSSIyksBgMsYj9VDeXUrJztdzQRkUmnglAKT18f247UkCZIBgeDpWpWiZaLisi0c83nVgJQzjABLMPjQQ7tS7B9u8/Bisxjj5GdLuoQJMU8DrL4ijn6EFFEioIKQik8zc08zzoAMjgEDMQrteWEiEw/q+46h3lVI5QyRpAUI5SRPjbA/ff7nax4WAsvvpCBVIoMAaIkmEUPjXes9juaiMiUUEEohae5me2cj0sAi8EJQlmZBsqIyPRjDNxyRzg7bXQEF8PoQIpn16cZG/M7XXFobob+3jQWcHGYx0GcyjiL3rnE72giIlNCBaEUnuZm2llyaqBMaYZQCOrrfc4lIvIq3vXlCwkEA5QzgkOGYVtGz55Bb+qlTLr77iM3XdRgaaSdOWtmESvVelERKQ4qCKXgHN+8n2PU5X64V1Y5zJ4NwaDfyUREXmnG3AgXr0oQY4wgacaJkjw2zM8esH5HKwpPPelCaiK73USKuRyi8ealfscSEZkyKgilsIyOsqF9FpZs/yAu8RkRLRcVkWnttrsX55aNGmB4IsK2pwfp7fU7WWEbG4O9rSmwlgwOMzhGJBqg8bZz/Y4mIjJlVBBKYdmxg81cBHgFoWMs8aqgCkIRmdauuGMm8doIZYzikOYE5fS2D/Pss34nK2wPPgipsZP9gwEWsY/w8oXMXaglJSJSPFQQSmFpbqaFc7EY7wphMEB5uQbKiMj0Fg7Dze+NZKeNpkkTZHQozUM/GcV1/U5XuB78mYXURHZFiWUZe1j4jnk4jt/JRESmjgpCKShjm1vpYl62fxCiEYhEVBCKyPR3691LCETClDLq7UlIOe3P9NDe7neywuS6sGl9ElwXlwBlnKDCGWPxrVouKiLFRQWhFJSO53vppzr7aW+GeAVUZG8iItPZ0mWGZSuDuWWjo5Ry9GCK59an/Y5WkFpaoP9YBvBaDOZyCBYtpPH8mM/JRESmlgpCKRypFM17S0kSzg2UKa/VQBkRyR+3fmYeMTNOiDQWw4lMCU/8+yHGx/1OVngefBAyyRQuBothCXuJr1pIba3fyUREppYKQikcu3ezNX0ekB0og0u8OqSCUETyxo3vjRGpqyDGmLcnIeV0beujpcXvZIXnkZ8lIJPBxSFImkV00HjzMoy2HxSRIqOCUArG+PPb2UcjAC4OJuhooIyI5JWKCrjy3WWUMopDhiQRDg2W8uxPuv2OVlC6u2H/nhQAGQLM4BiB+jk0NlX6nExEZOqpIJSC0bn+IH3UZAfKuARCDmVlKghFJL/c+okZxEoNQdLenoRUsOW+gxw75neywvH005AYyWS3m3CYzwHMsqUsXux3MhGRqaeCUApG5wsD9OUGyriUlXmj3GfP9juZiMibd/HFMGtJnBjjuT0JD7UnefGZUb+jFYxf3J8kk8rgZn8NWsZuZl++mJjmyYhIEVJBKIXBWva2G4aJZ/sHM8Srg9TXo/2kRCSvBALwrt+YQamTIEiGDAEOuPVs/M4O7Ul4FoyOwqanEoC3GX0pI9RUQ+Pls3xOJiLiDxWEUhASuzvZnZiP9RaLYoDy6rCWi4pIXrrldodYXSkBMtk9CSvYu6GX/fus39Hy3saNMDpwsn/QYTbdmGXLaGz0OZiIiE9UEEpB6Hy0jT5qcscm6BCvMCoIRSQvzZsHa66uyC0bHSNGx3AVzd/XuNG366lfZUiM22z/YIBF7Ce0Yglz5/qdTETEHyoIpSB0PtdNPzVYDBbACWrCqIjktVvvKqW03BDEG37SyQKa/3sviYTfyfKX68ITDwyRIYCLQ5gJ5pUcZ+EVDQSDfqcTEfGHCkIpCJ07TtCfHSjjYAlHDZGICkIRyV/XXQc188qzpUuGYeIc3DtOy+M9fkfLWzt2QE/Xqe0m4gwTXzqLxUv065CIFC/9Cyh5L5GAw50p+qnObTkRr3SoqoKyMr/TiYi8NbEYvPPOOCXBFA4ZUoTYw1Kav/Wc39Hy1tNPWRIn0oC33UQDh9Q/KCJFTwWh5L2DLxxndNSSJIzBegNlakK6Oigiee+WWw2lNREcMhjgIPPY+8Qhjh9O+h0tLz11/yAJN4SLweCyIHCI8vMXUlfndzIREf+oIJS8t+/xTvqoBsj2DzrEKwIqCEUk761eDUvXxAkADmlGKKNrvIYX/3GD39HyzqFD0NaSIIODS4AYY9QtKKXxnBDG+J1ORMQ/U1IQGmOixphNxphtxphWY8xXs+f/wxizxxjTYoy5xxgTyp43xphvGGPajTHbjTFrTnuvjxpj2rK3j05Ffpm+rIXW54bpz04YtQQgqIEyIlIYjIHb7whSUhbAwdtIfScraP7P3dqT8Aw9/TSMD3pXVjM4VDBEfEWDlouKSNGbqiuESeAaa+0qYDVwozHmYuA/gOXAeUAJ8Mns828ClmRvnwL+CcAYUw18BVgHrAW+YoypmqLvQaahw4dhqHOAfqpOzhfFBB3KylQQikhhePe7oXxmCQFcAlgO0UDvgVE6fr7T72h5Zf3Ph0lMeD8pLAHm0YVZuoTFi/1OJiLirykpCK1nJHsYyt6stfYX2ccssAloyD7nNuB72Yc2ApXGmNnAO4FHrbX91toB4FHgxqn4HmR6am0Feo7STw1B0higrNwQjcKsWX6nExF5+2bMgKtuiBIIBnFIM04J7Syh+e+f8jta3hgZga3rx0gQxSVAlHFm1FlmL45RWup3OhERf01ZD6ExxjHGvAj04hV1z5/2WAj4MPBw9lQ90HXayw9lz73WeSlC1kLLpjHS/UMMEcfgrZ8qrw7R0AABdciKSIF4z3sgVhEiSAaAVlaw86njJI8O+JwsPzz7LCT7R8gQxCVAKaPULq3RclEREaawILTWZqy1q/GuAq41xqw87eFvAU9ba9efja9ljPmUMWaLMWbLsWPHzsZbyjR05AgMNncwQBUOLhmCEHCIVzpaLioiBeXKK6FufhRjDA4u3cxmOB2l5a9+4Xe0vLD+kXESo14xfbJ/sGLVfBWEIiL4MGXUWjsIPEF2qacx5itAHXD3aU87DMw97bghe+61zr/8a/yztbbJWttUp1nSBau1FWhvZ4BqShgnRRjCIQ2UEZGCEw7D+94XwJREcEiTJsgOzqP5+61ouszry2TgmV8MkSCKBUKkmVU6QnhmtX5WiIgwdVNG64wxldn7JcD1wG5jzCfx+gJ/3Vp7+k+0B4CPZKeNXgwMWWu7gV8CNxhjqrLDZG7InpMiYy207HBhXzt9VBMmSZoghMLE4zB37hu/h4hIPnnf+yBWeWpPwt2cw4FjJfT/5Am/o01r27bB0JFRxrP9gzFGqZ1fxvz5EAz6nU5ExH9TdYVwNvCEMWY7sBmvh/BB4NvATOA5Y8yLxpg/zj7/F8B+oB34DvDbANbafuDPsu+xGfjT7DkpMt3dMNDaDWNjjFLmzRc1hnAsSCSiK4QiUniWLYNzVjqYcBiHNMeoZYg4zX/3K7+jTWtPP54iPTxKhiAZHMoYpfbcmVouKiKSNSWfjVlrtwMXvMr5V/362amjn3mNx+4B7jmrASXvnFwumsHhBOXectFQiHiFobYWYjG/E4qInH0f+hBsfT6KMzFCmiAvsIZ5Gx/gmv0dmEUL/Y43LT19Xx8JGwEggKU0mKRiyQwVhCIiWZrDKHnHWmhpAdrb6WY2ATJMZAvC6mpdHRSRwnXLLVBWGSQQMASwtLGEIeJ0fO2Hfkeblg4ehINtyex2E4Yo49TODFIeN8yY4Xc6EZHpQQWh5J2eHujvGoHuIxyjjhCpbEEYZsYMFYQiUrgqK+Ed7zCYkigOaYaJc4TZNP/nLkgk/I437Tz9pIsdGMztP1jKKDWLK2lsBGP8TiciMj2oIJS8410d3IcFjlMDwIRTQjQWIB5XQSgihe3jHwcTCeNk915t5gJaR+aR/P6PfE42/Tx97zHSGUuaIBZDzCSpXVGn5aIiIqdRQSh5xdpT/YNDVDBGjBQhbDjCyR1GVBCKSCG74gqYMTNAIOoVhR0sJEGE1q8/4ne0aWV4GF7cNJHbbiLCBKGKEiqqgyxe7Hc6EZHpQwWh5JXeXjjek4F9+zj+KstFo1HUFyIiBc1x4N3vBiLestEEUdpppHlnGDZt8jvetPHMM+AODJGgBEuAEsaoqY8yZw6UlfmdTkRk+lBBKHmlpQU4dAgmkgxSgQEmAiUEwg41NdDQoL4QESl8n/oUmKCDEwxggG2sopMFDPzdv/odbdpYf38/NpEgQZQMAUoZo3ZpjZaLioi8jApCySvectE2JgjTzWwsMB6ppKbGEAxquaiIFIfGRliyhOxwmQxHmMMYMTb/5CDs3Ol3PN+l0/Dso6OkCZImSJgJgqURaueEVRCKiLyMCkLJG729cOwY0NZOP1U4ZEgQZcIpyfUPrlrla0QRkSlzxx1AKIRjMqQJ0soKnk1fRO/7fgvGx/2O56vmZhjpHc31D0ZJEqwsp6ZGHxyKiLycCkLJG62twNAgHD/GKGUYYJBKCIWYMQPmzIELLvA7pYjI1PjEJyAUMjixEhwytLKSNA73716KvftLfsfz1fqHTsDISG67iRij1MwvY+FCCIX8TiciMr2oIJS8cXIzeovhIHNJEiERLKesPEAs5g1ZUP+giBSLykq48EIgEiYcgkEq6GUGB5nH5m9vgXvv9TuiL6yFp+/rByBBCQEyRKIBahpKtFxURORVqCCUvHDsmLdklLZ2RokxTgmDVOSuDtbUwCWX+J1SRGRqfeADAAZTVkrAeMNlLIZHuIHhj38BDh70O+KU6+yEQx2pXP9gCQmIx6mtRQWhiMirUEEoeaG1FUiloLOTJBFShBgjBuEwdXVw000QDPqdUkRkat15J5SXAyaAUxajg4X8khsYpJIHhy7HfuCD3oSVIvL0o0kYHmacKC6GSLZ/sKEBZs70O52IyPSjglDyQksLcPAApFMcYQ7DVIBxCEYc5s6Fq67yO6GIyNQLh+Haa737JhTEjZXRxTzu5T08yvXsfKYf/uzP/A05xZ764VGwLgmiAMSCaaobSryprGorEBF5BRWEMu0dPw49PUBbO2DpYAEjlEE4RF2d4cYbIRLxO6WIiD+++EVYtMi7b6MxJoIxxojxMO/kD/jfnPjTr8NTT/kbcoo8+yxsf9ECkCBKjDFMRTm1tUbLRUVEXoMKQpn2WlvxpgS0t+PiMEwFFgPhMHPmwPXX+51QRMQ/K1fC7/wOXHQRRCIGyspImBgAW2jiFu7n4Pt/F/r6fE46uVIp+JuvZWBokDRBUoSIMQbxcmprYfFivxOKiExPKghl2mttxftFZnCAw8zmBOXeA6Eg73sflJX5Gk9ExHe/9mvwrnfB5ZdD3YwAxEoYpwSAPSzjfT3/wM9v/kesa31OOnn+67/g4LNdkE6TIEoVA0QDKZzyMpYty/ZaiojIK6gglGmtvx+6u4H2diIk2cjFWAIQClFVFfA2ZhYRKXLGwKc/DStWeFcKz10Vxg2XkMRbT3+UWfzxppv58k1bGB31Oewk6O2F7/xFj9djACQJM4fDUFVJTa1h6VKfA4qITGMqCGVaa2nJ3mlvI0CaPmq941CISy/1tpsQERFvwMwXvwh1dV5P4RXXhHGdMCnCpAlygnIefjTAB9415K28KCDf+KNextsO544XcIB0NA4zZ1FTo+WiIiKvRwWhTGutrUAyCQe72M4qXBzvgXCYT37S12giItNORYXXTxiLQXVtgEuvCBAkQ4YgI5STsg6HN3bx8Y9l+O53wXX9Tvz2NW8Y5eHv9YL1vplyhqkzfYzOXQ4Bh5kzYcECfzOKiExnKghl2hoYgCNHgI4Oou4Im7jIeyDgMGOWwxVX+BpPRGRaqq+Hz38eHAdqGkppXBaggkECZBikEptMkOno4pvfhM9+NrfKMi+5Gctff7AZkoncuXfxC5Kr1mIjJTgOrFoFoZCPIUVEpjkVhDJtnb5cdJgKhqjyjkMhbrpJ+0mJiLyWc8+F3/gN737D6jpKq6PM4ijlnGCMUug7Dv19bNoEd90FGzb4m/et+smnHmbvwWjueBXbKL/0PE5UzQOguhqWLfMrnYhIflBBKNPWye0mbFs7m2nKnY+WOdx6q3+5RETywZVXwi23eFfHZl84h2Q4Th3HWMh+Mjhw4AAkEwwOwhe+AH/7tzAx4XfqN2/w8a3807+eKgYNlvcv2MSzCz/IiRPeudpatP+giMgbUEEo09LgIBw+DPT0MDgaoouG3GO1c8KsXetfNhGRfHHnnbBuHdTMCFK6vIHjzCCAy238lCr3OOzvyPXe/dd/wcc+BocO+Zv5Tenv51t3PM6wPbWXxLtDj/DQVf+HRCpIIgHBICxfDrNm+ZhTRCQPqCCUaenkclHb1s5RZjKAN040HDFcdnmAWMzHcCIiecIY+NSnYMkSmLu0FDNnFgeYzy7O4U/4KpeOPQqHj+Sev3ev9/zubh9DvxHXZfd7/5D7Bq/OnSpnmLK73k3vRBV9fd65VavgvPPUXiAi8kZUEMq0dHIket/uXo4wB4v3E72yymiYjIjIGQiH4e67Yd48mLmiBsrj7GQF/8mv87/5A+7u+T2Co4O55/f2wm//NrnCarqx/+dr/NVTa3M/FwAuv2iCh46sYudO6OmBuXO9m5aLioi8MRWEMu0MDWWXLI2N0dETY4RSAEKkiNWVqiAUETlD5eXwpS/BggWG6OJ6CIbYwOV8j4/wAf6Lf+t9F9Wlydzzu7q8onB42MfQr+bJJ3noj55hO+djgQnCBEpL+HnqBnp6IJ2G0lLv6mBVFZxzjt+BRUSmPxWEMu2cXC461NLFGCUcZwYAFeFxFiwJ09DwOi8WEZFXNWeOt3H9gsYQZt5cXBz+hU+ymQtZ3v8s/5D+TcrLbe75+/bB5z4HY2M+hj7d0aOMvv/jfN1+PvuzoY5jzCC9oJFU2vt1JhCAm27yeic/9zmIRt/gPUVERAWhTD8nl4u27UgQJE2SCA5pyqpCXH65v9lERPLZihXeHoU188pgxgyShPkDvsYgcZY++2/8/ep/o6Tk1PNbW70iMpl87fecEuk0w3d+gt/r/RK7WMEAVUwQoqKhjJSJYAxUVnrf2x//MaxZo70HRUTeLBWEMq0MDXlLlUZHXLp7A4xml4tWMIyprFRBKCLyNl1xhTc4JlRfB7FSeqnjbv6ONA7n/8On+NuP7XhJMbV1K/z+70Mq9frvay2Mjp7drSushYMH4Yd3/og/2nADP+V2Mid/dSktI1RZxsyZ3tLQm2/29l7UEBkRkTMT9DuAyOl27vT+bNs8SDzTzyEaCOBSHhglVlfK6tX+5hMRKQR33QW7dgW4b2wutLWzxW3i63yB30n/LWs/cxFfu+tb/E7Lx3CzxdeGDd6Vty99Cfr7vYEzx497t5P3+/ogkfCWaX7sY3DZZW89XzoNO3bAxo1w5Kk27E/beZYbcbODZIIRh/pzy1nc6C0TLSuD3/xN776IiJwZFYQyrbS0eL9QHGxLMpsxhqikkkEClXEuudRoCZCIyFlgDHz5y7B7d5hd4/XYgwf4MXcwnwOcm9yJ/e53eWd8hH+PfIJUKEY6bfjOd+Chh7ytHF5PIgHf/rY37fM97zmzK3ajo14RuGlTtndxaBDuv58DzOcI9ZQwTqmThIVLWNxocgXgJz/pDZEREZEzp4JQpo3hYW9p0P79YIaHGKcEgyXOMFTM03JREZGzKBSCv/97uPPOCobG6hg7fox7+Dh1HPeeMAzz2UxLaA3ESsFx6OryNnx/M9M777vPKwo/+ck37uc7ccK7Crl582lLU9Np+Mm9hBODtHMpMzmKg8vw7BUsmh/KFYPXXAMXXviW/xpERIqeCkKZNnbu9H4R6NgzQTzRw3HqKOcEDhmIx9/W8iMREXml2bO9K4V/+D9nMRGJ0H00QDCTpoIhAljm0UU6FWL30HKIlkDknzh1AAAeyklEQVRJlI6OAGVl8I53QE0N1Nae+hPgnnu8Ag/g2We95aRf+IK39cXLDQ7C+vVen2Im87Jsz93LJUe+yUbWkSKMg8vErLmEK2LU1XnPqa+HD35w8v5+RESKgQpCmTZaWqCzE1KDJ4gzzB6WM4tuKC1lxfkhqqv9TigiUnhuuAE2bzbce281qXgFB3urKOs7wEL2s5IWbuEBnuVSHkncQDBjCM6dzchIJcuXGz7wgVe+37x58Dd/A93d3vHevfAnf+L1H86Z453r64Onn4YXXwTXfenrlyyBK4d/xryn3k83s/l3PgKAjVfQ78xg3TLvecEgfOYzEA5Pzt+LiEixUEEo08KJE9DR4e17FTgxTIogURKESEPFDG1GLyIySYzxNqF3HOjrc4hE6gkcC8LDbYx1ldLDLO7gx9RynJ+m3gP790E8zt/95TxKS6PcdttL32/GDPjKV+Ab3zg1KKy3F776VfjQh+DoUW9gjLUvfd0558CVV0L9yB5o8irN/48vMEEYwmH6KxZRP9sQi3nP//Vfh7lzJ/kvR0SkCGgel19++ctXro8pYjt3ev2DiXGXipHD9FFHBYPegxUV6h8UEZlE1dVw993e9NH584GZM+EjH4Hbbqe3dBG/5EYmiDCfTsaJYoeHYWcrf/6bXTxy//gr3q+0FH73d70CD7wBMa2t8NnPwoMPnioGjfGG1Hz2s/CBD0B9/ATccQeMjLCJi/gV14AxjNUvIeU6LF7svW71arj++qn5uxERKXS6QjjVJia8XX6/9S34wz+Ev/gLvxNNCzt2QFsbMDZKhdvPAAuIMAGhEDVzYyxb5ndCEZHCFolAU5N3O3YMmpsNzeXnMbJ0KTz9NHbTJpbb3XQzh4PMo8SOETvax5fvPE7sjwa4/MtXv2SkaDDoLUfdtQseeeTU13nhBRgdTPHrl3RwZelWare+CN/f5T1x/35wXdI4/DW/C0C6fh7HR0pYtcq7illR4e2jqP0GRUTODhWEU+nwYe+Tz40bveO//EtYtw5uvdXfXD4bGfEGD4yOestFHTLY7F5TxCu47DKjvaVERKZQXZ1XzF13HbS1RWhecz27n14Fv3iYqw48yWNcRxcNjFBGOJXit77i8O0H/geX/ftvYZefQ2cnPPmEZf+OUWLHj3NR+Tgv7C3HTSSpTvUQaOniyAMbiPN/gVfueP8D3k8HC7GV1Ry3tVRWwqxZ3mOf/vSrD6gREZG3RgXhVAoEvKkpp/vwh2HLFq+Lvkjt3OkNHQCIjx4hRJooSe+ElouKiPgmEIBly7zb2K0z2PahD9P8/2/l2h89x8MjQY4yiwlCHKeWD2y9m8+f+49UrF7Igd4Sb7xoMgHAfNJcxiGeZy3jeE2Am1hLHzV8ka9TwXDua/ZRzf/l0xCJMlw9n8SQ4aKLvMduvvmN90EUEZEzo+suU2n2bPjhD2kPLOUBbvHODQ/D+97nXR4rUg8/DENDwESSyvGjwMlJA4ZgdTkXX+xjOBERASAWg0suNfz2PU18/oXf4H/d2sIsenOPTxDmm/a3aW524fAhSCYIM8EVrOdL/C2f4B7+kv9FPYdzr9nHYv6EP+EQ9blz34z/EWNV9SQXLGFgyGHBAigrgwUL4M47p/AbFhEpEsa+fMzXZHwRY6LA00AE76rkj621XzHGLAT+G6gBtgIfttZOGGMiwPeAC4E+4P3W2s7se/1P4BNABvi8tfaXr/e1m5qa7JYtWybnG3sLRkbgw5e207VjkFt5gN/na16v3Ic+BN/7XtE1RYyOwrvf7X2QHOg/xjVHvsezXEaGIJSXs/ZDy/jWt/xOKSIir+b4M3v44K3D7O2vIUkUC0RIUkM/MznKLI4SJEMAF4PFYMkQoIXz6QvPgnAYEwkTLAlxwfkutQvLeXpjGNeFI0e8K5RXXukVo3/+597nqiIicuaMMVuttU2v9thULRlNAtdYa0eMMSFggzHmIeBu4OvW2v82xnwbr9D7p+yfA9baRmPMXcDXgPcbY1YAdwHnAnOAx4wxS621eTGu01pvL6au8GKo2s8DA7eyh2X8Fb9H/fe/Dxdf7G2qVCSOHIFvf9srBgHiYz0sopP1ZMfSabmoiMi0VnvZMr6/y/LJdx3h4Iv9jKcdwFvn0ctMes1sKIlCNJrb2J5oFBuOkOgPeBvYW2AMjmyEmjaIx6G/H1IpOP98bzjNRz6iYlBEZLJMyZJR6xnJHoayNwtcA/w4e/67wO3Z+7dlj8k+fq0xxmTP/7e1Nmmt7QDagbVT8C2cFem0t+wFjLf2JRplD8v4EN9nA5d500efe87nlJMvnYbHHoN/+Ad49NHsSddlyfAW+jht93kVhCIi017dDMM/3V/PrKuXUza/lrKGagKNjV6z35oL4JwVsHCRV9FVVkG0BBMIUFPjbXdxur4+b5/CEyegshLq62HtWnjHO/z53kRE/l97dx4fVXX3cfzzS0ISthAggIRNQZbiBhoUrVallipVoGqBFtEWWpG61/Vxq6I+VlyxWoUqKGKtqBSx6qtUBOqDUAERlUU2o+w7BBQISc7zx7nDTDBRIMnMJPf7fr3mlZkz95577v0lDL85554TBnGbVMbMUvHDQo8GngJWANudc0XBJqth/00ELYBVAM65IjPbgR9W2gKYHVNt7D5Jr1Ytv1jv8cfDQw+lsq9dO1i8mJ0l9bmOx/ntvme5/KJfkDJ/nl8DqgZauxYmTvQf+B9+6IfQpqVBy1obGVTyPH/if/yG6Rm07pBJ69aJba+IiHy/3FwY9Wwajz7ahLVr/YiYkhL/M/IoKfHbxpY3bQrbt/t1aCPlRUXQsCGccALk5MDgwaG7m0JEJK7ilhAGwzq7mFk28A+gU1Udy8wuBy4HaJ1kGYUZXHghdOoEt9xSm3W7j4KVKwB4lt/y2bpjue+iIWRPn+QzpRqiuBimT4f//Md/6C9aBBs2+A/9Fi3gzDXv0YwNbKGx36FBA04/Xf8DEBGpLlq3hscfP7x98/Ph0Udh27ZomRkMG+YXuRcRkaoT91lGnXPbgWnAqUC2mUWynpawf+qxNUArgOD9BvjJZfaXl7FP7DFGO+fynHN5TZo0qZLzqKjOnWH8eDi1V0NodsT+8tl0Z+DMYSwc+kQCW1e51q6Fp5/2CWFJCaxeDV984UfNtmkD7Y92DP7iTmYSMz5Uw0VFRELjyCP9Pfax3+H27euXuxARkaoVl4TQzJoEPYOYWW3gJ8BifGJ4cbDZZcAbwfPJwWuC999zfjrUycAAM8sIZihtD3wYj3OoCg0awMiRcPkfm2P16+0v30AzfjvmVF6/aRZxmAS2yhQXw9SpMGqU7w0Ev7xEfr7vIc3O9pMHXPvTJaSvXsn/RRJCS6FOs3p07ZqwpouISJw1agR33eWX573iCvj5zxPdIhGRcIjXmMTmwAvBfYQpwATn3D/NbBHwdzO7D5gPPBds/xzwopktB7biZxbFObfQzCYAi4Ai4MrqMsNoeVJS4PJhqRzbqil3XLSFgsIMAPZRiwceTWHBN5u57ZEcMjMT3NBDtG5d9F7BiNRUf69Iy5bR19deC40nvclWGrKQY/wbWfXpfloqtWrFv90iIpI4GRnQs2eiWyEiEi5xSQidc58A3+rvcc6tpIxZQp1ze4Ayl591zt0P3F/ZbUy0085vxPhXM7il7+csdsEYmZIS3h6znqUbGjDi0VrVYoKV4mKYMcM/IhMIgB8i+/nnlOrxvPRS6NABeOstZvLD6BsaLioiIiIiEhdxv4dQypfbO4/nHivgQiZGC/fsYfl7XzFokGPGjMS17WCsW+fXFZw2LZoM1qkD/fv7WeNWrIhue/bZ0KMHvstw5szocFGABg344Q8REREREZEqpoQwyaRfcwW3XbKKP3IP6RT6wm3b+HrlRm64Af78Z98Ll0yKi+G993wyGDtE9Jhj4Jpr/ALDU6ZEyzt08L2DAEyZQlGxn0wHgMxMOnfJoHHjuDVfRERERCS0lBAmGzMYNYoLjvuS5/k1LSKTqK5eDbt28sILcOWVPslKBuX1Cvbr53sG16+HsWOj2zds6JPE/StqvP02H9OFrwnmFddwURERERGRuFFCmIzq1IGJE+nQYCMvMogzeB9wsGIl7Ctk7lwYOBA++SRxTXQO5szxM4iW1St43HF+RtGRI/1wUfBJ4HXX+dlVAZg9GyZM4H3OiFbQIFsJoYiIiIhInCghTFZHHw3jxpHFTh7hBn7PX0gp2gsrV4IrYdMm+N3vYMIE4r40RVERvPEGTJ4cHb4a2ytYt67fZuTI0osMDxkCbdsGL5YuhfPPh927o/cPpqbRqHVdOnWK6+mIiIiIiISWEsJk1rs33HYbKTgGM5YnuYrsXathtR9GWlwMI0bAvfdCYWF8mrRjBzz7LMybFy1r1w6uvtr3Cpr5BPX552H58ug2555LtOdv/XpfsGULq2nBl7Tx5S1bcvoZKaTot1JEREREJC70X+9kN3w4nHMOACczh5cYyLEbp8K26E2EkyfD5ZfDxo1V25T8fHj6aVizJlr2ox/5CWLq1YuWTZ1KqRlRO3eGAQOCFzt3ws9+Bl98QQnGG/Tx5c2bQ06OhouKiIiIiMSREsJkl5oKL79MZBHCZmzkr/yOi1aNhD2792/22WcwaFDV3FfoHHzwgZ8c5uuvfVl6uk/yfvITSvXoLVkC48dHX+fkwFVX+dNg3z64+GIKPlrGOAbRhzcYy2+gcWPIzSUtDU45pfLbLyIiIiIiZYvLwvRSQTk58NprfsxlYSG1KOJ/9g2n47atjMh9jCLnw7hli+8pvPVW6Nu3/OoKC2HzZv8oKfFDPuvXL3vbfftg0qTSiWbjxvCrX0HTpqW33bIFnngiel9hejr84Q9B3c6xrN/tvDKlG+9wF3vJ8BtlZUGbNoBxyin+/kMREREREYkPJYTVRbdufhHCoUP3F1249knatdjDTRmPs3WPz6SKivwo0w8/hAsv9Pf8RZK/TZv8zx07vl19mzZ+aGfnztCxI9Su7SeE+dvfSs8i2rEjXHwxZGaW3r+wEB57zI8IjRg6FHJz/RqFf79hDh993K/0TnXq+GzUUsjLg1tuqehFEhERERGRQ2Eu3lNUxlleXp6bO3duoptROZyDIUMoHDuezeSwiSZsJofl1p4xjW9mVUprilza/h66Ro2ga1fIyDi0w6Sk+KUhNm/2HXiNGvkhnz16wFln+YljDmzW00/DrFnRsh49/HavvgobPt0Iq74qvVNGBhnHd+S83un07w/t2x/y1RARERERkYNgZvOcc3llvacewurEDJ56iikz6vPKyph4Ojh68yz22C5Wp7eDOrXBUti6FWbOhJNOiln7L0Zqqv8ZSSDBJ3fr1sH8+dHlLGrV8olgQYGfObRt2+i+AO+8E00GCwpgzx4YPdoPN2X7tm8lg83Tt/CLe7vQd2g6WVkVvioiIiIiInKYlBBWN7Vrk/PY7TB4HmzZvL84hRKOdwvI2rudxXuPwdWujWVmUlycwoIF/p7CHj2gSRN/S2KTJpCd7Yd6Ll0KCxf6+wTffx+2b48eLjMTjjrKDzd97bVoWceOfnhp3brRYaX5+bBrlx8mmpIC7Nrp100M5DGXARmT+NH04aR0bxaf6yUiIiIiIuVSQlgNNTmmKZx7Lmlr8slZ8B4525aSw2Zy2EwTNrGOIxi5+1q+3puFNW8OjZswc2YqRx7p14KP7d3LyPDrBzZv7petOO00PznMpk2+h7BevdLbg+8BnD8fpk/3w0pXrfJlKSm+npQU/Ayoy5eT6XbTi7fpzyu0S/0SXn8Dup8cx6slIiIiIiLl0T2E1VBRkZ+8JTsbrLgIxo2Du+/2mVlgLc25kYdZSgdIqwW5fp2/k09J4YEHSg8hXbLE9/7t3etfm/nlJE4/3Q8BXbwYPv3UDz9dtswnjFu3lh5qCtCsmZ8nhn2F5C6bQb/dL9CbyWQRzDTz3HMweHCVXhsRERERESntu+4hVEJYU+zdC6NGwX33+e49YA8ZDOcuptDTb5OeAbm55B7biEceNY4+GqZN84+I2rWhf38/THT5cpg71z/mzfNrEBYVwe7dvkdw925KTWDToAGc3GUvA6ZdwekrXyCFmN+t4cPhzjvjdDFERERERCRCCWEYEsKIXbtg5Eh46CHYsQMHvMgg/szVOILpQTMzSW/dnDP6NiI93Zc559cNbNXK9wjOm1f28hSxnPMJYu3a/h7Ffn320vbK80pnmOAXR3zmmW9PTyoiIiIiIlVOCWGYEsKIrVthxAi/Uvzu3XzAqdzO/ezEr0C/jWy+ScumU+cUCus1ZNcuIy3t4HK29HQ4/njIy/OPY46BWqklcMkl8PLLpTe+4AKYOBHSdLuqiIiIiEgiKCEMY0IYsW6dH0Y6ejSrio7gBh5hJW0pJoVNNKGEVLKsgLq1werW8UtW1Knju/0sBfCTyhx7rE/+unXzyWB6+gHHuekmePjh0mXdu8PUqcGNhSIiIiIikghKCMOcEEasXAn33MM3417jLu5hOmdRSC0cRgaFpTZNoYQf2BLyjlhD3gn7OOHMbOqcchyccIK/WfBAjz8O119fuqxDBz8LTU5OFZ6UiIiIiIh8HyWESgijFi6k5I67GDOpIaMYisMwHO1ZRjfmkMdcujKfenxd9v6tW0PXrtCli/+5aZO/RzD296hZM79S/VFHxeecRERERESkXEoIlRB+25w55N/xLOtn59O5YFZ0aYiKqlcPZsyAE0+snPpERERERKRCvish1EwfYdWtG0f+qxtHOgerV/uV5j/+OPozP//Q60xLg9dfVzIoIiIiIlJNKCEMOzO/1kSrVtC7d7R82zZYsKB0krhokV9nojxjxkDPnlXfZhERERERqRRKCKVsDRvCWWf5R8SePT4pjE0SFyyAWrXgwQdh0KBEtVZERERERA6DEkI5eJmZfjiohoSKiIiIiNQIKYlugIiIiIiIiCSGEkIREREREZGQUkIoIiIiIiISUkoIRUREREREQkoJoYiIiIiISEgpIRQREREREQkpJYQiIiIiIiIhpYRQREREREQkpJQQioiIiIiIhJQSQhERERERkZBSQigiIiIiIhJSSghFRERERERCSgmhiIiIiIhISCkhFBERERERCSklhCIiIiIiIiGlhFBERERERCSklBCKiIiIiIiElDnnEt2GKmVmm4AvE92OMuQAmxPdCPkWxSX5KCbJSXFJPopJclJcko9ikpwUl6rVxjnXpKw3anxCmKzMbK5zLi/R7ZDSFJfko5gkJ8Ul+SgmyUlxST6KSXJSXBJHQ0ZFRERERERCSgmhiIiIiIhISCkhTJzRiW6AlElxST6KSXJSXJKPYpKcFJfko5gkJ8UlQXQPoYiIiIiISEiph1BERERERCSklBAeBDMbY2YbzeyzA8ofMrMlZvaJmf3DzLLL2f/eYJuPzWyKmeUG5WZmT5jZ8uD9E8vZ/1wz+zzY7taY8qPM7L9B+Stmll6Z553skjguZmb3m9lSM1tsZtdU5nknsySISYWOXxMlcUy6mNnsoN65ZnZyZZ1zdVCFcelkZrPMbK+Z3fgdxz/JzD4N4veEmVlQ3sjM/m1my4KfDSvzvJNZssYkeO/qoA0LzWxEZZ1zdZAEcbnfzFaZ2a4Dyv9gZouCuqeaWZvKON/qIIlj0trMppnZ/KD+XpVxvqHgnNPjex7Aj4ATgc8OKO8JpAXPHwQeLGf/rJjn1wDPBM97Ae8ABnQH/lvGvqnACqAtkA4sADoH700ABgTPnwGGJfpaKS4O4DfAOCAleN000dcqDDGpjOPXxEcSx2QKcF5MXdMTfa1qSFyaAt2A+4Ebv+P4HwZxsyCOkViMAG4Nnt+qv5WkiMnZwLtARqS+RF+rkMWlO9Ac2HVA+dlAneD5MOCVRF8rxYTRBP8XBjoD+Ym+VtXloR7Cg+Cc+w+wtYzyKc65ouDlbKBlOfsXxLysC0Ru3OwDjHPebCDbzJofsPvJwHLn3ErnXCHwd6BP8M1hD+C1YLsXgL6HfnbVVzLGJXhvGDDcOVcSHGfjoZ9d9ZTgmFT4+DVRssYkqCcreN4AWHsQp1NjVFVcnHMbnXNzgH3lHTuIU5ZzbrZzzuG/wIp8fvTBf55AyD5Xkjgmw4A/Oef2Ruo7pBOr5hIZl2C72c65dWWUT3POffN9x6+JkjUmhPxzpSLSEt2AGmQw8Ep5b5rZ/cClwA78t0oALYBVMZutDspif8nL2uYUoDGwPeYPL7KvlBbvuAC0A/qb2c+BTcA1zrllFTiHmqaqYlIpxw+pRMTkOuBfZvYw/vaF0w6xzWFwOHE5GC3w8YqI/fxoFvMfrfVAs0OoNwwSEZMOwBlB3XvwPSdzDqXRIVBVcTlYQ/C9uhKViJjcDUwxs6vxieY5lVRvjacewkpgZrcDRcBL5W3jnLvdOdcq2OaqeLUtzBIYlwxgj3MuD/grMKaS6q32Ev23cjDHD5sExmQYcH1Q7/XAc5VUb42Q6L+VoH5HtEc49BIYkzSgEX6Y3E3AhNj7C8Mu0X8rZnYJkAc8VJn1VmcJjMkvgeedcy3xtyK8aGbKdQ6CLlIFmdmvgfOBgcGHJ2Y2NrhR9u0ydnkJuCh4vgZoFfNey6AsVnnbbMEP0Ur7jn1DK4FxAf/N7sTg+T+A4w/zNGqUOMTkkI8fdgmOyWVE/05exQ/DFiocl4OxhtJDuWJjtyEy9Df4GarhieVJcExWAxOD4dkfAiVAziGeQo0Uh7h83/HPAW4HekeG9IZdgmMyBD+/Bs65WUAm+ls5KEoIK8DMzgVuxv9DEBlHjnPuN865Ls65XsF27WN26wMsCZ5PBi41rzuwo4wx0XOA9uZnFE0HBgCTgz+yacDFwXaXAW9U8ilWS4mMS/DeJKLDH84Ellbi6VVLcYrJIR8/zBIdE/y9HWcGz3sAGlZNpcTlewVxKjCz7kFP06VEPz8m4z9PQJ8rQFLEZP9nipl1wE9ktrkCp1QjxCMu33P8rsCo4Pj64oTExwT4CvhxcIwf4BPCTZVUd83mkmBmm2R/AC/j74vZh/+mbkhQvhx/D83HweOZcvZ/HfgM+AR4E2gR+dIEeAo/W+WnQF45+/fCJxUrgNtjytviZyVbjv+GPSPR10pxcQDZwFvBvrOAExJ9rUIUkwodvyY+kjgmpwPz8DP0/hc4KdHXqobE5YigvgJge/A8q4z984L9VwBPAhaUNwam4hP0d4FGib5WignpwPjgvY+AHom+ViGLy4jgvZLg591B+bvAhpjjT070tVJM6AzMxH+ufAz0TPS1qi6PyD82IiIiIiIiEjIaMioiIiIiIhJSSghFRERERERCSgmhiIiIiIhISCkhFBERERERCSklhCIiIiIiIiGlhFBERELHzFqb2S4zS010W0RERBJJCaGIiISCmeWb2TkAzrmvnHP1nHPFcTz+WWa2Ol7HExERORhKCEVEREREREJKCaGIiNR4ZvYi0Bp4MxgqerOZOTNLC96fbmb3mdkHwftvmlljM3vJzArMbI6ZHRlTXycz+7eZbTWzz82sX8x7vcxskZntNLM1ZnajmdUF3gFyg/p3mVmumZ1sZrPMbLuZrTOzJ80sPaYuZ2a/N7NlQX33mlm7oJ0FZjYhsn2kB9LMbjOzzUGP6MD4XGEREamulBCKiEiN55wbBHwFXOCcqwdMKGOzAcAgoAXQDpgFjAUaAYuBPwIEyd2/gb8BTYP9/mJmnYN6ngOGOufqA8cC7znnvgbOA9YGQ1XrOefWAsXA9UAOcCrwY+D3B7Trp8BJQHfgZmA0cAnQKqj/lzHbHhHU1QK4DBhtZh0P6WKJiEioKCEUERHxxjrnVjjnduB781Y45951zhUBrwJdg+3OB/Kdc2Odc0XOufnA68Avgvf3AZ3NLMs5t80591F5B3TOzXPOzQ7qyQdGAWcesNkI51yBc24h8BkwxTm3MqadXQ/Y/k7n3F7n3AzgLaAfIiIi5VBCKCIi4m2Ieb67jNf1gudtgFOCYZ7bzWw7MBDfOwdwEdAL+NLMZpjZqeUd0Mw6mNk/zWy9mRUA/4vv4TucdgFsC3ojI74Ecss7voiIiBJCEREJC1dJ9awCZjjnsmMe9ZxzwwCcc3Occ33ww0knER2eWtbxnwaWAO2dc1nAbYBVoG0NgyGtEa2BtRWoT0REajglhCIiEhYbgLaVUM8/gQ5mNsjMagWPbmb2AzNLN7OBZtbAObcPKABKYo7f2MwaxNRVP9hml5l1AoZVQvvuCdpxBn5466uVUKeIiNRQSghFRCQsHgDuCIZ4Xny4lTjndgI98ZPJrAXWAw8CGcEmg4D8YAjoFfjhpDjnlgAvAyuDoaa5wI3Ar4CdwF+BVw63XYH1wLagXS8BVwTHFRERKZM5V1kjaERERCRRzOwsYLxzrmWi2yIiItWHeghFRERERERCSgmhiIiIiIhISGnIqIiIiIiISEiph1BERERERCSklBCKiIiIiIiElBJCERERERGRkFJCKCIiIiIiElJKCEVEREREREJKCaGIiIiIiEhI/T/TYeQPsPM8oAAAAABJRU5ErkJggg==", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "kernel_info": { - "name": "python3" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "nteract": { - "version": "nteract-front-end@1.0.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "c193140200b9684da27e3890211391b6", - "translation_date": "2025-08-29T23:19:29+00:00", - "source_file": "7-TimeSeries/2-ARIMA/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/br/7-TimeSeries/2-ARIMA/working/notebook.ipynb b/translations/br/7-TimeSeries/2-ARIMA/working/notebook.ipynb deleted file mode 100644 index 226c96d29..000000000 --- a/translations/br/7-TimeSeries/2-ARIMA/working/notebook.ipynb +++ /dev/null @@ -1,59 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "523ec472196307b3c4235337353c9ceb", - "translation_date": "2025-08-29T23:20:24+00:00", - "source_file": "7-TimeSeries/2-ARIMA/working/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Previsão de séries temporais com ARIMA\n", - "\n", - "Neste notebook, demonstramos como:\n", - "- preparar dados de séries temporais para treinar um modelo de previsão de séries temporais ARIMA\n", - "- implementar um modelo ARIMA simples para prever os próximos passos HORIZON à frente (tempo *t+1* até *t+HORIZON*) na série temporal\n", - "- avaliar o modelo\n", - "\n", - "Os dados neste exemplo são retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014. A tarefa é prever valores futuros da carga elétrica. Neste exemplo, mostramos como prever um passo de tempo à frente, usando apenas dados históricos de carga.\n", - "\n", - "Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "pip install statsmodels" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/7-TimeSeries/3-SVR/README.md b/translations/br/7-TimeSeries/3-SVR/README.md deleted file mode 100644 index 110aa9a80..000000000 --- a/translations/br/7-TimeSeries/3-SVR/README.md +++ /dev/null @@ -1,393 +0,0 @@ - -# Previsão de Séries Temporais com Support Vector Regressor - -Na lição anterior, você aprendeu como usar o modelo ARIMA para fazer previsões de séries temporais. Agora, você verá o modelo Support Vector Regressor, que é um modelo de regressão usado para prever dados contínuos. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -Nesta lição, você descobrirá uma maneira específica de construir modelos com [**SVM**: **S**upport **V**ector **M**achine](https://en.wikipedia.org/wiki/Support-vector_machine) para regressão, ou **SVR: Support Vector Regressor**. - -### SVR no contexto de séries temporais [^1] - -Antes de entender a importância do SVR na previsão de séries temporais, aqui estão alguns conceitos importantes que você precisa saber: - -- **Regressão:** Técnica de aprendizado supervisionado para prever valores contínuos a partir de um conjunto de entradas. A ideia é ajustar uma curva (ou linha) no espaço de características que tenha o maior número de pontos de dados. [Clique aqui](https://en.wikipedia.org/wiki/Regression_analysis) para mais informações. -- **Support Vector Machine (SVM):** Um tipo de modelo de aprendizado de máquina supervisionado usado para classificação, regressão e detecção de outliers. O modelo é um hiperplano no espaço de características, que no caso de classificação atua como um limite, e no caso de regressão atua como a linha de melhor ajuste. No SVM, uma função Kernel geralmente é usada para transformar o conjunto de dados em um espaço de maior número de dimensões, para que possam ser facilmente separáveis. [Clique aqui](https://en.wikipedia.org/wiki/Support-vector_machine) para mais informações sobre SVMs. -- **Support Vector Regressor (SVR):** Um tipo de SVM, usado para encontrar a linha de melhor ajuste (que no caso do SVM é um hiperplano) que tenha o maior número de pontos de dados. - -### Por que SVR? [^1] - -Na última lição, você aprendeu sobre o ARIMA, que é um método estatístico linear muito bem-sucedido para prever dados de séries temporais. No entanto, em muitos casos, os dados de séries temporais apresentam *não-linearidade*, que não pode ser mapeada por modelos lineares. Nesses casos, a capacidade do SVM de considerar a não-linearidade nos dados para tarefas de regressão torna o SVR bem-sucedido na previsão de séries temporais. - -## Exercício - construir um modelo SVR - -Os primeiros passos para a preparação dos dados são os mesmos da lição anterior sobre [ARIMA](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA). - -Abra a pasta [_/working_](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/3-SVR/working) nesta lição e encontre o arquivo [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/7-TimeSeries/3-SVR/working/notebook.ipynb). [^2] - -1. Execute o notebook e importe as bibliotecas necessárias: [^2] - - ```python - import sys - sys.path.append('../../') - ``` - - ```python - import os - import warnings - import matplotlib.pyplot as plt - import numpy as np - import pandas as pd - import datetime as dt - import math - - from sklearn.svm import SVR - from sklearn.preprocessing import MinMaxScaler - from common.utils import load_data, mape - ``` - -2. Carregue os dados do arquivo `/data/energy.csv` em um dataframe do Pandas e dê uma olhada: [^2] - - ```python - energy = load_data('../../data')[['load']] - ``` - -3. Plote todos os dados de energia disponíveis de janeiro de 2012 a dezembro de 2014: [^2] - - ```python - energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![dados completos](../../../../7-TimeSeries/3-SVR/images/full-data.png) - - Agora, vamos construir nosso modelo SVR. - -### Criar conjuntos de treinamento e teste - -Agora que seus dados estão carregados, você pode separá-los em conjuntos de treinamento e teste. Em seguida, você remodelará os dados para criar um conjunto de dados baseado em etapas de tempo, que será necessário para o SVR. Você treinará seu modelo no conjunto de treinamento. Após o término do treinamento, você avaliará sua precisão no conjunto de treinamento, no conjunto de teste e, em seguida, no conjunto de dados completo para ver o desempenho geral. É necessário garantir que o conjunto de teste cubra um período posterior ao conjunto de treinamento para garantir que o modelo não obtenha informações de períodos futuros [^2] (uma situação conhecida como *Overfitting*). - -1. Alocar um período de dois meses de 1º de setembro a 31 de outubro de 2014 para o conjunto de treinamento. O conjunto de teste incluirá o período de dois meses de 1º de novembro a 31 de dezembro de 2014: [^2] - - ```python - train_start_dt = '2014-11-01 00:00:00' - test_start_dt = '2014-12-30 00:00:00' - ``` - -2. Visualizar as diferenças: [^2] - - ```python - energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \ - .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \ - .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![dados de treinamento e teste](../../../../7-TimeSeries/3-SVR/images/train-test.png) - -### Preparar os dados para treinamento - -Agora, você precisa preparar os dados para treinamento, realizando filtragem e escalonamento dos dados. Filtre seu conjunto de dados para incluir apenas os períodos de tempo e colunas necessários, e escale para garantir que os dados sejam projetados no intervalo 0,1. - -1. Filtrar o conjunto de dados original para incluir apenas os períodos de tempo mencionados por conjunto e incluir apenas a coluna necessária 'load' mais a data: [^2] - - ```python - train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']] - test = energy.copy()[energy.index >= test_start_dt][['load']] - - print('Training data shape: ', train.shape) - print('Test data shape: ', test.shape) - ``` - - ```output - Training data shape: (1416, 1) - Test data shape: (48, 1) - ``` - -2. Escalar os dados de treinamento para estar no intervalo (0, 1): [^2] - - ```python - scaler = MinMaxScaler() - train['load'] = scaler.fit_transform(train) - ``` - -4. Agora, escale os dados de teste: [^2] - - ```python - test['load'] = scaler.transform(test) - ``` - -### Criar dados com etapas de tempo [^1] - -Para o SVR, você transforma os dados de entrada para o formato `[batch, timesteps]`. Assim, você remodela os `train_data` e `test_data` existentes de forma que haja uma nova dimensão que se refira às etapas de tempo. - -```python -# Converting to numpy arrays -train_data = train.values -test_data = test.values -``` - -Para este exemplo, usamos `timesteps = 5`. Assim, as entradas para o modelo são os dados dos primeiros 4 timesteps, e a saída será os dados do 5º timestep. - -```python -timesteps=5 -``` - -Convertendo os dados de treinamento para tensor 2D usando list comprehension aninhada: - -```python -train_data_timesteps=np.array([[j for j in train_data[i:i+timesteps]] for i in range(0,len(train_data)-timesteps+1)])[:,:,0] -train_data_timesteps.shape -``` - -```output -(1412, 5) -``` - -Convertendo os dados de teste para tensor 2D: - -```python -test_data_timesteps=np.array([[j for j in test_data[i:i+timesteps]] for i in range(0,len(test_data)-timesteps+1)])[:,:,0] -test_data_timesteps.shape -``` - -```output -(44, 5) -``` - -Selecionando entradas e saídas dos dados de treinamento e teste: - -```python -x_train, y_train = train_data_timesteps[:,:timesteps-1],train_data_timesteps[:,[timesteps-1]] -x_test, y_test = test_data_timesteps[:,:timesteps-1],test_data_timesteps[:,[timesteps-1]] - -print(x_train.shape, y_train.shape) -print(x_test.shape, y_test.shape) -``` - -```output -(1412, 4) (1412, 1) -(44, 4) (44, 1) -``` - -### Implementar SVR [^1] - -Agora, é hora de implementar o SVR. Para ler mais sobre esta implementação, você pode consultar [esta documentação](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html). Para nossa implementação, seguimos estas etapas: - -1. Definir o modelo chamando `SVR()` e passando os hiperparâmetros do modelo: kernel, gamma, c e epsilon -2. Preparar o modelo para os dados de treinamento chamando a função `fit()` -3. Fazer previsões chamando a função `predict()` - -Agora criamos um modelo SVR. Aqui usamos o [kernel RBF](https://scikit-learn.org/stable/modules/svm.html#parameters-of-the-rbf-kernel) e definimos os hiperparâmetros gamma, C e epsilon como 0.5, 10 e 0.05, respectivamente. - -```python -model = SVR(kernel='rbf',gamma=0.5, C=10, epsilon = 0.05) -``` - -#### Ajustar o modelo nos dados de treinamento [^1] - -```python -model.fit(x_train, y_train[:,0]) -``` - -```output -SVR(C=10, cache_size=200, coef0=0.0, degree=3, epsilon=0.05, gamma=0.5, - kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False) -``` - -#### Fazer previsões com o modelo [^1] - -```python -y_train_pred = model.predict(x_train).reshape(-1,1) -y_test_pred = model.predict(x_test).reshape(-1,1) - -print(y_train_pred.shape, y_test_pred.shape) -``` - -```output -(1412, 1) (44, 1) -``` - -Você construiu seu SVR! Agora precisamos avaliá-lo. - -### Avaliar seu modelo [^1] - -Para avaliação, primeiro escalaremos os dados de volta para nossa escala original. Em seguida, para verificar o desempenho, plotaremos o gráfico de séries temporais original e previsto, e também imprimiremos o resultado do MAPE. - -Escalar a saída prevista e original: - -```python -# Scaling the predictions -y_train_pred = scaler.inverse_transform(y_train_pred) -y_test_pred = scaler.inverse_transform(y_test_pred) - -print(len(y_train_pred), len(y_test_pred)) -``` - -```python -# Scaling the original values -y_train = scaler.inverse_transform(y_train) -y_test = scaler.inverse_transform(y_test) - -print(len(y_train), len(y_test)) -``` - -#### Verificar desempenho do modelo nos dados de treinamento e teste [^1] - -Extraímos os timestamps do conjunto de dados para mostrar no eixo x do nosso gráfico. Note que estamos usando os primeiros ```timesteps-1``` valores como entrada para a primeira saída, então os timestamps para a saída começarão depois disso. - -```python -train_timestamps = energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)].index[timesteps-1:] -test_timestamps = energy[test_start_dt:].index[timesteps-1:] - -print(len(train_timestamps), len(test_timestamps)) -``` - -```output -1412 44 -``` - -Plotar as previsões para os dados de treinamento: - -```python -plt.figure(figsize=(25,6)) -plt.plot(train_timestamps, y_train, color = 'red', linewidth=2.0, alpha = 0.6) -plt.plot(train_timestamps, y_train_pred, color = 'blue', linewidth=0.8) -plt.legend(['Actual','Predicted']) -plt.xlabel('Timestamp') -plt.title("Training data prediction") -plt.show() -``` - -![previsão dos dados de treinamento](../../../../7-TimeSeries/3-SVR/images/train-data-predict.png) - -Imprimir MAPE para os dados de treinamento - -```python -print('MAPE for training data: ', mape(y_train_pred, y_train)*100, '%') -``` - -```output -MAPE for training data: 1.7195710200875551 % -``` - -Plotar as previsões para os dados de teste - -```python -plt.figure(figsize=(10,3)) -plt.plot(test_timestamps, y_test, color = 'red', linewidth=2.0, alpha = 0.6) -plt.plot(test_timestamps, y_test_pred, color = 'blue', linewidth=0.8) -plt.legend(['Actual','Predicted']) -plt.xlabel('Timestamp') -plt.show() -``` - -![previsão dos dados de teste](../../../../7-TimeSeries/3-SVR/images/test-data-predict.png) - -Imprimir MAPE para os dados de teste - -```python -print('MAPE for testing data: ', mape(y_test_pred, y_test)*100, '%') -``` - -```output -MAPE for testing data: 1.2623790187854018 % -``` - -🏆 Você obteve um resultado muito bom no conjunto de dados de teste! - -### Verificar desempenho do modelo no conjunto de dados completo [^1] - -```python -# Extracting load values as numpy array -data = energy.copy().values - -# Scaling -data = scaler.transform(data) - -# Transforming to 2D tensor as per model input requirement -data_timesteps=np.array([[j for j in data[i:i+timesteps]] for i in range(0,len(data)-timesteps+1)])[:,:,0] -print("Tensor shape: ", data_timesteps.shape) - -# Selecting inputs and outputs from data -X, Y = data_timesteps[:,:timesteps-1],data_timesteps[:,[timesteps-1]] -print("X shape: ", X.shape,"\nY shape: ", Y.shape) -``` - -```output -Tensor shape: (26300, 5) -X shape: (26300, 4) -Y shape: (26300, 1) -``` - -```python -# Make model predictions -Y_pred = model.predict(X).reshape(-1,1) - -# Inverse scale and reshape -Y_pred = scaler.inverse_transform(Y_pred) -Y = scaler.inverse_transform(Y) -``` - -```python -plt.figure(figsize=(30,8)) -plt.plot(Y, color = 'red', linewidth=2.0, alpha = 0.6) -plt.plot(Y_pred, color = 'blue', linewidth=0.8) -plt.legend(['Actual','Predicted']) -plt.xlabel('Timestamp') -plt.show() -``` - -![previsão dos dados completos](../../../../7-TimeSeries/3-SVR/images/full-data-predict.png) - -```python -print('MAPE: ', mape(Y_pred, Y)*100, '%') -``` - -```output -MAPE: 2.0572089029888656 % -``` - -🏆 Gráficos muito bons, mostrando um modelo com boa precisão. Parabéns! - ---- - -## 🚀Desafio - -- Tente ajustar os hiperparâmetros (gamma, C, epsilon) ao criar o modelo e avalie os dados para ver qual conjunto de hiperparâmetros oferece os melhores resultados nos dados de teste. Para saber mais sobre esses hiperparâmetros, você pode consultar o documento [aqui](https://scikit-learn.org/stable/modules/svm.html#parameters-of-the-rbf-kernel). -- Tente usar diferentes funções kernel para o modelo e analise seus desempenhos no conjunto de dados. Um documento útil pode ser encontrado [aqui](https://scikit-learn.org/stable/modules/svm.html#kernel-functions). -- Tente usar diferentes valores para `timesteps` para que o modelo olhe para trás e faça previsões. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Esta lição foi para introduzir a aplicação do SVR na previsão de séries temporais. Para ler mais sobre SVR, você pode consultar [este blog](https://www.analyticsvidhya.com/blog/2020/03/support-vector-regression-tutorial-for-machine-learning/). Esta [documentação sobre scikit-learn](https://scikit-learn.org/stable/modules/svm.html) fornece uma explicação mais abrangente sobre SVMs em geral, [SVRs](https://scikit-learn.org/stable/modules/svm.html#regression) e também outros detalhes de implementação, como as diferentes [funções kernel](https://scikit-learn.org/stable/modules/svm.html#kernel-functions) que podem ser usadas e seus parâmetros. - -## Tarefa - -[Um novo modelo SVR](assignment.md) - -## Créditos - -[^1]: O texto, código e saída nesta seção foram contribuídos por [@AnirbanMukherjeeXD](https://github.com/AnirbanMukherjeeXD) -[^2]: O texto, código e saída nesta seção foram retirados de [ARIMA](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/3-SVR/assignment.md b/translations/br/7-TimeSeries/3-SVR/assignment.md deleted file mode 100644 index 14d679d56..000000000 --- a/translations/br/7-TimeSeries/3-SVR/assignment.md +++ /dev/null @@ -1,27 +0,0 @@ - -# Um novo modelo SVR - -## Instruções [^1] - -Agora que você construiu um modelo SVR, crie um novo com dados frescos (experimente um dos [conjuntos de dados da Duke](http://www2.stat.duke.edu/~mw/ts_data_sets.html)). Anote seu trabalho em um notebook, visualize os dados e seu modelo, e teste sua precisão usando gráficos apropriados e MAPE. Além disso, experimente ajustar os diferentes hiperparâmetros e usar valores diferentes para os timesteps. - -## Rubrica [^1] - -| Critérios | Exemplares | Adequado | Precisa de Melhorias | -| --------- | ----------------------------------------------------------- | --------------------------------------------------------- | ----------------------------------- | -| | Um notebook é apresentado com um modelo SVR construído, testado e explicado com visualizações e precisão declarada. | O notebook apresentado não está anotado ou contém erros. | Um notebook incompleto é apresentado | - -[^1]: O texto nesta seção foi baseado na [tarefa de ARIMA](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA/assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/7-TimeSeries/3-SVR/solution/notebook.ipynb b/translations/br/7-TimeSeries/3-SVR/solution/notebook.ipynb deleted file mode 100644 index 889fb54a3..000000000 --- a/translations/br/7-TimeSeries/3-SVR/solution/notebook.ipynb +++ /dev/null @@ -1,1019 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "fv9OoQsMFk5A" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Neste notebook, demonstramos como:\n", - "\n", - "- preparar dados de séries temporais 2D para treinar um modelo de regressão SVM \n", - "- implementar SVR utilizando o kernel RBF \n", - "- avaliar o modelo usando gráficos e MAPE \n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Importando módulos\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import sys\n", - "sys.path.append('../../')" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": { - "id": "M687KNlQFp0-" - }, - "outputs": [], - "source": [ - "import os\n", - "import warnings\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import pandas as pd\n", - "import datetime as dt\n", - "import math\n", - "\n", - "from sklearn.svm import SVR\n", - "from sklearn.preprocessing import MinMaxScaler\n", - "from common.utils import load_data, mape" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Cj-kfVdMGjWP" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8fywSjC6GsRz" - }, - "source": [ - "### Carregar dados\n" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "aBDkEB11Fumg", - "outputId": "99cf7987-0509-4b73-8cc2-75d7da0d2740" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2012-01-01 00:00:002698.0
2012-01-01 01:00:002558.0
2012-01-01 02:00:002444.0
2012-01-01 03:00:002402.0
2012-01-01 04:00:002403.0
\n", - "
" - ], - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2698.0\n", - "2012-01-01 01:00:00 2558.0\n", - "2012-01-01 02:00:00 2444.0\n", - "2012-01-01 03:00:00 2402.0\n", - "2012-01-01 04:00:00 2403.0" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "energy = load_data('../../data')[['load']]\n", - "energy.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "O0BWP13rGnh4" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 486 - }, - "id": "hGaNPKu_Gidk", - "outputId": "7f89b326-9057-4f49-efbe-cb100ebdf76d" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "IPuNor4eGwYY" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "id": "ysvsNyONGt0Q" - }, - "outputs": [], - "source": [ - "train_start_dt = '2014-11-01 00:00:00'\n", - "test_start_dt = '2014-12-30 00:00:00'" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 548 - }, - "id": "SsfdLoPyGy9w", - "outputId": "d6d6c25b-b1f4-47e5-91d1-707e043237d7" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \\\n", - " .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \\\n", - " .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "XbFTqBw6G1Ch" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora, você precisa preparar os dados para treinamento realizando a filtragem e o escalonamento dos seus dados.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cYivRdQpHDj3", - "outputId": "a138f746-461c-4fd6-bfa6-0cee094c4aa1" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Training data shape: (1416, 1)\n", - "Test data shape: (48, 1)\n" - ] - } - ], - "source": [ - "train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']]\n", - "test = energy.copy()[energy.index >= test_start_dt][['load']]\n", - "\n", - "print('Training data shape: ', train.shape)\n", - "print('Test data shape: ', test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Escale os dados para estarem no intervalo (0, 1).\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "3DNntGQnZX8G", - "outputId": "210046bc-7a66-4ccd-d70d-aa4a7309949c" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-11-01 00:00:000.101611
2014-11-01 01:00:000.065801
2014-11-01 02:00:000.046106
2014-11-01 03:00:000.042525
2014-11-01 04:00:000.059087
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-11-01 00:00:00 0.101611\n", - "2014-11-01 01:00:00 0.065801\n", - "2014-11-01 02:00:00 0.046106\n", - "2014-11-01 03:00:00 0.042525\n", - "2014-11-01 04:00:00 0.059087" - ] - }, - "execution_count": 8, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "scaler = MinMaxScaler()\n", - "train['load'] = scaler.fit_transform(train)\n", - "train.head(5)" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 206 - }, - "id": "26Yht-rzZexe", - "outputId": "20326077-a38a-4e78-cc5b-6fd7af95d301" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-12-30 00:00:000.329454
2014-12-30 01:00:000.290063
2014-12-30 02:00:000.273948
2014-12-30 03:00:000.268129
2014-12-30 04:00:000.302596
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-12-30 00:00:00 0.329454\n", - "2014-12-30 01:00:00 0.290063\n", - "2014-12-30 02:00:00 0.273948\n", - "2014-12-30 03:00:00 0.268129\n", - "2014-12-30 04:00:00 0.302596" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "test['load'] = scaler.transform(test)\n", - "test.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "x0n6jqxOQ41Z" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "fdmxTZtOQ8xs" - }, - "source": [ - "Para o nosso SVR, transformamos os dados de entrada para o formato `[batch, timesteps]`. Assim, remodelamos os `train_data` e `test_data` existentes de forma que haja uma nova dimensão que se refira aos timesteps. Para o nosso exemplo, consideramos `timesteps = 5`. Assim, as entradas para o modelo são os dados dos primeiros 4 timesteps, e a saída será os dados do 5º timestep.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": { - "id": "Rpju-Sc2HFm0" - }, - "outputs": [], - "source": [ - "# Converting to numpy arrays\n", - "\n", - "train_data = train.values\n", - "test_data = test.values" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [], - "source": [ - "# Selecting the timesteps\n", - "\n", - "timesteps=5" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "O-JrsrsVJhUQ", - "outputId": "c90dbe71-bacc-4ec4-b452-f82fe5aefaef" - }, - "outputs": [ - { - "data": { - "text/plain": [ - "(1412, 5)" - ] - }, - "execution_count": 12, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Converting data to 2D tensor\n", - "\n", - "train_data_timesteps=np.array([[j for j in train_data[i:i+timesteps]] for i in range(0,len(train_data)-timesteps+1)])[:,:,0]\n", - "train_data_timesteps.shape" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "exJD8AI7KE4g", - "outputId": "ce90260c-f327-427d-80f2-77307b5a6318" - }, - "outputs": [ - { - "data": { - "text/plain": [ - "(44, 5)" - ] - }, - "execution_count": 13, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Converting test data to 2D tensor\n", - "\n", - "test_data_timesteps=np.array([[j for j in test_data[i:i+timesteps]] for i in range(0,len(test_data)-timesteps+1)])[:,:,0]\n", - "test_data_timesteps.shape" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": { - "id": "2u0R2sIsLuq5" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(1412, 4) (1412, 1)\n", - "(44, 4) (44, 1)\n" - ] - } - ], - "source": [ - "x_train, y_train = train_data_timesteps[:,:timesteps-1],train_data_timesteps[:,[timesteps-1]]\n", - "x_test, y_test = test_data_timesteps[:,:timesteps-1],test_data_timesteps[:,[timesteps-1]]\n", - "\n", - "print(x_train.shape, y_train.shape)\n", - "print(x_test.shape, y_test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8wIPOtAGLZlh" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": { - "id": "EhA403BEPEiD" - }, - "outputs": [], - "source": [ - "# Create model using RBF kernel\n", - "\n", - "model = SVR(kernel='rbf',gamma=0.5, C=10, epsilon = 0.05)" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "GS0UA3csMbqp", - "outputId": "d86b6f05-5742-4c1d-c2db-c40510bd4f0d" - }, - "outputs": [ - { - "data": { - "text/plain": [ - "SVR(C=10, cache_size=200, coef0=0.0, degree=3, epsilon=0.05, gamma=0.5,\n", - " kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False)" - ] - }, - "execution_count": 16, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Fit model on training data\n", - "\n", - "model.fit(x_train, y_train[:,0])" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Rz_x8S3UrlcF" - }, - "source": [ - "### Fazer previsão do modelo\n" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XR0gnt3MnuYS", - "outputId": "157e40ab-9a23-4b66-a885-0d52a24b2364" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(1412, 1) (44, 1)\n" - ] - } - ], - "source": [ - "# Making predictions\n", - "\n", - "y_train_pred = model.predict(x_train).reshape(-1,1)\n", - "y_test_pred = model.predict(x_test).reshape(-1,1)\n", - "\n", - "print(y_train_pred.shape, y_test_pred.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "_2epncg-SGzr" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "1412 44\n" - ] - } - ], - "source": [ - "# Scaling the predictions\n", - "\n", - "y_train_pred = scaler.inverse_transform(y_train_pred)\n", - "y_test_pred = scaler.inverse_transform(y_test_pred)\n", - "\n", - "print(len(y_train_pred), len(y_test_pred))" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xmm_YLXhq7gV", - "outputId": "18392f64-4029-49ac-c71a-a4e2411152a1" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "1412 44\n" - ] - } - ], - "source": [ - "# Scaling the original values\n", - "\n", - "y_train = scaler.inverse_transform(y_train)\n", - "y_test = scaler.inverse_transform(y_test)\n", - "\n", - "print(len(y_train), len(y_test))" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "u3LBj93coHEi", - "outputId": "d4fd49e8-8c6e-4bb0-8ef9-ca0b26d725b4" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "1412 44\n" - ] - } - ], - "source": [ - "# Extract the timesteps for x-axis\n", - "\n", - "train_timestamps = energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)].index[timesteps-1:]\n", - "test_timestamps = energy[test_start_dt:].index[timesteps-1:]\n", - "\n", - "print(len(train_timestamps), len(test_timestamps))" - ] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.figure(figsize=(25,6))\n", - "plt.plot(train_timestamps, y_train, color = 'red', linewidth=2.0, alpha = 0.6)\n", - "plt.plot(train_timestamps, y_train_pred, color = 'blue', linewidth=0.8)\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.title(\"Training data prediction\")\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "LnhzcnYtXHCm", - "outputId": "f5f0d711-f18b-4788-ad21-d4470ea2c02b" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "MAPE for training data: 1.7195710200875551 %\n" - ] - } - ], - "source": [ - "print('MAPE for training data: ', mape(y_train_pred, y_train)*100, '%')" - ] - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 225 - }, - "id": "53Q02FoqQH4V", - "outputId": "53e2d59b-5075-4765-ad9e-aed56c966583" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.figure(figsize=(10,3))\n", - "plt.plot(test_timestamps, y_test, color = 'red', linewidth=2.0, alpha = 0.6)\n", - "plt.plot(test_timestamps, y_test_pred, color = 'blue', linewidth=0.8)\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "clOAUH-SXCJG", - "outputId": "a3aa85ff-126a-4a4a-cd9e-90b9cc465ef5" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "MAPE for testing data: 1.2623790187854018 %\n" - ] - } - ], - "source": [ - "print('MAPE for testing data: ', mape(y_test_pred, y_test)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "DHlKvVCId5ue" - }, - "source": [ - "## Previsão do conjunto de dados completo\n" - ] - }, - { - "cell_type": "code", - "execution_count": 25, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cOFJ45vreO0N", - "outputId": "35628e33-ecf9-4966-8036-f7ea86db6f16" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Tensor shape: (26300, 5)\n", - "X shape: (26300, 4) \n", - "Y shape: (26300, 1)\n" - ] - } - ], - "source": [ - "# Extracting load values as numpy array\n", - "data = energy.copy().values\n", - "\n", - "# Scaling\n", - "data = scaler.transform(data)\n", - "\n", - "# Transforming to 2D tensor as per model input requirement\n", - "data_timesteps=np.array([[j for j in data[i:i+timesteps]] for i in range(0,len(data)-timesteps+1)])[:,:,0]\n", - "print(\"Tensor shape: \", data_timesteps.shape)\n", - "\n", - "# Selecting inputs and outputs from data\n", - "X, Y = data_timesteps[:,:timesteps-1],data_timesteps[:,[timesteps-1]]\n", - "print(\"X shape: \", X.shape,\"\\nY shape: \", Y.shape)" - ] - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": { - "id": "ESSAdQgwexIi" - }, - "outputs": [], - "source": [ - "# Make model predictions\n", - "Y_pred = model.predict(X).reshape(-1,1)\n", - "\n", - "# Inverse scale and reshape\n", - "Y_pred = scaler.inverse_transform(Y_pred)\n", - "Y = scaler.inverse_transform(Y)" - ] - }, - { - "cell_type": "code", - "execution_count": 27, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 328 - }, - "id": "M_qhihN0RVVX", - "outputId": "a89cb23e-1d35-437f-9d63-8b8907e12f80" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.figure(figsize=(30,8))\n", - "plt.plot(Y, color = 'red', linewidth=2.0, alpha = 0.6)\n", - "plt.plot(Y_pred, color = 'blue', linewidth=1)\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 28, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "AcN7pMYXVGTK", - "outputId": "7e1c2161-47ce-496c-9d86-7ad9ae0df770" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "MAPE: 2.0572089029888656 %\n" - ] - } - ], - "source": [ - "print('MAPE: ', mape(Y_pred, Y)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "accelerator": "GPU", - "colab": { - "collapsed_sections": [], - "name": "Recurrent_Neural_Networks.ipynb", - "provenance": [] - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - }, - "coopTranslator": { - "original_hash": "f8f3967282314d3995245835bdaa8418", - "translation_date": "2025-08-29T23:23:13+00:00", - "source_file": "7-TimeSeries/3-SVR/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/br/7-TimeSeries/3-SVR/working/notebook.ipynb b/translations/br/7-TimeSeries/3-SVR/working/notebook.ipynb deleted file mode 100644 index ac7caa691..000000000 --- a/translations/br/7-TimeSeries/3-SVR/working/notebook.ipynb +++ /dev/null @@ -1,695 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "fv9OoQsMFk5A" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Neste notebook, demonstramos como:\n", - "\n", - "- preparar dados de séries temporais 2D para treinar um modelo de regressão SVM\n", - "- implementar SVR usando o kernel RBF\n", - "- avaliar o modelo utilizando gráficos e MAPE\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Importando módulos\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import sys\n", - "sys.path.append('../../')" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": { - "id": "M687KNlQFp0-" - }, - "outputs": [], - "source": [ - "import os\n", - "import warnings\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import pandas as pd\n", - "import datetime as dt\n", - "import math\n", - "\n", - "from sklearn.svm import SVR\n", - "from sklearn.preprocessing import MinMaxScaler\n", - "from common.utils import load_data, mape" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Cj-kfVdMGjWP" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8fywSjC6GsRz" - }, - "source": [ - "### Carregar dados\n" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "aBDkEB11Fumg", - "outputId": "99cf7987-0509-4b73-8cc2-75d7da0d2740" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2012-01-01 00:00:002698.0
2012-01-01 01:00:002558.0
2012-01-01 02:00:002444.0
2012-01-01 03:00:002402.0
2012-01-01 04:00:002403.0
\n", - "
" - ], - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2698.0\n", - "2012-01-01 01:00:00 2558.0\n", - "2012-01-01 02:00:00 2444.0\n", - "2012-01-01 03:00:00 2402.0\n", - "2012-01-01 04:00:00 2403.0" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "energy = load_data('../../data')[['load']]\n", - "energy.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "O0BWP13rGnh4" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 486 - }, - "id": "hGaNPKu_Gidk", - "outputId": "7f89b326-9057-4f49-efbe-cb100ebdf76d" - }, - "outputs": [], - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "IPuNor4eGwYY" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "ysvsNyONGt0Q" - }, - "outputs": [], - "source": [ - "train_start_dt = '2014-11-01 00:00:00'\n", - "test_start_dt = '2014-12-30 00:00:00'" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 548 - }, - "id": "SsfdLoPyGy9w", - "outputId": "d6d6c25b-b1f4-47e5-91d1-707e043237d7" - }, - "outputs": [], - "source": [ - "energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \\\n", - " .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \\\n", - " .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "XbFTqBw6G1Ch" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora, você precisa preparar os dados para treinamento realizando a filtragem e a escalonamento dos seus dados.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cYivRdQpHDj3", - "outputId": "a138f746-461c-4fd6-bfa6-0cee094c4aa1" - }, - "outputs": [], - "source": [ - "train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']]\n", - "test = energy.copy()[energy.index >= test_start_dt][['load']]\n", - "\n", - "print('Training data shape: ', train.shape)\n", - "print('Test data shape: ', test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Escalone os dados para estar na faixa (0, 1).\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "3DNntGQnZX8G", - "outputId": "210046bc-7a66-4ccd-d70d-aa4a7309949c" - }, - "outputs": [], - "source": [ - "scaler = MinMaxScaler()\n", - "train['load'] = scaler.fit_transform(train)\n", - "train.head(5)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 206 - }, - "id": "26Yht-rzZexe", - "outputId": "20326077-a38a-4e78-cc5b-6fd7af95d301" - }, - "outputs": [], - "source": [ - "test['load'] = scaler.transform(test)\n", - "test.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "x0n6jqxOQ41Z" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "fdmxTZtOQ8xs" - }, - "source": [ - "Para nosso SVR, transformamos os dados de entrada para o formato `[batch, timesteps]`. Assim, remodelamos os dados existentes `train_data` e `test_data` de forma que haja uma nova dimensão que se refere aos timesteps. Para nosso exemplo, consideramos `timesteps = 5`. Assim, as entradas para o modelo são os dados dos primeiros 4 timesteps, e a saída será os dados do 5º timestep.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "Rpju-Sc2HFm0" - }, - "outputs": [], - "source": [ - "# Converting to numpy arrays\n", - "\n", - "train_data = train.values\n", - "test_data = test.values" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# Selecting the timesteps\n", - "\n", - "timesteps=None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "O-JrsrsVJhUQ", - "outputId": "c90dbe71-bacc-4ec4-b452-f82fe5aefaef" - }, - "outputs": [], - "source": [ - "# Converting data to 2D tensor\n", - "\n", - "train_data_timesteps=None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "exJD8AI7KE4g", - "outputId": "ce90260c-f327-427d-80f2-77307b5a6318" - }, - "outputs": [], - "source": [ - "# Converting test data to 2D tensor\n", - "\n", - "test_data_timesteps=None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "2u0R2sIsLuq5" - }, - "outputs": [], - "source": [ - "x_train, y_train = None\n", - "x_test, y_test = None\n", - "\n", - "print(x_train.shape, y_train.shape)\n", - "print(x_test.shape, y_test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8wIPOtAGLZlh" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "EhA403BEPEiD" - }, - "outputs": [], - "source": [ - "# Create model using RBF kernel\n", - "\n", - "model = None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "GS0UA3csMbqp", - "outputId": "d86b6f05-5742-4c1d-c2db-c40510bd4f0d" - }, - "outputs": [], - "source": [ - "# Fit model on training data" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Rz_x8S3UrlcF" - }, - "source": [ - "### Fazer previsão do modelo\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XR0gnt3MnuYS", - "outputId": "157e40ab-9a23-4b66-a885-0d52a24b2364" - }, - "outputs": [], - "source": [ - "# Making predictions\n", - "\n", - "y_train_pred = None\n", - "y_test_pred = None" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "_2epncg-SGzr" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# Scaling the predictions\n", - "\n", - "y_train_pred = scaler.inverse_transform(y_train_pred)\n", - "y_test_pred = scaler.inverse_transform(y_test_pred)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xmm_YLXhq7gV", - "outputId": "18392f64-4029-49ac-c71a-a4e2411152a1" - }, - "outputs": [], - "source": [ - "# Scaling the original values\n", - "\n", - "y_train = scaler.inverse_transform(y_train)\n", - "y_test = scaler.inverse_transform(y_test)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "u3LBj93coHEi", - "outputId": "d4fd49e8-8c6e-4bb0-8ef9-ca0b26d725b4" - }, - "outputs": [], - "source": [ - "# Extract the timesteps for x-axis\n", - "\n", - "train_timestamps = None\n", - "test_timestamps = None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "plt.figure(figsize=(25,6))\n", - "# plot original output\n", - "# plot predicted output\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.title(\"Training data prediction\")\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "LnhzcnYtXHCm", - "outputId": "f5f0d711-f18b-4788-ad21-d4470ea2c02b" - }, - "outputs": [], - "source": [ - "print('MAPE for training data: ', mape(y_train_pred, y_train)*100, '%')" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 225 - }, - "id": "53Q02FoqQH4V", - "outputId": "53e2d59b-5075-4765-ad9e-aed56c966583" - }, - "outputs": [], - "source": [ - "plt.figure(figsize=(10,3))\n", - "# plot original output\n", - "# plot predicted output\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "clOAUH-SXCJG", - "outputId": "a3aa85ff-126a-4a4a-cd9e-90b9cc465ef5" - }, - "outputs": [], - "source": [ - "print('MAPE for testing data: ', mape(y_test_pred, y_test)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "DHlKvVCId5ue" - }, - "source": [ - "## Previsão do conjunto de dados completo\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cOFJ45vreO0N", - "outputId": "35628e33-ecf9-4966-8036-f7ea86db6f16" - }, - "outputs": [], - "source": [ - "# Extracting load values as numpy array\n", - "data = None\n", - "\n", - "# Scaling\n", - "data = None\n", - "\n", - "# Transforming to 2D tensor as per model input requirement\n", - "data_timesteps=None\n", - "\n", - "# Selecting inputs and outputs from data\n", - "X, Y = None, None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "ESSAdQgwexIi" - }, - "outputs": [], - "source": [ - "# Make model predictions\n", - "\n", - "# Inverse scale and reshape\n", - "Y_pred = None\n", - "Y = None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 328 - }, - "id": "M_qhihN0RVVX", - "outputId": "a89cb23e-1d35-437f-9d63-8b8907e12f80" - }, - "outputs": [], - "source": [ - "plt.figure(figsize=(30,8))\n", - "# plot original output\n", - "# plot predicted output\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "AcN7pMYXVGTK", - "outputId": "7e1c2161-47ce-496c-9d86-7ad9ae0df770" - }, - "outputs": [], - "source": [ - "print('MAPE: ', mape(Y_pred, Y)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "accelerator": "GPU", - "colab": { - "collapsed_sections": [], - "name": "Recurrent_Neural_Networks.ipynb", - "provenance": [] - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - }, - "coopTranslator": { - "original_hash": "e86ce102239a14c44585623b9b924a74", - "translation_date": "2025-08-29T23:24:53+00:00", - "source_file": "7-TimeSeries/3-SVR/working/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/br/7-TimeSeries/README.md b/translations/br/7-TimeSeries/README.md deleted file mode 100644 index f7171862c..000000000 --- a/translations/br/7-TimeSeries/README.md +++ /dev/null @@ -1,37 +0,0 @@ - -# Introdução à previsão de séries temporais - -O que é previsão de séries temporais? Trata-se de prever eventos futuros analisando tendências do passado. - -## Tópico regional: uso mundial de eletricidade ✨ - -Nestes dois módulos, você será introduzido à previsão de séries temporais, uma área um pouco menos conhecida do aprendizado de máquina, mas que é extremamente valiosa para aplicações industriais e empresariais, entre outros campos. Embora redes neurais possam ser usadas para aumentar a utilidade desses modelos, estudaremos o tema no contexto do aprendizado de máquina clássico, já que esses modelos ajudam a prever o desempenho futuro com base no passado. - -Nosso foco regional é o uso de eletricidade no mundo, um conjunto de dados interessante para aprender a prever o consumo futuro de energia com base em padrões de carga anteriores. Você verá como esse tipo de previsão pode ser extremamente útil em um ambiente empresarial. - -![rede elétrica](../../../translated_images/pt-BR/electric-grid.0c21d5214db09ffa.webp) - -Foto de [Peddi Sai hrithik](https://unsplash.com/@shutter_log?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText) de torres elétricas em uma estrada em Rajasthan no [Unsplash](https://unsplash.com/s/photos/electric-india?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText) - -## Módulos - -1. [Introdução à previsão de séries temporais](1-Introduction/README.md) -2. [Construindo modelos ARIMA para séries temporais](2-ARIMA/README.md) -3. [Construindo um Support Vector Regressor para previsão de séries temporais](3-SVR/README.md) - -## Créditos - -"Introdução à previsão de séries temporais" foi escrito com ⚡️ por [Francesca Lazzeri](https://twitter.com/frlazzeri) e [Jen Looper](https://twitter.com/jenlooper). Os notebooks apareceram pela primeira vez online no [repositório "Deep Learning For Time Series" do Azure](https://github.com/Azure/DeepLearningForTimeSeriesForecasting), originalmente escrito por Francesca Lazzeri. O módulo sobre SVR foi escrito por [Anirban Mukherjee](https://github.com/AnirbanMukherjeeXD). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/README.md b/translations/br/8-Reinforcement/1-QLearning/README.md deleted file mode 100644 index 8fcd5533d..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/README.md +++ /dev/null @@ -1,256 +0,0 @@ - -# Introdução ao Aprendizado por Reforço e Q-Learning - -![Resumo do aprendizado por reforço em machine learning em um sketchnote](../../../../sketchnotes/ml-reinforcement.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -O aprendizado por reforço envolve três conceitos importantes: o agente, alguns estados e um conjunto de ações por estado. Ao executar uma ação em um estado específico, o agente recebe uma recompensa. Imagine novamente o jogo de computador Super Mario. Você é o Mario, está em um nível do jogo, parado ao lado de um penhasco. Acima de você há uma moeda. Você, sendo o Mario, em um nível do jogo, em uma posição específica... esse é o seu estado. Mover um passo para a direita (uma ação) o levará para o penhasco, o que resultará em uma pontuação numérica baixa. No entanto, pressionar o botão de pular permitirá que você marque um ponto e continue vivo. Esse é um resultado positivo e deve lhe conceder uma pontuação numérica positiva. - -Usando aprendizado por reforço e um simulador (o jogo), você pode aprender a jogar para maximizar a recompensa, que é permanecer vivo e marcar o maior número de pontos possível. - -[![Introdução ao Aprendizado por Reforço](https://img.youtube.com/vi/lDq_en8RNOo/0.jpg)](https://www.youtube.com/watch?v=lDq_en8RNOo) - -> 🎥 Clique na imagem acima para ouvir Dmitry falar sobre Aprendizado por Reforço - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Pré-requisitos e Configuração - -Nesta lição, experimentaremos com algum código em Python. Você deve ser capaz de executar o código do Jupyter Notebook desta lição, seja no seu computador ou em algum lugar na nuvem. - -Você pode abrir [o notebook da lição](https://github.com/microsoft/ML-For-Beginners/blob/main/8-Reinforcement/1-QLearning/notebook.ipynb) e acompanhar esta lição para construir. - -> **Nota:** Se você estiver abrindo este código na nuvem, também precisará buscar o arquivo [`rlboard.py`](https://github.com/microsoft/ML-For-Beginners/blob/main/8-Reinforcement/1-QLearning/rlboard.py), que é usado no código do notebook. Adicione-o ao mesmo diretório do notebook. - -## Introdução - -Nesta lição, exploraremos o mundo de **[Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf)**, inspirado por um conto musical de fadas de um compositor russo, [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). Usaremos o **Aprendizado por Reforço** para permitir que Pedro explore seu ambiente, colete maçãs saborosas e evite encontrar o lobo. - -O **Aprendizado por Reforço** (RL) é uma técnica de aprendizado que nos permite aprender o comportamento ideal de um **agente** em algum **ambiente** realizando muitos experimentos. Um agente nesse ambiente deve ter algum **objetivo**, definido por uma **função de recompensa**. - -## O ambiente - -Para simplificar, vamos considerar o mundo de Pedro como um tabuleiro quadrado de tamanho `largura` x `altura`, como este: - -![Ambiente de Pedro](../../../../8-Reinforcement/1-QLearning/images/environment.png) - -Cada célula neste tabuleiro pode ser: - -* **chão**, onde Pedro e outras criaturas podem andar. -* **água**, onde obviamente você não pode andar. -* uma **árvore** ou **grama**, um lugar onde você pode descansar. -* uma **maçã**, que representa algo que Pedro ficaria feliz em encontrar para se alimentar. -* um **lobo**, que é perigoso e deve ser evitado. - -Há um módulo Python separado, [`rlboard.py`](https://github.com/microsoft/ML-For-Beginners/blob/main/8-Reinforcement/1-QLearning/rlboard.py), que contém o código para trabalhar com este ambiente. Como este código não é importante para entender nossos conceitos, importaremos o módulo e o usaremos para criar o tabuleiro de exemplo (bloco de código 1): - -```python -from rlboard import * - -width, height = 8,8 -m = Board(width,height) -m.randomize(seed=13) -m.plot() -``` - -Este código deve imprimir uma imagem do ambiente semelhante à mostrada acima. - -## Ações e política - -No nosso exemplo, o objetivo de Pedro seria encontrar uma maçã, enquanto evita o lobo e outros obstáculos. Para isso, ele pode essencialmente andar pelo tabuleiro até encontrar uma maçã. - -Portanto, em qualquer posição, ele pode escolher entre uma das seguintes ações: cima, baixo, esquerda e direita. - -Definiremos essas ações como um dicionário e as mapearemos para pares de mudanças de coordenadas correspondentes. Por exemplo, mover para a direita (`R`) corresponderia ao par `(1,0)`. (bloco de código 2): - -```python -actions = { "U" : (0,-1), "D" : (0,1), "L" : (-1,0), "R" : (1,0) } -action_idx = { a : i for i,a in enumerate(actions.keys()) } -``` - -Resumindo, a estratégia e o objetivo deste cenário são os seguintes: - -- **A estratégia** do nosso agente (Pedro) é definida por uma chamada **política**. Uma política é uma função que retorna a ação em qualquer estado dado. No nosso caso, o estado do problema é representado pelo tabuleiro, incluindo a posição atual do jogador. - -- **O objetivo** do aprendizado por reforço é eventualmente aprender uma boa política que nos permita resolver o problema de forma eficiente. No entanto, como linha de base, vamos considerar a política mais simples chamada **caminhada aleatória**. - -## Caminhada aleatória - -Vamos primeiro resolver nosso problema implementando uma estratégia de caminhada aleatória. Com a caminhada aleatória, escolheremos aleatoriamente a próxima ação entre as ações permitidas, até alcançarmos a maçã (bloco de código 3). - -1. Implemente a caminhada aleatória com o código abaixo: - - ```python - def random_policy(m): - return random.choice(list(actions)) - - def walk(m,policy,start_position=None): - n = 0 # number of steps - # set initial position - if start_position: - m.human = start_position - else: - m.random_start() - while True: - if m.at() == Board.Cell.apple: - return n # success! - if m.at() in [Board.Cell.wolf, Board.Cell.water]: - return -1 # eaten by wolf or drowned - while True: - a = actions[policy(m)] - new_pos = m.move_pos(m.human,a) - if m.is_valid(new_pos) and m.at(new_pos)!=Board.Cell.water: - m.move(a) # do the actual move - break - n+=1 - - walk(m,random_policy) - ``` - - A chamada para `walk` deve retornar o comprimento do caminho correspondente, que pode variar de uma execução para outra. - -1. Execute o experimento de caminhada várias vezes (digamos, 100) e imprima as estatísticas resultantes (bloco de código 4): - - ```python - def print_statistics(policy): - s,w,n = 0,0,0 - for _ in range(100): - z = walk(m,policy) - if z<0: - w+=1 - else: - s += z - n += 1 - print(f"Average path length = {s/n}, eaten by wolf: {w} times") - - print_statistics(random_policy) - ``` - - Note que o comprimento médio de um caminho é em torno de 30-40 passos, o que é bastante, dado que a distância média até a maçã mais próxima é de cerca de 5-6 passos. - - Você também pode ver como é o movimento de Pedro durante a caminhada aleatória: - - ![Caminhada Aleatória de Pedro](../../../../8-Reinforcement/1-QLearning/images/random_walk.gif) - -## Função de recompensa - -Para tornar nossa política mais inteligente, precisamos entender quais movimentos são "melhores" que outros. Para isso, precisamos definir nosso objetivo. - -O objetivo pode ser definido em termos de uma **função de recompensa**, que retornará algum valor de pontuação para cada estado. Quanto maior o número, melhor a função de recompensa. (bloco de código 5) - -```python -move_reward = -0.1 -goal_reward = 10 -end_reward = -10 - -def reward(m,pos=None): - pos = pos or m.human - if not m.is_valid(pos): - return end_reward - x = m.at(pos) - if x==Board.Cell.water or x == Board.Cell.wolf: - return end_reward - if x==Board.Cell.apple: - return goal_reward - return move_reward -``` - -Uma coisa interessante sobre funções de recompensa é que, na maioria dos casos, *só recebemos uma recompensa substancial no final do jogo*. Isso significa que nosso algoritmo deve, de alguma forma, lembrar os "bons" passos que levaram a uma recompensa positiva no final e aumentar sua importância. Da mesma forma, todos os movimentos que levam a resultados ruins devem ser desencorajados. - -## Q-Learning - -O algoritmo que discutiremos aqui é chamado de **Q-Learning**. Neste algoritmo, a política é definida por uma função (ou uma estrutura de dados) chamada de **Q-Table**. Ela registra a "qualidade" de cada uma das ações em um determinado estado. - -É chamada de Q-Table porque muitas vezes é conveniente representá-la como uma tabela ou matriz multidimensional. Como nosso tabuleiro tem dimensões `largura` x `altura`, podemos representar a Q-Table usando um array numpy com forma `largura` x `altura` x `len(actions)`: (bloco de código 6) - -```python -Q = np.ones((width,height,len(actions)),dtype=np.float)*1.0/len(actions) -``` - -Observe que inicializamos todos os valores da Q-Table com um valor igual, no nosso caso - 0.25. Isso corresponde à política de "caminhada aleatória", porque todos os movimentos em cada estado são igualmente bons. Podemos passar a Q-Table para a função `plot` para visualizar a tabela no tabuleiro: `m.plot(Q)`. - -![Ambiente de Pedro](../../../../8-Reinforcement/1-QLearning/images/env_init.png) - -No centro de cada célula há uma "seta" que indica a direção preferida de movimento. Como todas as direções são iguais, é exibido um ponto. - -Agora precisamos executar a simulação, explorar nosso ambiente e aprender uma melhor distribuição de valores na Q-Table, o que nos permitirá encontrar o caminho para a maçã muito mais rapidamente. - -## Essência do Q-Learning: Equação de Bellman - -Uma vez que começamos a nos mover, cada ação terá uma recompensa correspondente, ou seja, teoricamente podemos selecionar a próxima ação com base na maior recompensa imediata. No entanto, na maioria dos estados, o movimento não alcançará nosso objetivo de chegar à maçã, e assim não podemos decidir imediatamente qual direção é melhor. - -> Lembre-se de que não é o resultado imediato que importa, mas sim o resultado final, que obteremos no final da simulação. - -Para levar em conta essa recompensa atrasada, precisamos usar os princípios da **[programação dinâmica](https://en.wikipedia.org/wiki/Dynamic_programming)**, que nos permitem pensar sobre nosso problema de forma recursiva. - -Suponha que estamos agora no estado *s* e queremos nos mover para o próximo estado *s'*. Ao fazer isso, receberemos a recompensa imediata *r(s,a)*, definida pela função de recompensa, mais alguma recompensa futura. Se supusermos que nossa Q-Table reflete corretamente a "atratividade" de cada ação, então no estado *s'* escolheremos uma ação *a* que corresponda ao valor máximo de *Q(s',a')*. Assim, a melhor recompensa futura possível que poderíamos obter no estado *s* será definida como `max` - -## Verificando a política - -Como a Q-Table lista a "atratividade" de cada ação em cada estado, é bastante fácil usá-la para definir a navegação eficiente em nosso mundo. No caso mais simples, podemos selecionar a ação correspondente ao maior valor da Q-Table: (bloco de código 9) - -```python -def qpolicy_strict(m): - x,y = m.human - v = probs(Q[x,y]) - a = list(actions)[np.argmax(v)] - return a - -walk(m,qpolicy_strict) -``` - -> Se você tentar o código acima várias vezes, pode perceber que, às vezes, ele "trava", e você precisa pressionar o botão STOP no notebook para interrompê-lo. Isso acontece porque podem haver situações em que dois estados "apontam" um para o outro em termos de valor Q-Ótimo, fazendo com que o agente acabe se movendo entre esses estados indefinidamente. - -## 🚀Desafio - -> **Tarefa 1:** Modifique a função `walk` para limitar o comprimento máximo do caminho a um certo número de passos (digamos, 100), e observe o código acima retornar esse valor de tempos em tempos. - -> **Tarefa 2:** Modifique a função `walk` para que ela não volte aos lugares onde já esteve anteriormente. Isso evitará que `walk` entre em loop, no entanto, o agente ainda pode acabar ficando "preso" em um local do qual não consegue escapar. - -## Navegação - -Uma política de navegação melhor seria aquela que usamos durante o treinamento, que combina exploração e aproveitamento. Nessa política, selecionamos cada ação com uma certa probabilidade, proporcional aos valores na Q-Table. Essa estratégia ainda pode fazer com que o agente volte a uma posição que já explorou, mas, como você pode ver no código abaixo, resulta em um caminho médio muito curto até o local desejado (lembre-se de que `print_statistics` executa a simulação 100 vezes): (bloco de código 10) - -```python -def qpolicy(m): - x,y = m.human - v = probs(Q[x,y]) - a = random.choices(list(actions),weights=v)[0] - return a - -print_statistics(qpolicy) -``` - -Após executar este código, você deve obter um comprimento médio de caminho muito menor do que antes, na faixa de 3-6. - -## Investigando o processo de aprendizado - -Como mencionamos, o processo de aprendizado é um equilíbrio entre exploração e aproveitamento do conhecimento adquirido sobre a estrutura do espaço do problema. Vimos que os resultados do aprendizado (a capacidade de ajudar um agente a encontrar um caminho curto até o objetivo) melhoraram, mas também é interessante observar como o comprimento médio do caminho se comporta durante o processo de aprendizado: - -## Os aprendizados podem ser resumidos como: - -- **O comprimento médio do caminho aumenta**. O que vemos aqui é que, no início, o comprimento médio do caminho aumenta. Isso provavelmente ocorre porque, quando não sabemos nada sobre o ambiente, é mais provável que fiquemos presos em estados ruins, como água ou lobo. À medida que aprendemos mais e começamos a usar esse conhecimento, podemos explorar o ambiente por mais tempo, mas ainda não sabemos muito bem onde estão as maçãs. - -- **O comprimento do caminho diminui, conforme aprendemos mais**. Uma vez que aprendemos o suficiente, torna-se mais fácil para o agente alcançar o objetivo, e o comprimento do caminho começa a diminuir. No entanto, ainda estamos abertos à exploração, então frequentemente nos desviamos do melhor caminho e exploramos novas opções, tornando o caminho mais longo do que o ideal. - -- **O comprimento aumenta abruptamente**. O que também observamos nesse gráfico é que, em algum momento, o comprimento aumentou abruptamente. Isso indica a natureza estocástica do processo e que, em algum momento, podemos "estragar" os coeficientes da Q-Table ao sobrescrevê-los com novos valores. Isso idealmente deve ser minimizado diminuindo a taxa de aprendizado (por exemplo, no final do treinamento, ajustamos os valores da Q-Table apenas por um pequeno valor). - -No geral, é importante lembrar que o sucesso e a qualidade do processo de aprendizado dependem significativamente de parâmetros, como taxa de aprendizado, decaimento da taxa de aprendizado e fator de desconto. Esses parâmetros são frequentemente chamados de **hiperparâmetros**, para distingui-los dos **parâmetros**, que otimizamos durante o treinamento (por exemplo, os coeficientes da Q-Table). O processo de encontrar os melhores valores de hiperparâmetros é chamado de **otimização de hiperparâmetros**, e merece um tópico à parte. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Tarefa -[Um Mundo Mais Realista](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/assignment.md b/translations/br/8-Reinforcement/1-QLearning/assignment.md deleted file mode 100644 index 38770baad..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/assignment.md +++ /dev/null @@ -1,41 +0,0 @@ - -# Um Mundo Mais Realista - -Na nossa situação, Peter conseguia se mover quase sem se cansar ou sentir fome. Em um mundo mais realista, ele precisa sentar e descansar de tempos em tempos, além de se alimentar. Vamos tornar nosso mundo mais realista, implementando as seguintes regras: - -1. Ao se mover de um lugar para outro, Peter perde **energia** e ganha **fadiga**. -2. Peter pode recuperar energia comendo maçãs. -3. Peter pode se livrar da fadiga descansando sob uma árvore ou na grama (ou seja, caminhando para uma posição no tabuleiro com uma árvore ou grama - campo verde). -4. Peter precisa encontrar e matar o lobo. -5. Para matar o lobo, Peter precisa ter certos níveis de energia e fadiga; caso contrário, ele perde a batalha. - -## Instruções - -Use o [notebook.ipynb](notebook.ipynb) original como ponto de partida para sua solução. - -Modifique a função de recompensa acima de acordo com as regras do jogo, execute o algoritmo de aprendizado por reforço para aprender a melhor estratégia para vencer o jogo e compare os resultados do passeio aleatório com o seu algoritmo em termos de número de jogos ganhos e perdidos. - -> **Note**: No seu novo mundo, o estado é mais complexo e, além da posição do humano, também inclui os níveis de fadiga e energia. Você pode optar por representar o estado como uma tupla (Tabuleiro, energia, fadiga), ou definir uma classe para o estado (você também pode querer derivá-la de `Board`), ou até mesmo modificar a classe `Board` original dentro de [rlboard.py](../../../../8-Reinforcement/1-QLearning/rlboard.py). - -Na sua solução, mantenha o código responsável pela estratégia de passeio aleatório e compare os resultados do seu algoritmo com o passeio aleatório ao final. - -> **Note**: Pode ser necessário ajustar os hiperparâmetros para fazer o algoritmo funcionar, especialmente o número de épocas. Como o sucesso no jogo (derrotar o lobo) é um evento raro, você pode esperar um tempo de treinamento significativamente maior. - -## Rubrica - -| Critério | Exemplary | Adequate | Needs Improvement | -| --------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------ | -| | Um notebook é apresentado com a definição das novas regras do mundo, algoritmo de Q-Learning e algumas explicações textuais. O Q-Learning consegue melhorar significativamente os resultados em comparação ao passeio aleatório. | O notebook é apresentado, o Q-Learning é implementado e melhora os resultados em comparação ao passeio aleatório, mas não de forma significativa; ou o notebook está mal documentado e o código não está bem estruturado. | Alguma tentativa de redefinir as regras do mundo foi feita, mas o algoritmo de Q-Learning não funciona, ou a função de recompensa não está totalmente definida. | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/notebook.ipynb b/translations/br/8-Reinforcement/1-QLearning/notebook.ipynb deleted file mode 100644 index dc150d60a..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/notebook.ipynb +++ /dev/null @@ -1,467 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "17e5a668646eabf5aabd0e9bfcf17876", - "translation_date": "2025-08-30T00:03:26+00:00", - "source_file": "8-Reinforcement/1-QLearning/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Pedro e o Lobo: Introdução ao Aprendizado por Reforço\n", - "\n", - "Neste tutorial, vamos aprender como aplicar o aprendizado por reforço a um problema de busca de caminhos. O cenário é inspirado no conto musical [Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf), do compositor russo [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). É a história de um jovem pioneiro, Pedro, que corajosamente sai de sua casa para uma clareira na floresta para perseguir um lobo. Vamos treinar algoritmos de aprendizado de máquina que ajudarão Pedro a explorar a área ao redor e construir um mapa de navegação otimizado.\n", - "\n", - "Primeiro, vamos importar algumas bibliotecas úteis:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random\n", - "import math" - ] - }, - { - "source": [ - "## Visão Geral do Aprendizado por Reforço\n", - "\n", - "**Aprendizado por Reforço** (RL) é uma técnica de aprendizado que nos permite aprender o comportamento ideal de um **agente** em um determinado **ambiente** por meio da realização de vários experimentos. Um agente nesse ambiente deve ter algum **objetivo**, definido por uma **função de recompensa**.\n", - "\n", - "## O Ambiente\n", - "\n", - "Para simplificar, vamos considerar o mundo de Peter como um tabuleiro quadrado de tamanho `width` x `height`. Cada célula nesse tabuleiro pode ser:\n", - "* **chão**, onde Peter e outras criaturas podem caminhar\n", - "* **água**, onde obviamente não se pode caminhar\n", - "* **uma árvore** ou **grama** - um lugar onde você pode descansar\n", - "* **uma maçã**, que representa algo que Peter ficaria feliz em encontrar para se alimentar\n", - "* **um lobo**, que é perigoso e deve ser evitado\n", - "\n", - "Para trabalhar com o ambiente, definiremos uma classe chamada `Board`. Para não sobrecarregar este notebook, movemos todo o código relacionado ao tabuleiro para um módulo separado chamado `rlboard`, que agora iremos importar. Você pode olhar dentro desse módulo para obter mais detalhes sobre os aspectos internos da implementação.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "Vamos agora criar um tabuleiro aleatório e ver como ele fica:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 1" - ] - }, - { - "source": [ - "## Ações e Política\n", - "\n", - "No nosso exemplo, o objetivo de Peter seria encontrar uma maçã, enquanto evita o lobo e outros obstáculos. Defina essas ações como um dicionário e mapeie-as para pares de alterações correspondentes nas coordenadas.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 2" - ] - }, - { - "source": [ - "A estratégia do nosso agente (Peter) é definida por uma chamada **política**. Vamos considerar a política mais simples chamada **caminhada aleatória**.\n", - "\n", - "## Caminhada aleatória\n", - "\n", - "Vamos primeiro resolver nosso problema implementando uma estratégia de caminhada aleatória.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "# Let's run a random walk experiment several times and see the average number of steps taken: code block 3" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 4" - ] - }, - { - "source": [ - "## Função de Recompensa\n", - "\n", - "Para tornar nossa política mais inteligente, precisamos entender quais movimentos são \"melhores\" do que outros.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 5" - ] - }, - { - "source": [ - "## Aprendizado Q\n", - "\n", - "Construa uma Q-Table, ou matriz multidimensional. Como nosso tabuleiro tem dimensões `width` x `height`, podemos representar a Q-Table por um array numpy com formato `width` x `height` x `len(actions)`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 6" - ] - }, - { - "source": [ - "Passe a Q-Table para a função `plot` para visualizar a tabela no tabuleiro:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "error", - "ename": "NameError", - "evalue": "name 'm' is not defined", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mm\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mplot\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mQ\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", - "\u001b[0;31mNameError\u001b[0m: name 'm' is not defined" - ] - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Essência do Q-Learning: Equação de Bellman e Algoritmo de Aprendizado\n", - "\n", - "Escreva um pseudocódigo para o nosso algoritmo de aprendizado:\n", - "\n", - "* Inicialize a Tabela Q (Q-Table) com números iguais para todos os estados e ações\n", - "* Defina a taxa de aprendizado $\\alpha\\leftarrow 1$\n", - "* Repita a simulação várias vezes\n", - " 1. Comece em uma posição aleatória\n", - " 1. Repita\n", - " 1. Selecione uma ação $a$ no estado $s$\n", - " 2. Execute a ação movendo-se para um novo estado $s'$\n", - " 3. Se encontrarmos uma condição de fim de jogo ou a recompensa total for muito baixa - saia da simulação \n", - " 4. Calcule a recompensa $r$ no novo estado\n", - " 5. Atualize a Função Q de acordo com a equação de Bellman: $Q(s,a)\\leftarrow (1-\\alpha)Q(s,a)+\\alpha(r+\\gamma\\max_{a'}Q(s',a'))$\n", - " 6. $s\\leftarrow s'$\n", - " 7. Atualize a recompensa total e diminua $\\alpha$.\n", - "\n", - "## Explorar vs. Explorar\n", - "\n", - "A melhor abordagem é equilibrar entre exploração e exploração. À medida que aprendemos mais sobre o nosso ambiente, estaremos mais propensos a seguir a rota ótima, no entanto, escolhendo o caminho inexplorado de vez em quando.\n", - "\n", - "## Implementação em Python\n", - "\n", - "Agora estamos prontos para implementar o algoritmo de aprendizado. Antes disso, também precisamos de uma função que converta números arbitrários na Tabela Q em um vetor de probabilidades para as ações correspondentes:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 7" - ] - }, - { - "source": [ - "Adicionamos uma pequena quantidade de `eps` ao vetor original para evitar divisão por 0 no caso inicial, quando todos os componentes do vetor são idênticos.\n", - "\n", - "O algoritmo de aprendizado real será executado por 5000 experimentos, também chamados de **épocas**:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 56, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "" - ] - } - ], - "source": [ - "\n", - "from IPython.display import clear_output\n", - "\n", - "lpath = []\n", - "\n", - "# code block 8" - ] - }, - { - "source": [ - "Após executar este algoritmo, a Q-Table deve ser atualizada com valores que definem a atratividade de diferentes ações em cada etapa. Visualize a tabela aqui:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 43, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Verificando a Política\n", - "\n", - "Como a Q-Table lista a \"atratividade\" de cada ação em cada estado, é bastante fácil usá-la para definir a navegação eficiente em nosso mundo. No caso mais simples, podemos simplesmente selecionar a ação correspondente ao maior valor na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ], - "source": [ - "# code block 9" - ] - }, - { - "source": [ - "Se você tentar o código acima várias vezes, pode perceber que, às vezes, ele simplesmente \"trava\", e você precisa pressionar o botão STOP no notebook para interrompê-lo.\n", - "\n", - "> **Tarefa 1:** Modifique a função `walk` para limitar o comprimento máximo do caminho a um certo número de passos (digamos, 100), e observe o código acima retornar esse valor de tempos em tempos.\n", - "\n", - "> **Tarefa 2:** Modifique a função `walk` para que ela não volte aos lugares onde já esteve anteriormente. Isso evitará que `walk` entre em um loop, no entanto, o agente ainda pode acabar \"preso\" em um local do qual não consegue escapar.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 58, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Average path length = 5.31, eaten by wolf: 0 times\n" - ] - } - ], - "source": [ - "\n", - "# code block 10" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 57, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 57 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(lpath)" - ] - }, - { - "source": [ - "## Exercício\n", - "## Um mundo mais realista de Pedro e o Lobo\n", - "\n", - "### Introdução\n", - "\n", - "Neste exercício, você criará um mundo mais realista para a história de Pedro e o Lobo. A ideia é usar programação para simular interações entre os personagens e o ambiente. \n", - "\n", - "### Objetivo\n", - "\n", - "O objetivo é praticar conceitos de programação como classes, métodos e interações entre objetos. Além disso, você aprenderá a modelar um sistema simples que imita o comportamento de um mundo real.\n", - "\n", - "### Passos\n", - "\n", - "1. **Crie as classes principais** \n", - " Comece criando classes para os personagens principais: Pedro, o Lobo, e outros animais. Cada classe deve ter atributos e métodos que representem suas características e ações.\n", - "\n", - "2. **Adicione interações** \n", - " Programe interações entre os personagens. Por exemplo, Pedro pode tentar capturar o Lobo, e o Lobo pode reagir de diferentes maneiras dependendo da situação.\n", - "\n", - "3. **Simule o ambiente** \n", - " Crie uma classe para o ambiente onde a história acontece. O ambiente pode incluir elementos como árvores, cercas e outros objetos que influenciam as ações dos personagens.\n", - "\n", - "4. **Teste o sistema** \n", - " Escreva um código para testar as interações e garantir que o sistema funcione como esperado. Experimente diferentes cenários para ver como os personagens reagem.\n", - "\n", - "### Dicas\n", - "\n", - "- Pense em como os personagens se comportariam em um mundo real. Por exemplo, o Lobo pode ter fome e procurar comida, enquanto Pedro pode usar ferramentas para capturá-lo. \n", - "- Use herança para evitar duplicação de código. Por exemplo, se vários animais compartilham características semelhantes, você pode criar uma classe base \"Animal\". \n", - "- Certifique-se de que as interações sejam dinâmicas e interessantes. Isso tornará o exercício mais divertido e desafiador.\n", - "\n", - "### Exemplo\n", - "\n", - "Aqui está um exemplo de como você pode começar:\n", - "\n", - "```python\n", - "class Pedro:\n", - " def __init__(self, nome, idade):\n", - " self.nome = nome\n", - " self.idade = idade\n", - "\n", - " def capturar_lobo(self):\n", - " print(f\"{self.nome} está tentando capturar o lobo!\")\n", - "\n", - "class Lobo:\n", - " def __init__(self, fome):\n", - " self.fome = fome\n", - "\n", - " def reagir(self):\n", - " if self.fome:\n", - " print(\"O lobo está faminto e fica agressivo!\")\n", - " else:\n", - " print(\"O lobo está calmo e foge.\")\n", - "```\n", - "\n", - "### Conclusão\n", - "\n", - "Este exercício é uma ótima maneira de praticar programação orientada a objetos e aprender a modelar sistemas. Divirta-se criando seu próprio mundo de Pedro e o Lobo!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/solution/Julia/README.md b/translations/br/8-Reinforcement/1-QLearning/solution/Julia/README.md deleted file mode 100644 index 3f922a8df..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/solution/R/README.md b/translations/br/8-Reinforcement/1-QLearning/solution/R/README.md deleted file mode 100644 index f0f94b64f..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb b/translations/br/8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb deleted file mode 100644 index 6bcc93dea..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb +++ /dev/null @@ -1,462 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "eadbd20d2a075efb602615ad90b1e97a", - "translation_date": "2025-08-30T00:09:53+00:00", - "source_file": "8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Pedro e o Lobo: Ambiente Realista\n", - "\n", - "Na nossa situação, Pedro conseguia se movimentar quase sem se cansar ou sentir fome. Em um mundo mais realista, ele precisaria sentar e descansar de vez em quando, além de se alimentar. Vamos tornar nosso mundo mais realista implementando as seguintes regras:\n", - "\n", - "1. Ao se mover de um lugar para outro, Pedro perde **energia** e ganha um pouco de **fadiga**.\n", - "2. Pedro pode recuperar energia comendo maçãs.\n", - "3. Pedro pode se livrar da fadiga descansando sob uma árvore ou na grama (ou seja, caminhando para uma localização no tabuleiro que tenha uma árvore ou grama - campo verde).\n", - "4. Pedro precisa encontrar e matar o lobo.\n", - "5. Para matar o lobo, Pedro precisa ter certos níveis de energia e fadiga; caso contrário, ele perde a batalha.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random\n", - "import math\n", - "from rlboard import *" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "width, height = 8,8\n", - "m = Board(width,height)\n", - "m.randomize(seed=13)\n", - "m.plot()" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "actions = { \"U\" : (0,-1), \"D\" : (0,1), \"L\" : (-1,0), \"R\" : (1,0) }\n", - "action_idx = { a : i for i,a in enumerate(actions.keys()) }" - ] - }, - { - "source": [ - "## Definindo estado\n", - "\n", - "Nas novas regras do jogo, precisamos acompanhar a energia e o cansaço em cada estado do tabuleiro. Assim, vamos criar um objeto `state` que irá conter todas as informações necessárias sobre o estado atual do problema, incluindo o estado do tabuleiro, os níveis atuais de energia e cansaço, e se podemos derrotar o lobo enquanto estamos no estado terminal:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "class state:\n", - " def __init__(self,board,energy=10,fatigue=0,init=True):\n", - " self.board = board\n", - " self.energy = energy\n", - " self.fatigue = fatigue\n", - " self.dead = False\n", - " if init:\n", - " self.board.random_start()\n", - " self.update()\n", - "\n", - " def at(self):\n", - " return self.board.at()\n", - "\n", - " def update(self):\n", - " if self.at() == Board.Cell.water:\n", - " self.dead = True\n", - " return\n", - " if self.at() == Board.Cell.tree:\n", - " self.fatigue = 0\n", - " if self.at() == Board.Cell.apple:\n", - " self.energy = 10\n", - "\n", - " def move(self,a):\n", - " self.board.move(a)\n", - " self.energy -= 1\n", - " self.fatigue += 1\n", - " self.update()\n", - "\n", - " def is_winning(self):\n", - " return self.energy > self.fatigue" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "tags": [] - }, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ], - "source": [ - "def random_policy(state):\n", - " return random.choice(list(actions))\n", - "\n", - "def walk(board,policy):\n", - " n = 0 # number of steps\n", - " s = state(board)\n", - " while True:\n", - " if s.at() == Board.Cell.wolf:\n", - " if s.is_winning():\n", - " return n # success!\n", - " else:\n", - " return -n # failure!\n", - " if s.at() == Board.Cell.water:\n", - " return 0 # died\n", - " a = actions[policy(m)]\n", - " s.move(a)\n", - " n+=1\n", - "\n", - "walk(m,random_policy)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Killed by wolf = 5, won: 1 times, drown: 94 times\n" - ] - } - ], - "source": [ - "def print_statistics(policy):\n", - " s,w,n = 0,0,0\n", - " for _ in range(100):\n", - " z = walk(m,policy)\n", - " if z<0:\n", - " w+=1\n", - " elif z==0:\n", - " n+=1\n", - " else:\n", - " s+=1\n", - " print(f\"Killed by wolf = {w}, won: {s} times, drown: {n} times\")\n", - "\n", - "print_statistics(random_policy)" - ] - }, - { - "source": [ - "## Função de Recompensa\n", - "\n", - "### Introdução\n", - "\n", - "A função de recompensa é um componente essencial para treinar um modelo de aprendizado por reforço. Ela define como o agente deve ser recompensado ou penalizado com base em suas ações e estados no ambiente. Projetar uma boa função de recompensa é crucial para garantir que o agente aprenda o comportamento desejado.\n", - "\n", - "### Diretrizes para Criar uma Função de Recompensa\n", - "\n", - "- **Clareza**: Certifique-se de que a função de recompensa seja fácil de entender e implementar. Recompensas complexas podem dificultar o aprendizado do agente.\n", - "- **Consistência**: A recompensa deve ser consistente com os objetivos do problema. Evite recompensas que incentivem comportamentos indesejados.\n", - "- **Escalabilidade**: A função de recompensa deve funcionar bem em diferentes escalas e cenários do ambiente.\n", - "\n", - "### Exemplos de Funções de Recompensa\n", - "\n", - "#### Exemplo 1: Navegação\n", - "\n", - "Se o objetivo do agente é alcançar um destino específico, você pode definir a recompensa da seguinte forma:\n", - "\n", - "- Recompensa positiva ao alcançar o destino.\n", - "- Penalidade por cada passo dado para incentivar trajetórias mais curtas.\n", - "- Penalidade adicional por colisões ou ações inválidas.\n", - "\n", - "#### Exemplo 2: Controle de Recursos\n", - "\n", - "Em um cenário onde o agente deve gerenciar recursos, a função de recompensa pode incluir:\n", - "\n", - "- Recompensa por maximizar a utilização eficiente dos recursos.\n", - "- Penalidade por desperdício ou uso excessivo.\n", - "- Recompensa adicional por atingir metas específicas dentro de um limite de tempo.\n", - "\n", - "### Boas Práticas\n", - "\n", - "- **Teste e Ajuste**: Experimente diferentes configurações de recompensa para encontrar o equilíbrio ideal.\n", - "- **Evite Recompensas Excessivas**: Recompensas muito altas podem levar o agente a explorar menos o ambiente.\n", - "- **Monitore o Comportamento**: Observe como o agente responde à função de recompensa e ajuste conforme necessário.\n", - "\n", - "### Conclusão\n", - "\n", - "Uma função de recompensa bem projetada é fundamental para o sucesso do aprendizado por reforço. Dedique tempo para entender os objetivos do problema e crie uma função que incentive o comportamento desejado.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "def reward(s):\n", - " r = s.energy-s.fatigue\n", - " if s.at()==Board.Cell.wolf:\n", - " return 100 if s.is_winning() else -100\n", - " if s.at()==Board.Cell.water:\n", - " return -100\n", - " return r" - ] - }, - { - "source": [ - "## Algoritmo Q-Learning\n", - "\n", - "O algoritmo de aprendizado em si permanece praticamente inalterado, apenas usamos `state` em vez de apenas a posição do tabuleiro.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "Q = np.ones((width,height,len(actions)),dtype=np.float)*1.0/len(actions)" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "def probs(v,eps=1e-4):\n", - " v = v-v.min()+eps\n", - " v = v/v.sum()\n", - " return v" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "" - ] - } - ], - "source": [ - "\n", - "from IPython.display import clear_output\n", - "\n", - "lpath = []\n", - "\n", - "for epoch in range(10000):\n", - " clear_output(wait=True)\n", - " print(f\"Epoch = {epoch}\",end='')\n", - "\n", - " # Pick initial point\n", - " s = state(m)\n", - " \n", - " # Start travelling\n", - " n=0\n", - " cum_reward = 0\n", - " while True:\n", - " x,y = s.board.human\n", - " v = probs(Q[x,y])\n", - " while True:\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " dpos = actions[a]\n", - " if s.board.is_valid(s.board.move_pos(s.board.human,dpos)):\n", - " break \n", - " s.move(dpos)\n", - " r = reward(s)\n", - " if abs(r)==100: # end of game\n", - " print(f\" {n} steps\",end='\\r')\n", - " lpath.append(n)\n", - " break\n", - " alpha = np.exp(-n / 3000)\n", - " gamma = 0.5\n", - " ai = action_idx[a]\n", - " Q[x,y,ai] = (1 - alpha) * Q[x,y,ai] + alpha * (r + gamma * Q[x+dpos[0], y+dpos[1]].max())\n", - " n+=1" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Resultados\n", - "\n", - "Vamos ver se conseguimos treinar Peter para enfrentar o lobo!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Killed by wolf = 1, won: 9 times, drown: 90 times\n" - ] - } - ], - "source": [ - "def qpolicy(m):\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " return a\n", - "\n", - "print_statistics(qpolicy)" - ] - }, - { - "source": [ - "Agora vemos muito menos casos de afogamento, mas Peter ainda não consegue matar o lobo sempre. Tente experimentar e veja se consegue melhorar esse resultado ajustando os hiperparâmetros.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 13 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(lpath)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/8-Reinforcement/1-QLearning/solution/notebook.ipynb b/translations/br/8-Reinforcement/1-QLearning/solution/notebook.ipynb deleted file mode 100644 index 3a77faf60..000000000 --- a/translations/br/8-Reinforcement/1-QLearning/solution/notebook.ipynb +++ /dev/null @@ -1,577 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "488431336543f71f14d4aaf0399e3381", - "translation_date": "2025-08-30T00:07:38+00:00", - "source_file": "8-Reinforcement/1-QLearning/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Pedro e o Lobo: Introdução ao Aprendizado por Reforço\n", - "\n", - "Neste tutorial, aprenderemos como aplicar aprendizado por reforço a um problema de busca de caminhos. O cenário é inspirado no conto musical [Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf) do compositor russo [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). É uma história sobre o jovem pioneiro Pedro, que corajosamente sai de sua casa para a clareira da floresta para perseguir o lobo. Treinaremos algoritmos de aprendizado de máquina que ajudarão Pedro a explorar a área ao redor e construir um mapa de navegação ideal.\n", - "\n", - "Primeiro, vamos importar algumas bibliotecas úteis:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random\n", - "import math" - ] - }, - { - "source": [ - "## Visão Geral do Aprendizado por Reforço\n", - "\n", - "**Aprendizado por Reforço** (RL) é uma técnica de aprendizado que nos permite aprender o comportamento ideal de um **agente** em um determinado **ambiente** por meio da realização de muitos experimentos. Um agente nesse ambiente deve ter algum **objetivo**, definido por uma **função de recompensa**.\n", - "\n", - "## O Ambiente\n", - "\n", - "Para simplificar, vamos considerar o mundo de Peter como um tabuleiro quadrado de tamanho `width` x `height`. Cada célula desse tabuleiro pode ser:\n", - "* **chão**, onde Peter e outras criaturas podem caminhar\n", - "* **água**, onde obviamente não se pode caminhar\n", - "* **uma árvore** ou **grama** - um lugar onde você pode descansar um pouco\n", - "* **uma maçã**, que representa algo que Peter ficaria feliz em encontrar para se alimentar\n", - "* **um lobo**, que é perigoso e deve ser evitado\n", - "\n", - "Para trabalhar com o ambiente, definiremos uma classe chamada `Board`. Para não sobrecarregar este notebook, movemos todo o código relacionado ao trabalho com o tabuleiro para um módulo separado chamado `rlboard`, que agora iremos importar. Você pode olhar dentro desse módulo para obter mais detalhes sobre a implementação interna.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "from rlboard import *" - ] - }, - { - "source": [ - "Vamos agora criar um tabuleiro aleatório e ver como ele fica:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "width, height = 8,8\n", - "m = Board(width,height)\n", - "m.randomize(seed=13)\n", - "m.plot()" - ] - }, - { - "source": [ - "## Ações e Política\n", - "\n", - "No nosso exemplo, o objetivo de Peter seria encontrar uma maçã, enquanto evita o lobo e outros obstáculos. Para isso, ele pode basicamente andar por aí até encontrar uma maçã. Portanto, em qualquer posição, ele pode escolher entre uma das seguintes ações: cima, baixo, esquerda e direita. Definiremos essas ações como um dicionário e as mapearemos para pares de mudanças correspondentes nas coordenadas. Por exemplo, mover para a direita (`R`) corresponderia ao par `(1,0)`.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "actions = { \"U\" : (0,-1), \"D\" : (0,1), \"L\" : (-1,0), \"R\" : (1,0) }\n", - "action_idx = { a : i for i,a in enumerate(actions.keys()) }" - ] - }, - { - "source": [ - "A estratégia do nosso agente (Peter) é definida por uma chamada **política**. Vamos considerar a política mais simples chamada **caminhada aleatória**.\n", - "\n", - "## Caminhada aleatória\n", - "\n", - "Vamos primeiro resolver nosso problema implementando uma estratégia de caminhada aleatória.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "tags": [] - }, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "18" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ], - "source": [ - "def random_policy(m):\n", - " return random.choice(list(actions))\n", - "\n", - "def walk(m,policy,start_position=None):\n", - " n = 0 # number of steps\n", - " # set initial position\n", - " if start_position:\n", - " m.human = start_position \n", - " else:\n", - " m.random_start()\n", - " while True:\n", - " if m.at() == Board.Cell.apple:\n", - " return n # success!\n", - " if m.at() in [Board.Cell.wolf, Board.Cell.water]:\n", - " return -1 # eaten by wolf or drowned\n", - " while True:\n", - " a = actions[policy(m)]\n", - " new_pos = m.move_pos(m.human,a)\n", - " if m.is_valid(new_pos) and m.at(new_pos)!=Board.Cell.water:\n", - " m.move(a) # do the actual move\n", - " break\n", - " n+=1\n", - "\n", - "walk(m,random_policy)" - ] - }, - { - "source": [ - "Vamos executar o experimento de caminhada aleatória várias vezes e ver o número médio de passos dados:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Average path length = 32.87096774193548, eaten by wolf: 7 times\n" - ] - } - ], - "source": [ - "def print_statistics(policy):\n", - " s,w,n = 0,0,0\n", - " for _ in range(100):\n", - " z = walk(m,policy)\n", - " if z<0:\n", - " w+=1\n", - " else:\n", - " s += z\n", - " n += 1\n", - " print(f\"Average path length = {s/n}, eaten by wolf: {w} times\")\n", - "\n", - "print_statistics(random_policy)" - ] - }, - { - "source": [ - "## Função de Recompensa\n", - "\n", - "Para tornar nossa política mais inteligente, precisamos entender quais movimentos são \"melhores\" do que outros.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "move_reward = -0.1\n", - "goal_reward = 10\n", - "end_reward = -10\n", - "\n", - "def reward(m,pos=None):\n", - " pos = pos or m.human\n", - " if not m.is_valid(pos):\n", - " return end_reward\n", - " x = m.at(pos)\n", - " if x==Board.Cell.water or x == Board.Cell.wolf:\n", - " return end_reward\n", - " if x==Board.Cell.apple:\n", - " return goal_reward\n", - " return move_reward" - ] - }, - { - "source": [ - "## Q-Learning\n", - "\n", - "Construa uma Q-Table, ou matriz multidimensional. Como nosso tabuleiro tem dimensões `width` x `height`, podemos representar a Q-Table por um array numpy com formato `width` x `height` x `len(actions)`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "Q = np.ones((width,height,len(actions)),dtype=np.float)*1.0/len(actions)" - ] - }, - { - "source": [ - "Passe a Q-Table para a função de plotagem para visualizar a tabela no tabuleiro:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Essência do Q-Learning: Equação de Bellman e Algoritmo de Aprendizado\n", - "\n", - "Escreva um pseudocódigo para o nosso algoritmo de aprendizado:\n", - "\n", - "* Inicialize a Tabela Q (Q-Table) com números iguais para todos os estados e ações\n", - "* Defina a taxa de aprendizado $\\alpha\\leftarrow 1$\n", - "* Repita a simulação várias vezes\n", - " 1. Comece em uma posição aleatória\n", - " 1. Repita\n", - " 1. Selecione uma ação $a$ no estado $s$\n", - " 2. Execute a ação movendo-se para um novo estado $s'$\n", - " 3. Se encontrarmos uma condição de fim de jogo ou a recompensa total for muito pequena - saia da simulação \n", - " 4. Calcule a recompensa $r$ no novo estado\n", - " 5. Atualize a Função Q de acordo com a equação de Bellman: $Q(s,a)\\leftarrow (1-\\alpha)Q(s,a)+\\alpha(r+\\gamma\\max_{a'}Q(s',a'))$\n", - " 6. $s\\leftarrow s'$\n", - " 7. Atualize a recompensa total e diminua $\\alpha$.\n", - "\n", - "## Explorar vs. Explorar\n", - "\n", - "A melhor abordagem é equilibrar entre exploração e exploração. À medida que aprendemos mais sobre o nosso ambiente, estaremos mais propensos a seguir a rota ótima, no entanto, escolhendo o caminho não explorado de vez em quando.\n", - "\n", - "## Implementação em Python\n", - "\n", - "Agora estamos prontos para implementar o algoritmo de aprendizado. Antes disso, também precisamos de uma função que converta números arbitrários na Tabela Q em um vetor de probabilidades para as ações correspondentes:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "def probs(v,eps=1e-4):\n", - " v = v-v.min()+eps\n", - " v = v/v.sum()\n", - " return v" - ] - }, - { - "source": [ - "Adicionamos uma pequena quantidade de `eps` ao vetor original para evitar divisão por 0 no caso inicial, quando todos os componentes do vetor são idênticos.\n", - "\n", - "O algoritmo de aprendizado real será executado por 5000 experimentos, também chamados de **épocas**:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "" - ] - } - ], - "source": [ - "\n", - "from IPython.display import clear_output\n", - "\n", - "lpath = []\n", - "\n", - "for epoch in range(10000):\n", - " clear_output(wait=True)\n", - " print(f\"Epoch = {epoch}\",end='')\n", - "\n", - " # Pick initial point\n", - " m.random_start()\n", - " \n", - " # Start travelling\n", - " n=0\n", - " cum_reward = 0\n", - " while True:\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " dpos = actions[a]\n", - " m.move(dpos,check_correctness=False) # we allow player to move outside the board, which terminates episode\n", - " r = reward(m)\n", - " cum_reward += r\n", - " if r==end_reward or cum_reward < -1000:\n", - " print(f\" {n} steps\",end='\\r')\n", - " lpath.append(n)\n", - " break\n", - " alpha = np.exp(-n / 3000)\n", - " gamma = 0.5\n", - " ai = action_idx[a]\n", - " Q[x,y,ai] = (1 - alpha) * Q[x,y,ai] + alpha * (r + gamma * Q[x+dpos[0], y+dpos[1]].max())\n", - " n+=1" - ] - }, - { - "source": [ - "Após executar este algoritmo, a Q-Table deve ser atualizada com valores que definem a atratividade de diferentes ações em cada etapa. Visualize a tabela aqui:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Verificando a Política\n", - "\n", - "Como a Q-Table lista a \"atratividade\" de cada ação em cada estado, é bastante fácil usá-la para definir a navegação eficiente em nosso mundo. No caso mais simples, podemos simplesmente selecionar a ação correspondente ao maior valor na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ], - "source": [ - "def qpolicy_strict(m):\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = list(actions)[np.argmax(v)]\n", - " return a\n", - "\n", - "walk(m,qpolicy_strict)" - ] - }, - { - "source": [ - "Se você tentar o código acima várias vezes, pode perceber que, às vezes, ele simplesmente \"trava\", e você precisa pressionar o botão PARAR no notebook para interrompê-lo.\n", - "\n", - "> **Tarefa 1:** Modifique a função `walk` para limitar o comprimento máximo do caminho a um certo número de passos (digamos, 100), e observe o código acima retornar esse valor de tempos em tempos.\n", - "\n", - "> **Tarefa 2:** Modifique a função `walk` para que ela não volte aos lugares onde já esteve anteriormente. Isso evitará que `walk` entre em um loop, no entanto, o agente ainda pode acabar \"preso\" em um local do qual não consegue escapar.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Average path length = 3.45, eaten by wolf: 0 times\n" - ] - } - ], - "source": [ - "\n", - "def qpolicy(m):\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " return a\n", - "\n", - "print_statistics(qpolicy)" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 15 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(lpath)" - ] - }, - { - "source": [ - "O que vemos aqui é que, inicialmente, o comprimento médio do caminho aumentou. Isso provavelmente se deve ao fato de que, quando não sabemos nada sobre o ambiente, é mais provável que fiquemos presos em estados ruins, como água ou lobo. À medida que aprendemos mais e começamos a usar esse conhecimento, podemos explorar o ambiente por mais tempo, mas ainda não sabemos bem onde estão as maçãs.\n", - "\n", - "Uma vez que aprendemos o suficiente, torna-se mais fácil para o agente alcançar o objetivo, e o comprimento do caminho começa a diminuir. No entanto, ainda estamos abertos à exploração, então frequentemente nos desviamos do melhor caminho e exploramos novas opções, tornando o caminho mais longo do que o ideal.\n", - "\n", - "O que também observamos neste gráfico é que, em algum momento, o comprimento aumentou abruptamente. Isso indica a natureza estocástica do processo e que, em algum momento, podemos \"estragar\" os coeficientes da Q-Table, sobrescrevendo-os com novos valores. Isso idealmente deve ser minimizado diminuindo a taxa de aprendizado (ou seja, no final do treinamento ajustamos os valores da Q-Table apenas por um valor pequeno).\n", - "\n", - "No geral, é importante lembrar que o sucesso e a qualidade do processo de aprendizado dependem significativamente de parâmetros, como taxa de aprendizado, decaimento da taxa de aprendizado e fator de desconto. Esses parâmetros são frequentemente chamados de **hiperparâmetros**, para distingui-los dos **parâmetros** que otimizamos durante o treinamento (por exemplo, coeficientes da Q-Table). O processo de encontrar os melhores valores de hiperparâmetros é chamado de **otimização de hiperparâmetros**, e merece um tópico à parte.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "## Exercício\n", - "#### Um Mundo Mais Realista de Pedro e o Lobo\n", - "\n", - "Na nossa situação, Pedro conseguia se mover quase sem ficar cansado ou com fome. Em um mundo mais realista, ele precisa sentar e descansar de vez em quando, além de se alimentar. Vamos tornar nosso mundo mais realista implementando as seguintes regras:\n", - "\n", - "1. Ao se mover de um lugar para outro, Pedro perde **energia** e ganha um pouco de **fadiga**.\n", - "2. Pedro pode ganhar mais energia comendo maçãs.\n", - "3. Pedro pode se livrar da fadiga descansando sob a árvore ou na grama (ou seja, caminhando para uma posição no tabuleiro que tenha uma árvore ou grama - campo verde).\n", - "4. Pedro precisa encontrar e matar o lobo.\n", - "5. Para matar o lobo, Pedro precisa ter certos níveis de energia e fadiga; caso contrário, ele perde a batalha.\n", - "\n", - "Modifique a função de recompensa acima de acordo com as regras do jogo, execute o algoritmo de aprendizado por reforço para aprender a melhor estratégia para vencer o jogo e compare os resultados de uma caminhada aleatória com o seu algoritmo em termos de número de jogos vencidos e perdidos.\n", - "\n", - "> **Note**: Pode ser necessário ajustar os hiperparâmetros para que funcione, especialmente o número de épocas. Como o sucesso do jogo (enfrentar o lobo) é um evento raro, você pode esperar um tempo de treinamento muito maior.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/8-Reinforcement/2-Gym/README.md b/translations/br/8-Reinforcement/2-Gym/README.md deleted file mode 100644 index 83a784d2f..000000000 --- a/translations/br/8-Reinforcement/2-Gym/README.md +++ /dev/null @@ -1,333 +0,0 @@ - -## Requisitos - -Nesta lição, usaremos uma biblioteca chamada **OpenAI Gym** para simular diferentes **ambientes**. Você pode executar o código desta lição localmente (por exemplo, no Visual Studio Code), caso em que a simulação será aberta em uma nova janela. Ao rodar o código online, pode ser necessário fazer alguns ajustes, conforme descrito [aqui](https://towardsdatascience.com/rendering-openai-gym-envs-on-binder-and-google-colab-536f99391cc7). - -## OpenAI Gym - -Na lição anterior, as regras do jogo e o estado foram definidos pela classe `Board`, que criamos manualmente. Aqui, utilizaremos um **ambiente de simulação** especial, que simulará a física por trás do equilíbrio do pêndulo. Um dos ambientes de simulação mais populares para treinar algoritmos de aprendizado por reforço é chamado de [Gym](https://gym.openai.com/), mantido pela [OpenAI](https://openai.com/). Usando este Gym, podemos criar diferentes **ambientes**, desde uma simulação de CartPole até jogos de Atari. - -> **Nota**: Você pode ver outros ambientes disponíveis no OpenAI Gym [aqui](https://gym.openai.com/envs/#classic_control). - -Primeiro, vamos instalar o Gym e importar as bibliotecas necessárias (bloco de código 1): - -```python -import sys -!{sys.executable} -m pip install gym - -import gym -import matplotlib.pyplot as plt -import numpy as np -import random -``` - -## Exercício - inicializar um ambiente de CartPole - -Para trabalhar com o problema de equilíbrio do CartPole, precisamos inicializar o ambiente correspondente. Cada ambiente está associado a: - -- **Espaço de observação**, que define a estrutura das informações que recebemos do ambiente. No problema do CartPole, recebemos a posição do pêndulo, a velocidade e outros valores. - -- **Espaço de ação**, que define as ações possíveis. No nosso caso, o espaço de ação é discreto e consiste em duas ações: **esquerda** e **direita**. (bloco de código 2) - -1. Para inicializar, digite o seguinte código: - - ```python - env = gym.make("CartPole-v1") - print(env.action_space) - print(env.observation_space) - print(env.action_space.sample()) - ``` - -Para entender como o ambiente funciona, vamos executar uma simulação curta de 100 passos. Em cada passo, fornecemos uma das ações a serem realizadas - nesta simulação, selecionamos aleatoriamente uma ação do `action_space`. - -1. Execute o código abaixo e veja o que acontece. - - ✅ Lembre-se de que é preferível rodar este código em uma instalação local do Python! (bloco de código 3) - - ```python - env.reset() - - for i in range(100): - env.render() - env.step(env.action_space.sample()) - env.close() - ``` - - Você deve ver algo semelhante a esta imagem: - - ![CartPole sem equilíbrio](../../../../8-Reinforcement/2-Gym/images/cartpole-nobalance.gif) - -1. Durante a simulação, precisamos obter observações para decidir como agir. Na verdade, a função step retorna as observações atuais, uma função de recompensa e um indicador `done` que mostra se faz sentido continuar a simulação ou não: (bloco de código 4) - - ```python - env.reset() - - done = False - while not done: - env.render() - obs, rew, done, info = env.step(env.action_space.sample()) - print(f"{obs} -> {rew}") - env.close() - ``` - - Você verá algo como isto na saída do notebook: - - ```text - [ 0.03403272 -0.24301182 0.02669811 0.2895829 ] -> 1.0 - [ 0.02917248 -0.04828055 0.03248977 0.00543839] -> 1.0 - [ 0.02820687 0.14636075 0.03259854 -0.27681916] -> 1.0 - [ 0.03113408 0.34100283 0.02706215 -0.55904489] -> 1.0 - [ 0.03795414 0.53573468 0.01588125 -0.84308041] -> 1.0 - ... - [ 0.17299878 0.15868546 -0.20754175 -0.55975453] -> 1.0 - [ 0.17617249 0.35602306 -0.21873684 -0.90998894] -> 1.0 - ``` - - O vetor de observação retornado em cada passo da simulação contém os seguintes valores: - - Posição do carrinho - - Velocidade do carrinho - - Ângulo do pêndulo - - Taxa de rotação do pêndulo - -1. Obtenha os valores mínimos e máximos desses números: (bloco de código 5) - - ```python - print(env.observation_space.low) - print(env.observation_space.high) - ``` - - Você também pode notar que o valor da recompensa em cada passo da simulação é sempre 1. Isso ocorre porque nosso objetivo é sobreviver o maior tempo possível, ou seja, manter o pêndulo em uma posição razoavelmente vertical pelo maior período de tempo. - - ✅ Na verdade, a simulação do CartPole é considerada resolvida se conseguirmos uma recompensa média de 195 em 100 tentativas consecutivas. - -## Discretização do estado - -No Q-Learning, precisamos construir uma Q-Table que define o que fazer em cada estado. Para isso, o estado precisa ser **discreto**, ou seja, deve conter um número finito de valores discretos. Assim, precisamos de alguma forma **discretizar** nossas observações, mapeando-as para um conjunto finito de estados. - -Existem algumas maneiras de fazer isso: - -- **Dividir em intervalos**. Se conhecemos o intervalo de um determinado valor, podemos dividi-lo em um número de **intervalos** e, em seguida, substituir o valor pelo número do intervalo ao qual ele pertence. Isso pode ser feito usando o método [`digitize`](https://numpy.org/doc/stable/reference/generated/numpy.digitize.html) do numpy. Nesse caso, saberemos exatamente o tamanho do estado, pois ele dependerá do número de intervalos que selecionarmos para a digitalização. - -✅ Podemos usar interpolação linear para trazer os valores para algum intervalo finito (por exemplo, de -20 a 20) e, em seguida, converter os números em inteiros arredondando-os. Isso nos dá um pouco menos de controle sobre o tamanho do estado, especialmente se não conhecermos os intervalos exatos dos valores de entrada. Por exemplo, no nosso caso, 2 dos 4 valores não têm limites superiores/inferiores, o que pode resultar em um número infinito de estados. - -No nosso exemplo, usaremos a segunda abordagem. Como você pode notar mais tarde, apesar de os limites superiores/inferiores não estarem definidos, esses valores raramente assumem valores fora de certos intervalos finitos, tornando os estados com valores extremos muito raros. - -1. Aqui está a função que pegará a observação do nosso modelo e produzirá uma tupla de 4 valores inteiros: (bloco de código 6) - - ```python - def discretize(x): - return tuple((x/np.array([0.25, 0.25, 0.01, 0.1])).astype(np.int)) - ``` - -1. Vamos também explorar outro método de discretização usando intervalos: (bloco de código 7) - - ```python - def create_bins(i,num): - return np.arange(num+1)*(i[1]-i[0])/num+i[0] - - print("Sample bins for interval (-5,5) with 10 bins\n",create_bins((-5,5),10)) - - ints = [(-5,5),(-2,2),(-0.5,0.5),(-2,2)] # intervals of values for each parameter - nbins = [20,20,10,10] # number of bins for each parameter - bins = [create_bins(ints[i],nbins[i]) for i in range(4)] - - def discretize_bins(x): - return tuple(np.digitize(x[i],bins[i]) for i in range(4)) - ``` - -1. Agora, vamos rodar uma simulação curta e observar esses valores discretos do ambiente. Sinta-se à vontade para testar tanto `discretize` quanto `discretize_bins` e veja se há diferença. - - ✅ `discretize_bins` retorna o número do intervalo, que começa em 0. Assim, para valores da variável de entrada próximos de 0, ele retorna o número do meio do intervalo (10). Em `discretize`, não nos preocupamos com o intervalo dos valores de saída, permitindo que sejam negativos, de modo que os valores do estado não são deslocados, e 0 corresponde a 0. (bloco de código 8) - - ```python - env.reset() - - done = False - while not done: - #env.render() - obs, rew, done, info = env.step(env.action_space.sample()) - #print(discretize_bins(obs)) - print(discretize(obs)) - env.close() - ``` - - ✅ Descomente a linha que começa com `env.render` se quiser ver como o ambiente é executado. Caso contrário, você pode executá-lo em segundo plano, o que é mais rápido. Usaremos essa execução "invisível" durante nosso processo de Q-Learning. - -## Estrutura da Q-Table - -Na lição anterior, o estado era um simples par de números de 0 a 8, e, portanto, era conveniente representar a Q-Table como um tensor numpy com forma 8x8x2. Se usarmos a discretização por intervalos, o tamanho do nosso vetor de estado também será conhecido, então podemos usar a mesma abordagem e representar o estado por um array com forma 20x20x10x10x2 (aqui, 2 é a dimensão do espaço de ação, e as primeiras dimensões correspondem ao número de intervalos que selecionamos para cada parâmetro no espaço de observação). - -No entanto, às vezes as dimensões precisas do espaço de observação não são conhecidas. No caso da função `discretize`, nunca podemos ter certeza de que nosso estado permanecerá dentro de certos limites, porque alguns dos valores originais não têm limites. Assim, usaremos uma abordagem ligeiramente diferente e representaremos a Q-Table como um dicionário. - -1. Use o par *(state, action)* como chave do dicionário, e o valor corresponderá ao valor da entrada na Q-Table. (bloco de código 9) - - ```python - Q = {} - actions = (0,1) - - def qvalues(state): - return [Q.get((state,a),0) for a in actions] - ``` - - Aqui também definimos uma função `qvalues()`, que retorna uma lista de valores da Q-Table para um estado dado que corresponde a todas as ações possíveis. Se a entrada não estiver presente na Q-Table, retornaremos 0 como padrão. - -## Vamos começar o Q-Learning - -Agora estamos prontos para ensinar Peter a equilibrar! - -1. Primeiro, vamos definir alguns hiperparâmetros: (bloco de código 10) - - ```python - # hyperparameters - alpha = 0.3 - gamma = 0.9 - epsilon = 0.90 - ``` - - Aqui, `alpha` é a **taxa de aprendizado**, que define em que medida devemos ajustar os valores atuais da Q-Table em cada passo. Na lição anterior, começamos com 1 e depois reduzimos `alpha` para valores menores durante o treinamento. Neste exemplo, manteremos constante apenas para simplificar, e você pode experimentar ajustar os valores de `alpha` mais tarde. - - `gamma` é o **fator de desconto**, que mostra em que medida devemos priorizar a recompensa futura em relação à recompensa atual. - - `epsilon` é o **fator de exploração/exploração**, que determina se devemos preferir explorar ou explorar menos. Em nosso algoritmo, em `epsilon` por cento dos casos, selecionaremos a próxima ação de acordo com os valores da Q-Table, e no restante dos casos executaremos uma ação aleatória. Isso nos permitirá explorar áreas do espaço de busca que nunca vimos antes. - - ✅ Em termos de equilíbrio - escolher uma ação aleatória (exploração) agiria como um empurrão aleatório na direção errada, e o pêndulo teria que aprender a recuperar o equilíbrio desses "erros". - -### Melhorar o algoritmo - -Podemos também fazer duas melhorias no nosso algoritmo da lição anterior: - -- **Calcular a recompensa cumulativa média**, ao longo de várias simulações. Imprimiremos o progresso a cada 5000 iterações e faremos a média da recompensa cumulativa nesse período de tempo. Isso significa que, se obtivermos mais de 195 pontos, podemos considerar o problema resolvido, com uma qualidade ainda maior do que a exigida. - -- **Calcular o resultado cumulativo médio máximo**, `Qmax`, e armazenaremos a Q-Table correspondente a esse resultado. Quando você rodar o treinamento, notará que, às vezes, o resultado cumulativo médio começa a cair, e queremos manter os valores da Q-Table que correspondem ao melhor modelo observado durante o treinamento. - -1. Colete todas as recompensas cumulativas em cada simulação no vetor `rewards` para posterior plotagem. (bloco de código 11) - - ```python - def probs(v,eps=1e-4): - v = v-v.min()+eps - v = v/v.sum() - return v - - Qmax = 0 - cum_rewards = [] - rewards = [] - for epoch in range(100000): - obs = env.reset() - done = False - cum_reward=0 - # == do the simulation == - while not done: - s = discretize(obs) - if random.random() Qmax: - Qmax = np.average(cum_rewards) - Qbest = Q - cum_rewards=[] - ``` - -O que você pode notar a partir desses resultados: - -- **Perto do nosso objetivo**. Estamos muito próximos de alcançar o objetivo de obter 195 recompensas cumulativas em mais de 100 execuções consecutivas da simulação, ou talvez já tenhamos alcançado! Mesmo que obtenhamos números menores, ainda não sabemos, porque fazemos a média em 5000 execuções, e apenas 100 execuções são necessárias no critério formal. - -- **Recompensa começa a cair**. Às vezes, a recompensa começa a cair, o que significa que podemos "destruir" valores já aprendidos na Q-Table com aqueles que pioram a situação. - -Essa observação fica mais clara se plotarmos o progresso do treinamento. - -## Plotando o progresso do treinamento - -Durante o treinamento, coletamos o valor da recompensa cumulativa em cada uma das iterações no vetor `rewards`. Veja como ele fica quando o plotamos contra o número de iterações: - -```python -plt.plot(rewards) -``` - -![progresso bruto](../../../../8-Reinforcement/2-Gym/images/train_progress_raw.png) - -A partir deste gráfico, não é possível dizer muita coisa, porque, devido à natureza do processo de treinamento estocástico, a duração das sessões de treinamento varia muito. Para dar mais sentido a este gráfico, podemos calcular a **média móvel** ao longo de uma série de experimentos, digamos 100. Isso pode ser feito convenientemente usando `np.convolve`: (bloco de código 12) - -```python -def running_average(x,window): - return np.convolve(x,np.ones(window)/window,mode='valid') - -plt.plot(running_average(rewards,100)) -``` - -![progresso do treinamento](../../../../8-Reinforcement/2-Gym/images/train_progress_runav.png) - -## Variando os hiperparâmetros - -Para tornar o aprendizado mais estável, faz sentido ajustar alguns de nossos hiperparâmetros durante o treinamento. Em particular: - -- **Para a taxa de aprendizado**, `alpha`, podemos começar com valores próximos de 1 e, em seguida, diminuir o parâmetro gradualmente. Com o tempo, obteremos boas probabilidades na Q-Table, e, assim, devemos ajustá-las levemente, em vez de sobrescrevê-las completamente com novos valores. - -- **Aumentar epsilon**. Podemos querer aumentar o `epsilon` lentamente, para explorar menos e explorar mais. Provavelmente faz sentido começar com um valor menor de `epsilon` e aumentá-lo até quase 1. -> **Tarefa 1**: Experimente ajustar os valores dos hiperparâmetros e veja se consegue alcançar uma recompensa cumulativa maior. Você está conseguindo superar 195? -> **Tarefa 2**: Para resolver formalmente o problema, você precisa alcançar uma recompensa média de 195 em 100 execuções consecutivas. Meça isso durante o treinamento e certifique-se de que resolveu o problema formalmente! - -## Visualizando o resultado em ação - -Seria interessante ver como o modelo treinado se comporta. Vamos executar a simulação e seguir a mesma estratégia de seleção de ações usada durante o treinamento, amostrando de acordo com a distribuição de probabilidade na Q-Table: (bloco de código 13) - -```python -obs = env.reset() -done = False -while not done: - s = discretize(obs) - env.render() - v = probs(np.array(qvalues(s))) - a = random.choices(actions,weights=v)[0] - obs,_,done,_ = env.step(a) -env.close() -``` - -Você deve ver algo como isto: - -![um carrinho equilibrando](../../../../8-Reinforcement/2-Gym/images/cartpole-balance.gif) - ---- - -## 🚀Desafio - -> **Tarefa 3**: Aqui, estávamos usando a cópia final da Q-Table, que pode não ser a melhor. Lembre-se de que armazenamos a Q-Table com melhor desempenho na variável `Qbest`! Experimente o mesmo exemplo com a Q-Table de melhor desempenho copiando `Qbest` para `Q` e veja se você nota alguma diferença. - -> **Tarefa 4**: Aqui, não estávamos selecionando a melhor ação em cada etapa, mas sim amostrando com a distribuição de probabilidade correspondente. Faria mais sentido sempre selecionar a melhor ação, com o maior valor na Q-Table? Isso pode ser feito usando a função `np.argmax` para descobrir o número da ação correspondente ao maior valor na Q-Table. Implemente essa estratégia e veja se ela melhora o equilíbrio. - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Tarefa -[Treine um Mountain Car](assignment.md) - -## Conclusão - -Agora aprendemos como treinar agentes para alcançar bons resultados apenas fornecendo a eles uma função de recompensa que define o estado desejado do jogo e dando-lhes a oportunidade de explorar inteligentemente o espaço de busca. Aplicamos com sucesso o algoritmo de Q-Learning nos casos de ambientes discretos e contínuos, mas com ações discretas. - -É importante também estudar situações em que o estado de ação também é contínuo e quando o espaço de observação é muito mais complexo, como a imagem da tela de um jogo Atari. Nesses problemas, muitas vezes precisamos usar técnicas de aprendizado de máquina mais poderosas, como redes neurais, para alcançar bons resultados. Esses tópicos mais avançados serão abordados em nosso próximo curso de IA mais avançado. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/2-Gym/assignment.md b/translations/br/8-Reinforcement/2-Gym/assignment.md deleted file mode 100644 index 239dd4c8d..000000000 --- a/translations/br/8-Reinforcement/2-Gym/assignment.md +++ /dev/null @@ -1,57 +0,0 @@ - -# Treinar Carro na Montanha - -[OpenAI Gym](http://gym.openai.com) foi projetado de forma que todos os ambientes fornecem a mesma API - ou seja, os mesmos métodos `reset`, `step` e `render`, e as mesmas abstrações de **espaço de ação** e **espaço de observação**. Assim, deve ser possível adaptar os mesmos algoritmos de aprendizado por reforço para diferentes ambientes com mudanças mínimas no código. - -## Um Ambiente de Carro na Montanha - -O [ambiente Mountain Car](https://gym.openai.com/envs/MountainCar-v0/) contém um carro preso em um vale: - -O objetivo é sair do vale e capturar a bandeira, realizando em cada passo uma das seguintes ações: - -| Valor | Significado | -|---|---| -| 0 | Acelerar para a esquerda | -| 1 | Não acelerar | -| 2 | Acelerar para a direita | - -O principal desafio deste problema, no entanto, é que o motor do carro não é forte o suficiente para escalar a montanha em uma única tentativa. Portanto, a única maneira de ter sucesso é dirigir para frente e para trás para ganhar impulso. - -O espaço de observação consiste em apenas dois valores: - -| Num | Observação | Min | Max | -|-----|--------------|-------|-------| -| 0 | Posição do carro | -1.2 | 0.6 | -| 1 | Velocidade do carro | -0.07 | 0.07 | - -O sistema de recompensa para o carro na montanha é bastante desafiador: - - * Uma recompensa de 0 é concedida se o agente alcançar a bandeira (posição = 0.5) no topo da montanha. - * Uma recompensa de -1 é concedida se a posição do agente for menor que 0.5. - -O episódio termina se a posição do carro for maior que 0.5 ou se o comprimento do episódio for maior que 200. - -## Instruções - -Adapte nosso algoritmo de aprendizado por reforço para resolver o problema do carro na montanha. Comece com o código existente no [notebook.ipynb](notebook.ipynb), substitua o ambiente, altere as funções de discretização de estado e tente fazer o algoritmo existente treinar com modificações mínimas no código. Otimize o resultado ajustando os hiperparâmetros. - -> **Nota**: Ajustes nos hiperparâmetros provavelmente serão necessários para que o algoritmo converja. - -## Rubrica - -| Critério | Exemplar | Adequado | Precisa Melhorar | -| -------- | --------- | -------- | ---------------- | -| | O algoritmo de Q-Learning foi adaptado com sucesso a partir do exemplo CartPole, com modificações mínimas no código, sendo capaz de resolver o problema de capturar a bandeira em menos de 200 passos. | Um novo algoritmo de Q-Learning foi adotado da Internet, mas está bem documentado; ou o algoritmo existente foi adaptado, mas não alcança os resultados desejados. | O estudante não conseguiu adotar nenhum algoritmo com sucesso, mas deu passos substanciais em direção à solução (implementou discretização de estado, estrutura de dados da Q-Table, etc.) | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/2-Gym/notebook.ipynb b/translations/br/8-Reinforcement/2-Gym/notebook.ipynb deleted file mode 100644 index dc22f04e0..000000000 --- a/translations/br/8-Reinforcement/2-Gym/notebook.ipynb +++ /dev/null @@ -1,392 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.4" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.4 64-bit ('base': conda)" - }, - "interpreter": { - "hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5" - }, - "coopTranslator": { - "original_hash": "f22f8f3daed4b6d34648d1254763105b", - "translation_date": "2025-08-30T00:12:02+00:00", - "source_file": "8-Reinforcement/2-Gym/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "## Patinação no CartPole\n", - "\n", - "> **Problema**: Se Peter quer escapar do lobo, ele precisa ser mais rápido do que ele. Vamos ver como Peter pode aprender a patinar, em particular, a manter o equilíbrio, usando Q-Learning.\n", - "\n", - "Primeiro, vamos instalar o gym e importar as bibliotecas necessárias:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 1" - ] - }, - { - "source": [ - "## Criar um ambiente de cartpole\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "#code block 2" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "source": [ - "Para ver como o ambiente funciona, vamos executar uma simulação curta por 100 etapas.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "#code block 3" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "source": [ - "Durante a simulação, precisamos obter observações para decidir como agir. Na verdade, a função `step` nos retorna as observações atuais, a função de recompensa e a flag `done` que indica se faz sentido continuar a simulação ou não:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "#code block 4" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "source": [ - "Podemos obter o valor mínimo e máximo desses números:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[-4.8000002e+00 -3.4028235e+38 -4.1887903e-01 -3.4028235e+38]\n[4.8000002e+00 3.4028235e+38 4.1887903e-01 3.4028235e+38]\n" - ] - } - ], - "source": [ - "#code block 5" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 6" - ] - }, - { - "source": [ - "Vamos também explorar outro método de discretização usando intervalos:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Sample bins for interval (-5,5) with 10 bins\n [-5. -4. -3. -2. -1. 0. 1. 2. 3. 4. 5.]\n" - ] - } - ], - "source": [ - "#code block 7" - ] - }, - { - "source": [ - "Vamos agora executar uma simulação curta e observar esses valores discretos do ambiente.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "(0, 0, -2, -2)\n(0, 1, -2, -5)\n(0, 2, -3, -8)\n(0, 3, -5, -11)\n(0, 3, -7, -14)\n(0, 4, -10, -17)\n(0, 3, -14, -15)\n(0, 3, -17, -12)\n(0, 3, -20, -16)\n(0, 4, -23, -19)\n" - ] - } - ], - "source": [ - "#code block 8" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 9" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 10" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "0: 22.0, alpha=0.3, epsilon=0.9\n", - "5000: 70.1384, alpha=0.3, epsilon=0.9\n", - "10000: 121.8586, alpha=0.3, epsilon=0.9\n", - "15000: 149.6368, alpha=0.3, epsilon=0.9\n", - "20000: 168.2782, alpha=0.3, epsilon=0.9\n", - "25000: 196.7356, alpha=0.3, epsilon=0.9\n", - "30000: 220.7614, alpha=0.3, epsilon=0.9\n", - "35000: 233.2138, alpha=0.3, epsilon=0.9\n", - "40000: 248.22, alpha=0.3, epsilon=0.9\n", - "45000: 264.636, alpha=0.3, epsilon=0.9\n", - "50000: 276.926, alpha=0.3, epsilon=0.9\n", - "55000: 277.9438, alpha=0.3, epsilon=0.9\n", - "60000: 248.881, alpha=0.3, epsilon=0.9\n", - "65000: 272.529, alpha=0.3, epsilon=0.9\n", - "70000: 281.7972, alpha=0.3, epsilon=0.9\n", - "75000: 284.2844, alpha=0.3, epsilon=0.9\n", - "80000: 269.667, alpha=0.3, epsilon=0.9\n", - "85000: 273.8652, alpha=0.3, epsilon=0.9\n", - "90000: 278.2466, alpha=0.3, epsilon=0.9\n", - "95000: 269.1736, alpha=0.3, epsilon=0.9\n" - ] - } - ], - "source": [ - "#code block 11" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 20 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXoAAAD4CAYAAADiry33AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nO3deXxU9b3/8dcnCSTsa8CQgAEJIKIIBGSXTUWiYqu0Lq2o3MvV6nWhVlGrtbdasddq9dqfy9W2tr22WpdKXYu4W0VBRVBAQFACCEF2kCXk+/tjvkkm+yTMZCZn3s/HI4+c853vzPmenMl7vud7zpxjzjlERCS4UuLdABERiS0FvYhIwCnoRUQCTkEvIhJwCnoRkYBLi3cDADp37uxyc3Pj3QwRkSZl0aJFW5xzmXXVS4igz83NZeHChfFuhohIk2JmX0ZST0M3IiIBp6AXEQk4Bb2ISMAp6EVEAk5BLyIScBEFvZmtNbMlZvaxmS30ZR3NbJ6ZrfS/O/hyM7N7zWyVmX1iZoNjuQIiIlK7+vToxzvnjnfO5fv52cB851weMN/PA5wK5PmfmcD90WqsiIjU3+GcRz8VGOenHwVeB67z5X90oesfv2dm7c0syzm38XAa2pjWbd3Lj/+2mG7tMvjpaf3p3DqdbXsO8K/V31BwXBbOOf7+8XpO6NmJj77azsSjuzD5N2/yo3G9eXbxev484wTumb+S/lltOaJdBobxwBureePzIpbccjJmBsCLSzby+ooiphyXxYl9Kn7nYUnhDv7+8Xq6tk1n5tijyso/XredtBRjQHY7nHM8uaiQCf26cOvzy+jYqjnLNu7kX6u/4d5zB5HdvgWri3bz3UHZpKWm8PKnX3NMt7bc/sJybig4mpPueoNHpg+leZrxwdptzHlxOU9dOoIN2/dx+sBuPLbgK254Zglt0tO4cFQu//PqKm46rT+/eO4zlv9iMjf9fSl/W1RIn66tGdazI51apXPP/JX87PT+9OzcivfXbGXJ+h28tXJLg7fFJScexQNvrKZ3l9as2ry7rNwMUs0oLonfZbbbZKSxa19xxPVHHtWJpet3sHNfMcdmt2PJ+h306tyKL7bsAeDu7w/k6scXx6q53HJ6f7buPcgTH6zj6537YraccENzO/DB2m38YHgP1m/7luZpKbz86aZ6vcb5J/TgolG5TLrrzXov/4qJeaSacfcrn9da79YzB/DlN3v437fW8B9je/Hgm19UqfPdwdk8/eH6Gl9jcI/2PHXpSNZs2cOEX78RUftyOrTglVknktEsNaL6DWWRXI/ezNYA2wAHPOice8jMtjvn2ofV2eac62BmzwFznHNv+/L5wHXOuYWVXnMmoR4/PXr0GPLllxGd998ocmc/Xzad06EFb183ge8/+C4L1mzlvesnsm7bXqY98G5ZnYn9ujB/+eay+cqhFO73Fw1lfN8u7Nx3kONu+WdZ+do5BTW2Ifyx0vK1cwp4aelGLvnzh3Wuz7WT+3LxqJ70u+mlOuuWKv0HrUnz1BQOHCqJ+PVEksFvzxvMZY/V/T8Z7ofDj+QXZw5o0PLMbFHYKEuNIu3Rj3LObTCzLsA8M1te27KrKavyaeKcewh4CCA/Pz9h735SuO1bANZvD/0+eKiE3fsr9uLWbdtbYb6mkAfKeoDFhw5/lXd+G1lvcuvuA5TU8wYztYU8oJAXqcaufQfr/ZyiXftj0JKKIhqjd85t8L83A88Aw4BNZpYF4H+XdmkLge5hT88BNkSrwUGVO/t5LvnTong3Q0QCqM6gN7NWZtamdBo4GVgKzAWm+2rTgWf99FzgAn/2zXBgR1Man4+nlz79Ot5NEJEAimTopivwjD+AmAY85px7ycw+AJ4wsxnAV8A0X/8FYAqwCtgLXBT1VouIBETR7tgP3dQZ9M65L4CB1ZR/A0ysptwBl0WldQG0/+Ah5i7ewKijOjXaMuN4YoqI1OHLb/bWXekwJcRlipPJr15eQdGu/dxzzvGNtkyr7vC4iETdI2+viXcTqqVLIHhffrOHRV/WfqZJNJQeYd/5bf2PzotIYltZyxl38aQevXfif78OVD2fXUQklrY0whi9evRRYNV+dSBxOJf4bRSR2FHQi4gEnIZuoqAhBzsb80SY372zhjYZ2tQiyUo9+giMv/P1CvNNcRDknvkr490EEYkTBX0E1virC4qINEUK+nqq57XBouqv738Vv4WLSJOloI9QInzpaPbTS+LdBBFpghT0IiIBp6AH9h6o+7ru0R6yiecQkIgkFwU9sOCLrXXWKb0BSayHcL49cCi2CxCRpKOgr2TfwbqDNpad8UPq6otIlCnoK9l/sHFukVfbnkFjXPtCRJKHgr6eHv9gXUzv8bh19wHyb30lZq8vIslHQV9P9722it+/szZmr79174EqZbmzn+eQ7h4iIg2koAdcPUfdDxQf/gHTmobiP9uws9ryg4caZ0hJRIJHQd8Aq4sO/5IIroakX7l512G/tohIOAV9gvmwhrtcrdyUmHeuEZHEp6CvpL7DONG2uHBHteWn3/d2I7dERIJCQR8nlggXzxGRpKCgFxEJOAU98bnuTE0HY0VEok1BHwUahhGRRKagr8Sa5I0CRURqpqCvpCFn3SzbWP2XnEREEoGCnviM0Wu4R0Qai4JeRCTgFPTE9vryNS5TZ92ISCNR0MfJLf/4LN5NEJEkEXHQm1mqmX1kZs/5+Z5mtsDMVprZ42bW3Jen+/lV/vHc2DQ9etS7FpEgq0+P/kpgWdj8HcDdzrk8YBsww5fPALY553oDd/t6Ce3xD9bFuwn11uenL/L655vj3QwRaQIiCnozywEKgIf9vAETgCd9lUeBM/30VD+Pf3yiJfgpJis3l18Zsql07g8Ul/DCkq/j3QwRaQIi7dH/BrgWKL37RSdgu3Ou2M8XAtl+OhtYB+Af3+HrV2BmM81soZktLCoqamDzRUSkLnUGvZmdBmx2zi0KL66mqovgsfIC5x5yzuU75/IzMzMjamysxPvSxCIisZQWQZ1RwBlmNgXIANoS6uG3N7M032vPATb4+oVAd6DQzNKAdsDWqLc8SkpKHCVhd+lL7EEmEZH6q7NH75y73jmX45zLBc4BXnXOnQ+8Bpztq00HnvXTc/08/vFXXQKf1nLqPW+xfvu38W6GiEjMHM559NcBs8xsFaEx+Ed8+SNAJ18+C5h9eE2MrRWbdI9WEQm2SIZuyjjnXgde99NfAMOqqbMPmBaFtsVF4u57iIg0jL4ZKyIScAp6EZGAU9CLiARcvcbog+JAcQl9fvoiV0zoHe+miIjEXFL26PcVHwLg9++sjW9DREQaQVIGvYhIMlHQV6KzK0UkaBT0legKCCISNAp6EZGAU9CLiAScgr4SjdGLSNAo6CuZ95nu2iQiwZLUQb9rf3GVsi27D8ShJSIisZPUQS8ikgwU9JX8+p8r4t0EEZGoUtBXUqKjsSISMEkX9J9v2sW0+9+NdzNERBpN0gX9L19YptsHikhSSbqgFxFJNgp6EZGAU9CLiAScgl5EJOAU9CIiAaegFxEJuKQLet1YRESSTdIFvYhIslHQi4gEnIJeRCTgFPQiIgGnoBcRCbikC3oznXcjIsmlzqA3swwze9/MFpvZp2b2c1/e08wWmNlKM3vczJr78nQ/v8o/nhvbVRARkdpE0qPfD0xwzg0Ejgcmm9lw4A7gbudcHrANmOHrzwC2Oed6A3f7eglD/XkRSTZ1Br0L2e1nm/kfB0wAnvTljwJn+umpfh7/+ETTeImISNxENEZvZqlm9jGwGZgHrAa2O+eKfZVCINtPZwPrAPzjO4BO0Wy0iIhELqKgd84dcs4dD+QAw4Cjq6vmf1fXe69yJ1Yzm2lmC81sYVFRUaTtFRGReqrXWTfOue3A68BwoL2ZpfmHcoANfroQ6A7gH28HbK3mtR5yzuU75/IzMzMb1voG0CCSiCSbSM66yTSz9n66BTAJWAa8Bpztq00HnvXTc/08/vFXnXNVevQiItI40uquQhbwqJmlEvpgeMI595yZfQb81cxuBT4CHvH1HwH+ZGarCPXkz4lBu0VEJEJ1Br1z7hNgUDXlXxAar69cvg+YFpXWiYjIYUuKb8YeKnHcMvdTNmz/Nt5NERFpdJEM3TR576/Zyh/+tZbPN+2iZfPUeDdHRKRRJUWP3vmzO0t0TFhEklBSBH1FOr9SRJJLEga9iEhyUdCLiARcUgW9huhFJBklRdBb2Li8LoEgIskm0KdXOudYXbQn3s0QEYmrQPfoH3l7DZPueoPFhdvLyg6VaPxGRJJLoIP+o3WhgF+3dW9Z2avLN8erOSIicRHooBcRkSQLeg3aiEgySoqg15k2IpLMgh306sKLiAQ86D3T9W1EJIkF9jz63NnPl00/vnBdHFsiIhJfSdGjP1BcEu8miIjETVIEfRmN2YtIEgpU0O/eX8zU377D55t2xbspIiIJI1BB/69VW1i8bju/emlFvJsiIpIwAhX0dXl/7dZ4N0FEpNElVdCLiCSjQAW9jrWKiFQVqKAvpUseiIiUC2TQi4hIuUAFve4JKyJSVaCCvpRGbkREygUy6EVEpFzAgl5jNyIilQUs6EN01o2ISLlABr2IiJSrM+jNrLuZvWZmy8zsUzO70pd3NLN5ZrbS/+7gy83M7jWzVWb2iZkNjvVKlNJZNyIiVUXSoy8GfuycOxoYDlxmZv2B2cB851weMN/PA5wK5PmfmcD9UW91HXRHKRGRcnUGvXNuo3PuQz+9C1gGZANTgUd9tUeBM/30VOCPLuQ9oL2ZZUW95dXYrxuMiIhUUa8xejPLBQYBC4CuzrmNEPowALr4atlA+L37Cn1Z5deaaWYLzWxhUVFR/Vtejase/zgqryMiEiQRB72ZtQaeAq5yzu2srWo1ZVVGz51zDznn8p1z+ZmZmZE2IyI660ZEpFxEQW9mzQiF/P855572xZtKh2T8782+vBDoHvb0HGBDdJorIiL1FclZNwY8Aixzzt0V9tBcYLqfng48G1Z+gT/7Zjiwo3SIR0REGl9aBHVGAT8ElphZ6SD4DcAc4AkzmwF8BUzzj70ATAFWAXuBi6La4gho6EZEpFydQe+ce5uarxM2sZr6DrjsMNslIiJRom/GiogEXCCDXl+YEhEpF8igFxGRcgp6EZGAC2TQry7aHe8miIgkjEAG/fKvd8W7CSIiCSOQQS8iIuUU9CIiAaegFxEJOAW9iEjAKehFRAJOQS8iEnAKehGRgFPQi4gEnIJeRCTgFPQiIgGnoBcRCTgFvYhIwCnoRUQCTkEvIhJwCnoRkYBT0IuIBFxggr5w2954N0FEJCEFIujfXf0No+94Ld7NEBFJSIEI+uVf74x3E0REElYggt65eLdARCRxBSPo490AEZEEFoigFxGRmgUi6J3GbkREahSIoBcRkZo1+aDfd/AQtz6/LN7NEBFJWHUGvZn9zsw2m9nSsLKOZjbPzFb63x18uZnZvWa2ysw+MbPBsWw8wINvfBHrRYiINGmR9Oj/AEyuVDYbmO+cywPm+3mAU4E8/zMTuD86zazZ3oPFsV6EiEiTVmfQO+feBLZWKp4KPOqnHwXODCv/owt5D2hvZlnRamz1DYzpq4uINHkNHaPv6pzbCOB/d/Hl2cC6sHqFvqwKM5tpZgvNbGFRUVEDmwH/WLyhwc8VEUkG0T4Ya9WUVdvnds495JzLd87lZ2ZmNniBG3bsa/BzRUSSQUODflPpkIz/vdmXFwLdw+rlAOpyi4jEUUODfi4w3U9PB54NK7/An30zHNhROsQjIiLxkVZXBTP7CzAO6GxmhcDPgDnAE2Y2A/gKmOarvwBMAVYBe4GLYtBmERGphzqD3jl3bg0PTaymrgMuO9xGiYhI9DT5b8aKiEjtFPQiIgHXpIP+/TWVv8clIiKVNemg/8HDC+LdBBGRhNekg/7AoZJ4N0FEJOE16aAXEZG6KehFRAJOQS8iEnAKehGRgFPQi4gEnIJeRCTgFPQiInHUPC32MaygFxGJo7OH5MR8GQp6EZE4Om9Yj5gvQ0EvIhJHA7LbxXwZCnoRkTjp3aV1oyxHQS8iEidj8zIbZTkKehGROLnmlD6NshwFvYhInLRsXufdXKNCQS8iEnAKeklIfbo2zkEqaTzpjfDFIKme/vKSkJyLdwsk2sbkdY53E5KWgl6kEfzyO8dGXPfYRjivuql69OJhUX29Fs1So/p63Tu2iOrrRYuCXqSBxveNzalxd04bGPUAasq+Oyi7bPrEPuV/87F9av/7FxyXVedr5+d2qHd7Tu7ftcJ8r8xWjIvReyFaFPRS5vwTYv9V7Ibo27VNteV/nnFClbJOrZrHtC3nDO1eNn36wG4AXDDiSNbOKaj1ec1SrV7LuXh0br3bVpe1cwq45uTGOZ0vmobkdqBV86offJUDd3CP9hXmczrU3btOT0vh0nFHlQ0rRXKBsXF9u1SYP2twDtntQ8tqlpqYkZqYrZKo6pXZKqJ6t9VjeKHyP1ldLh/fO+K6o3tXHMt9+eqxVercd94gRsdhzLe095bZJp0zBnbjigm9+ckpfWt9zohenfhOWK80El3bZgBUG3CljvB1EtWpA4447Nd49rJRnDesBwtunMTim08GKgb43y4Zwc2n9WfBDRN57N+H07LS36tTq+ZMOrrm9+pPTunHdZNDPwBnDc7m/RsncvGonmV1hlbq9We2Secfl48um+/SJp3Zp/bjigm9Oe3YmvcirpjQm/wj678HEQ0K+iZkUKUeS6T+3/mDK7xxo2FafndunHI0AMNyO9ZZ/5pKYTiqd6da6885K/Sh819Tj6n28dOO6xZJMyOWF/ZV9PvOG8S8aj5cSv3homF8cOMk0lJTmHVyX9pkNAPgwpG5NK+mR/eXmcNJS03hhin9uHBkbll5Zpt0js5qW+0y+vi9mP+aOqDC3kL3ji147ZpxADzxHyPKyksD5KcFR5eVfS+/6lURv5ffvcK6Ho7OrdOrLX/1xyfy4pVjKqxruJqWX10IDuzeHjOjdXoa7VqG/s5XTepT9jpDczty8eiedG2bQUazVF798ThOCuuELLrpJB6enl82f+e0gfz7mPL/hTYZofPYB2S345Hp+fzs9GPo0iajQs/+4QuGcsvp/cvmT+rflWNz2vHFL6fwwA+GcPaQHNpkNGPWyX0Z2L3m/9ExfTI55ZjyD7+nLh1RY91oU9AniLp2Gbu0SeepS0Y26LWz2rXg5tP7c1xO+UG+W88cUOtzurWrvbc4rm8mk32P7ZJxvSJqx2XjjyqbPmdo7cNEQ47syNo5BVwwIheAD26cVGub75w2kGd+NLLsHzcSFjaaMm/WiRSE9cbyahguqs0tZxzD57edWuPjM8cexS1nlH9wDc3twItXjikbAgo3vFcn3r5uPGf5S9iWhvbLV42lZ+dWrJ1TQI9OLcvq//b8wVxzch9mjC4Psdu+cyzvXT+xwut2aZvBvFkncvNp/XllVs0fZvURvmdxZKeW9MpsXeMHWG2evDSy9/dZg7N569rxnNCramfhiHYZDO5R9QOjTXoak47uwtlDcrixoD9PXjKCn5zSl27ty/cOJh7dlQx/bCR8CLBdy2ZcOKon78yewJrbp5SVp6QYkwccgYW9kSaG7T3MOqkPr10zjldmjeXqSX3IP7JD2V7oHy4aypAj6+4gRYuCPgZKd+XrMx561/cG1vr4+zdOIiXFuOec4+vVlrVzCmjXItQTmnv5aOZ8N9RT7ndE7UFWenbDhSNzeSSsRwSw5vYpNEtNoXvHlqydU8CEflV3jR/4wZAqZT85pR9r5xSwdk5BhXBb/ovJQGg4qH9WW2af2q/KczPbpJeFeAffswt39pAcBvXoUHYlwNJeY/hxh/Drfg/s3p41txfwyqyxvHjlmBr+CiGDe7RniO9tRnMM9r/PDm3z/zl3EGvnFPC3S0YwMKcduZ1DAZ7ToTzIf3X2QNbOKajxm5Rd22Zw+YQ8zKys09AsNYUj2mUw7+qxvHRVxXW8eHRPenWuX8++8tlAE/t1oW/XNtz2ndAH8IhenXiyls5Ih5ah8ByTl1n2Plg7p4B7zjm+wvBKm/TaP6zNjO4dW9b4+FmDs8nr0pofDj+yrGzJz0/h4elDy+bzcztyWS3DiWP6hAK5Z+fyYc/s9i0qhHpNXrpqDPOuHssVE/Po2bkVvbu04cpJoW1zdFZb1s4pqDLOH2uN8/3bAMjr0pqnfjSS4275Z511Z4zuya59xfzbmF7c+c/PAUhLMYpLKp4cfnL/rvTLasuQIzsw6qjqhzLeu34i7cOC7YyB3fh80y4y0lJplpbCWYNzuP2FZTz90XpG9e7ElRP70KVNOu+s3sJx2VV3I78/tDsjj+pMj04tueOsY8nr2oY9+4tZun4nEOoZp1ioR/v2dePJateC1JSKb+7q3uxzLx/FkvU7uPGZpQBMHnAE/bPa8tnGndUeNAX4xZkDGNS9PRnNUnn3+gl0apVe655NwbFZLP96F5ecWL5n8OAPh1QYLik9KHbd5H4s/HIbV07MY8/+Yv7+8QbunDaQJxcVAnD/+YMB6N2l5g+8966fSIdWzUhPS2XvgWLunb+K8yI4YD0mrzOL123nzWvHY1T9Ww3IbsvufcW0qhRoQ3M78mzY2G8k/jRjGDu/La5Q9tx/juatlVvK5mvaOyndjOP6ZnJS/65l2y6rXQYbd+yjR8eWfLV1LwA/P+MYpo/MJXf287RJT2PX/mLyurbmjrOPA+Cta8eT3b4FKWHvlaP8h+2IXp1494tv6N+tLW9PGl/l2MLU47OZenzoGMaHN51Es1TjpLveJDuCg6nVKd1rORyl262+B9EB+h1R/72ZWDOXAN9Myc/PdwsXLqz380bcPp+NO/bV+3nXTu5L6/Q0bn72U1o0S+XpH40kNcW455WVPL9kIytvO5UHXl/Nr+eFQvrm0/pzsd8lds5x07NLuXBkLt978D227jnA9/JzSE1J4cqJeXz5zZ4Ku5TTf/c+Zw7qxstLN/HSp1+z+pdTqgRnuE8Kt3PGfe9w7rDuXDAiN6Jd4H0HD/H6is1MHlD36WSH465/rmDX/mJ+dnr14+YAS9fvoEXzVI7KbM3WPQf4dMMOxjTSFfoADhSXMH/Zpiq71KWeWlTIc59s4PcXVT0fe8XXu7jssQ956tKRZXtBySR39vMAvH/DRFYV7eaYrHZ8+NU29hwoZsqArLIQd87xwpKvmTzgiFrfy6VKShwvLo28fiLYX3yIs+7/Fz8t6M/waoaIEoWZLXLO5ddZLxZBb2aTgXuAVOBh59yc2uo3NOiLD5XwzEfr2VdcQtuMNIbmdqR5WgqpZlz+lw+57cxjSU0x9heXRHTd5/3Fh9iy+wDZ7VtQUuJYt20vR3aK7IyVSF77m90HKowJ1uTLb/bQo2PLiHYTRaJlz/5i9uwvpkuCn80j5eIW9GaWCnwOnAQUAh8A5zrnPqvpOQ0NehGRZBZp0MfiYOwwYJVz7gvn3AHgr8DUGCxHREQiEIugzwbWhc0X+rIKzGymmS00s4VFRUUxaIaIiEBsgr66geUq40POuYecc/nOufzMzMS+ToSISFMWi6AvBLqHzecAG2KwHBERiUAsgv4DIM/MeppZc+AcYG4MliMiIhGI+hemnHPFZnY58DKh0yt/55z7NNrLERGRyMTkm7HOuReAF2Lx2iIiUj+61o2ISMAlxCUQzKwI+LKBT+8MbKmzVrBonZOD1jk5HM46H+mcq/O0xYQI+sNhZgsj+WZYkGidk4PWOTk0xjpr6EZEJOAU9CIiAReEoH8o3g2IA61zctA6J4eYr3OTH6MXEZHaBaFHLyIitVDQi4gEXJMOejObbGYrzGyVmc2Od3vqw8y6m9lrZrbMzD41syt9eUczm2dmK/3vDr7czOxev66fmNngsNea7uuvNLPpYeVDzGyJf869liC3rDKzVDP7yMye8/M9zWyBb//j/hpJmFm6n1/lH88Ne43rffkKMzslrDzh3hNm1t7MnjSz5X57jwj6djazq/37eqmZ/cXMMoK2nc3sd2a22cyWhpXFfLvWtIxaOeea5A+h6+isBnoBzYHFQP94t6se7c8CBvvpNoTuytUf+BUw25fPBu7w01OAFwldBno4sMCXdwS+8L87+OkO/rH3gRH+OS8Cp8Z7vX27ZgGPAc/5+SeAc/z0A8ClfvpHwAN++hzgcT/d32/vdKCnfx+kJup7AngU+Dc/3RxoH+TtTOj+E2uAFmHb98KgbWdgLDAYWBpWFvPtWtMyam1rvP8JDuOPPAJ4OWz+euD6eLfrMNbnWUK3X1wBZPmyLGCFn36Q0C0ZS+uv8I+fCzwYVv6gL8sCloeVV6gXx/XMAeYDE4Dn/Jt4C5BWebsSujDeCD+d5utZ5W1dWi8R3xNAWx96Vqk8sNuZ8psPdfTb7TnglCBuZyCXikEf8+1a0zJq+2nKQzcR3cmqKfC7qoOABUBX59xGAP+7i69W0/rWVl5YTXm8/Qa4Fijx852A7c65Yj8f3s6ydfOP7/D16/u3iKdeQBHwez9c9bCZtSLA29k5tx64E/gK2Ehouy0i2Nu5VGNs15qWUaOmHPQR3ckq0ZlZa+Ap4Crn3M7aqlZT5hpQHjdmdhqw2Tm3KLy4mqqujseazDoT6qEOBu53zg0C9hDa3a5Jk19nP2Y8ldBwSzegFXBqNVWDtJ3rEtd1bMpB3+TvZGVmzQiF/P855572xZvMLMs/ngVs9uU1rW9t5TnVlMfTKOAMM1tL6KbxEwj18NubWekls8PbWbZu/vF2wFbq/7eIp0Kg0Dm3wM8/SSj4g7ydJwFrnHNFzrmDwNPASIK9nUs1xnataRk1aspB36TvZOWPoD8CLHPO3RX20Fyg9Mj7dEJj96XlF/ij98OBHX637WXgZDPr4HtSJxMav9wI7DKz4X5ZF4S9Vlw45653zuU453IJba9XnXPnA68BZ/tqlde59G9xtq/vfPk5/myNnkAeoQNXCfeecM59Dawzs76+aCLwGQHezoSGbIabWUvfptJ1Dux2DtMY27WmZdQsngdtonAgZAqhs1VWAzfGuz31bPtoQrtinwAf+58phMYm5wMr/e+Ovr4Bv9wf3t8AAACjSURBVPXrugTID3uti4FV/ueisPJ8YKl/zn1UOiAY5/UfR/lZN70I/QOvAv4GpPvyDD+/yj/eK+z5N/r1WkHYWSaJ+J4AjgcW+m39d0JnVwR6OwM/B5b7dv2J0JkzgdrOwF8IHYM4SKgHPqMxtmtNy6jtR5dAEBEJuKY8dCMiIhFQ0IuIBJyCXkQk4BT0IiIBp6AXEQk4Bb2ISMAp6EVEAu7/A6SijxMjKxrLAAAAAElFTkSuQmCC\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(rewards)" - ] - }, - { - "source": [ - "A partir deste gráfico, não é possível determinar nada, porque devido à natureza do processo de treinamento estocástico, a duração das sessões de treinamento varia muito. Para dar mais sentido a este gráfico, podemos calcular a **média móvel** ao longo de uma série de experimentos, digamos 100. Isso pode ser feito de forma conveniente usando `np.convolve`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 22 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXsAAAD4CAYAAAANbUbJAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nO2dd3gVZfbHvycdAiGUAKEZelGqkY4gICDo4rr6U3dVVKxrWdeKde2ylnXX1bWiYu8FpYmAKCol9AABAgQIBAglQALp7++PO3Mzd+70O7fk3vN5njyZeeedmXfu3HvmzHlPISEEGIZhmOgmLtwDYBiGYYIPC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMDJIR7AADQokULkZWVFe5hMAzD1CtWrVp1SAiRYaVvRAj7rKws5OTkhHsYDMMw9Qoi2mW1L5txGIZhYgAW9gzDMDEAC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMDsLBnGIaJAUyFPRGlENEKIlpHRBuJ6DGp/V0i2klEa6W/flI7EdFLRJRPROuJaECwL4JhwoUQAp/n7EFldW24h8IwhlgJqqoAMFoIUUpEiQCWEtFcads9QogvVP3PA9BV+hsE4FXpP8NEHXNz9+OeL9aj4HAZ7hnfI9zDYRhdTDV74aFUWk2U/owqnkwG8J603zIA6USUGfhQGSbyOHaqCgBw6ERlmEfCMMZYstkTUTwRrQVwEMACIcRyadNTkqnmRSJKltraAtij2L1QalMf8wYiyiGinOLi4gAugWHCB4V7AAxjEUvCXghRI4ToB6AdgIFEdAaA+wH0AHAWgGYA7pO6a33//d4EhBBvCCGyhRDZGRmW8vgwDMMwDrHljSOEKAHwE4AJQogiyVRTAeAdAAOlboUA2it2awdgnwtjZRiGYRxixRsng4jSpeUGAMYCyJPt8EREAC4EkCvtMgvAVZJXzmAAx4QQRUEZPcOEmVrpnVUYTmPFBt+v34dVu46GexiMDlY0+0wAi4loPYCV8NjsvwfwIRFtALABQAsAT0r95wDYASAfwJsA/ur6qBkmQnjn150AgFnr+OX11o/W4E+v/hbuYTA6mLpeCiHWA+iv0T5ap78AcEvgQ2OYyGfbQY+jWnmVr599eVUNVhYcwYiuPB/FRAYcQcswQeDRWRtx5YwVyNt/PNxDYRgALOyZKOPD5bvw2co95h2DjKzxnyivDtk5K6pr8I9vc1FVw9G8jD8s7Jmo4sGvc3Hvl+tt7fPBsl3YeajM1XHIE5Wh9MO/94v1mPn7Lpz97OIQnpWpL7CwZ2KSkpOVKD5RASEEHvomFxe+8mtAx5twemvNdgqhtP9l2yEAQNGxchwqrbC0z9wNRciaNtsbCcxELyzsmZhkwBMLcNZTP3pdJwMVdh2aN9Rs31tSHtBx7XCkrC5lw/8WbzfsW3yiAmUV1XhtiaffzkNluPWj1fh4xe6gjpEJHyzsmZjE6x8vAvOPv3poFgCgVVqK5vZtB04EdHynmD28znrqR5z/36UorfDMKdQKge/XF+H+rzb49T1cWoGsabOxcPMBS+cuq3A2T3Gqsiak8w3Xv5cTUw83FvZMTBNoKJRsptETrtW14Qm2+s6C3//OQ2XYXuyZqyg1mEjeVOTxKHrn1wJL5z79H/ORf9D+Q67nI/PQ9cG55h1dYsGmA5oPt2Bj1cTmNizsmZimNkDN/rf8wwCAlxZu09xeFaY895U2NeSftribjHDjPnsup1v2h+cNKNQs33EY2U/+iHm5oU8qwMKeiXpeXrQNd362VnNbgLIeW0zMNG5r9vtKTiFr2mx8u3avq8dtmZbsXe720FzNCetgpoQ4WRk6F1XA13zn5C3EKTmSl9a6wmMhO6cMC3sm6nn+h634arW5cHzw6w2ue6XY1bDNeG7+FgDA3z7Rfng5JbNJ3ZxDZXUt1u4p8a6T5ED6a/5h3dw3gc591ITY3KU83dh//YwCl11v9ZAfag0S40NyPiUs7JmoJGvabNz3hbm/vdKM8+Hy3brmGKe4bcZJSdT/yd43wXmlrMR4a6JAby5ALazJps9pqOc21Oa7/cdD4zU1e73HfPP1GnffzKzAwp6JWj7N8Y2k3V5c6tdHrZAGatZR47YMS06o0wgHPf0j8vYfR8GhMmRNm42PVuxyfNz4OGvCOU5HiKuFtcXDeQl11K/64ZSU4FwU7iguxUPfbECthZtdcPgkAGD/sdC55MqwsGdihjEvLPFrU/88F2856Oo50xsmunq8FMXr/4HjFXjz550Y9fxPAIA9R045Pq6eEAeA2RvqJhP1uqmFNdmMHS456dx8tufISaxTmJ2soH6ot0hN1u5ogZs+WIUPlu3GVhPbf/GJCnTKSAUAnKqqcXw+p7CwZ2Ia9eu8kfWhsroWk176Bb/mH7J8/GqXNdZklQYaqDeRTFqKdgLcE+VVPr7oeh9PpcpcdeSkvZq8pQ598wFgxLOLMdlmBLRbnxsAlFV4BHd1jf4xtx44gbOe+hE7ikMzN6AFC3sm5thz5KR3Wf2bH9lNPyXxvpJT2LjvuC3f7CqX7TjJicER9o00hP2O4lJMfTfHp03vYaiM3gX0Hx56lIdY01V/biWnnBeM31vieaP6YlWhbp/cvaH3vlHDwp6JOUYoEoXd+tFqn21G5gdZPOxWPCzMqDHQ9pyg9uLQe5b8aUA7W8fVemaMfmEJVhQc8WnTM/esUZlRGibZE/bqCeK1e0rwyLe5ul4+xSc8Ub2L8qxF9cpU1dTio+W7/Wz26jcTJ5yq1H9gac0XhRoW9kxMIycPk3n7151+Oej3HDmJDQ79oqtq3fbG8RX2esLQonONl2cll04zCo9qzwscV7ms2nXFVNv8L3zlV7z3+y6/ojAysqZ8rerNw4zXl2zHA19vwOc5vlp4WoPA51aM5me27GdhzzARx6SXlvqsj3h2MS54ealO7zpOf2SenznCyI7rBPVEpJ4Zx6p3jczPW61F0Cona5WotdpaIXD9eznIUb0Z6KGnWS/bcdjS/laRbeay6UXG7n06dqoKX632fWAcLtM3BVVUh35CVg0LeybieG5+HuZv3B+047dpop20TMZKgI+W5lpWWYN3fyvwaat2WbP/RFWYRe/wahu6kkADoLR4YcFWn/XiExVYsOkArn/PXPP+bt0+fLNW23//pI5ppOCw/0RnTa3Aw9/k+szJKDl4vBxfSf7tB1R+9XbnPvo+9gPu/GwdNu6re+NTH1NJhc7DbF/JqaDcDy1Y2DMRxyuLt+PG91f5tdfUCld+GOkNkxztpzy3nvfI9Ll5PutVLmv2TVTmBr0UBvM36tuyQyFb5DQSRy24VN728RpsLtLOpaPnovjYd5v82tbsPor3l+3C3z/Vji6+Q9HevplvSuqaWoH8g6XImjYby228TWzcWzfuHq0b6/ar0LiO938vwNDpi3Drx2ssny8QWNgz9YbOD8zBzR+sNu9owiYdwWIHPWHfv0O6z7rbrpcNk6xN0KrZUHgMD3/jmfB0w4PnyhnLMeCJBbrbW0spnxPsRlepsOOPLkft1kjX98rifOQfrLOV/7a9TojLkawyNULgmTmbAQCv/7xD9xzPzN2MborMnD9trYvLGNalhe5+WuUpP1qxR3MswcJU2BNRChGtIKJ1RLSRiB6T2jsS0XIi2kZEnxJRktSeLK3nS9uzgnsJTCwxL0DzTiBeF0rBeqqyRtNdsEtGI591ZWRpba0wfNW3NgZfQW1Vbl/y+m94f9kulFZUY6mNOAE9ftl2CEfKKnVt0bLg7dgiNaDznLKRIE1+rtTWCuwrOYXn5m/BJa/9ptlXbbOvqRVYmOcR3Ivy9APrXl+ywyff0dDOdQLeaJ5kh0buncY23VMDxYpmXwFgtBCiL4B+ACYQ0WAA/wTwohCiK4CjAKZK/acCOCqE6ALgRakfw0QE3wSQk0QpaEe/sASXvv67Rh/fdeXE3yuL8zHo6YW6NmUr2H1Y1dQKHC+v8nq1LNx8EFe/s9Lx+dVco3Msed7DKDLXCqcqrV+vLGxrhMDlby7z7C89kI+ZmJOcJmLLaFwXeWv3EFbSK7iJqbAXHuR3oUTpTwAYDeALqX0mgAul5cnSOqTtY8huViQmavlpy0EUn3CneMPGfcfw8iJ7ics+DKAykVogrCs85memUNvQlRO0SySPl0CSbvnbwI0FxqSXfkGfR3/wrt+hY892itI0okR+MDr55Zcoom+bNUqyLBTlB0tNLbBLykEjP59HPm9chN2p4FW+WdUKgRlLd+K5+Xn6OyjI0ckgGiws2eyJKJ6I1gI4CGABgO0ASoQQ8jtWIYC20nJbAHsAQNp+DEBzjWPeQEQ5RJRTXOxu4QQmMhFC4Op3VuKyN/w1Yidc8N+leP6HrYZ91JpwUYn1/DGnKmt8smC+9ctOvz5+9m/VqnKCVv5xV+j4jjvBzIyTF6aiIAelB7qT9ABK09fD3+Si0wNzLAljWdgfVXgiyZ+PWe6d71R28xcXbLVUhvGmDxSOBAJ44vtNeMWk/m+4sCTshRA1Qoh+ANoBGAigp1Y36b/Ws9zvTgkh3hBCZAshsjMy9EPUmehB/r1q2S9lRktJvewczwi1Nn7QxltFz0fm4V8Kl8IvV/uHw6vH0CzV19NHy/UykND8Sb0zHe/rFupJ5x83+QvFuZI/vlk+fy3ziVbZPjmD6c9bi5E1bbbmseT9lG9OAsJSKoZftvkqnP9ZuA1TZ3rcRn/NP4SsabNNJ9vdzLcTDGx54wghSgD8BGAwgHQikmcY2gGQHWULAbQHAGl7EwDWIiuYqMb7am/Qx+hBoIeRO6bd4KJAGdTJ9yVWK1gnkPS2Qzr7vSSHnNtUroLXafjSWw1SeusXf8+XCf/+xa/tsCTI//dTvu6xrnp7hV9bVY2wlD5Zzw8eAP7y1nIAwAfLjFNIq1NLRBpWvHEyiChdWm4AYCyAzQAWA7hY6jYFwLfS8ixpHdL2RSJUUQNMRFNnx3VXAMvfLq2vmVNty2nZP2WQDaBdlGOrSSlDNXn7j+OdXz0mJPXRwvHDmptr7hE1tIvnoWRUkWnBpgN4Zq41+7b8nXFiWtebV1BiZR5pywHjlAdHDQLZjLhueEdH+9nFiu9PJoCZRBQPz8PhMyHE90S0CcAnRPQkgDUAZkj9ZwB4n4jy4dHoLwvCuJl6iMvBpF4Kj57CjkOl2FfirzEfL3eWJ/3Vn5zZXZXeGYDH5FFRXYN4xQPOivBRImu61wzr6Gekj1Q9qpmUH753uya6faxE18pU1wg8Omujo7eitTZz3euR1sBYXOq9zew+bOx91ad9uuF2tzAV9kKI9QD6a7TvgMd+r24vB3CJK6NjogorZhw91HZXZaTq6Bd+QnWtwMCsZv47OpSFTic2m6uKYFTXCnR/aB7OPK2pt00vmZgVIkGzt4a7I3t/2S5NW74V1u62J+yzmjf0VpRSYpbBVK94ydnPGXsCZSu+G8GEI2iZkBHIBNYuxY/vVGUNXltSp3nLppKaCNRyZW1Pr1C3HY6drLKl2RYdc/5QCRR54nXFTnfs2E4FPQD8bjOZml49XrM6uQePOxtjqBzTWdgzISOQGBKl//oJHdOMlmdHuMW/m7VVNxYdw3u/+04SGj3fLvivvepNbmImGJduCzyKN1jojd0sqZ3Te223hKNTWNgzIcOJfVkIgQWbDvjYQ4+d0hb2WrbZUCv7ZRXVPuMwE3p6ZE2b7edi+MrifNw6uovlYwSiDQfKGoXppEDDw+qKGctDORxbqEs/ymjlt1GiDnjL23/c0kR/qBzGQpucgYlpnMi9GUt34snZmzFU4XJ47os/W95/9e7QRine9fk6n3Ut3+zz+xj7yiv91pVFU37NP+xXNtHtZ9nbV2fbLgiixU6FgB/1/E946fL+OHSiAteGyPMkGHyrk4ZZDy0XUk1Y2DPRhmyzlwXUF6sKMbxLC7Q2yC//5GxPJkK7Hiwyf/0w8CyZgaBVg9aozi3g67depkoE5nISTT9G92gVlOPeLvnmbztYig6q9MKRhtIcGIr8NWzGYaIOWdjLybnu/nxdRL/Ou4GWZm9nolrd1T/rpfvCKJjeIR+v2I1/zrPmW+8WRoF1fTVcQ5XC/sUfjdNx6GHnIREqMw4Le8YV9L7cQghvoJGydJ1snlDmG49GtD4WI+28TJUnXy3MQ6FpntFW3ze+PmKU0fLu8d392pR1g79Y5Z8iwwr/WWg9QV+o8kSysGcCZs6GInR6YI5m6t73ft+FSS8txW/5h/Dh8rqMk3IIuhJ19Gm0onYRnbOhCFnTZuO6mSv9hItSTt00srPfHMRelc9+kt1K4xo8MLEnLh/YPuDjuMnoHi2Dclx1MRjA15/eaaUxW8Le0Rnsw8KeCZj7vlwPAPhcQwvK2++pCrXzcJmpa5q60He0otbW5XmFHzcfRO5e3wee0uX0tSXbsXiLb8Ku3YoH7PIHxmDj4+NxaXZggjopIQ4jutpPTtiiUbJ5J4cESyAmJ/gLe6UHlds1hLXQ8y5zGxb2TMDILmk/aFSRypVqdC7bcSTkbpCRipFZQZ2Qy+wzi1MYfFulpSAxPk63Lm2wCaY1wqkLqxmZGs4BynkRvYLnbtKicfAekkpY2DOuoZViYIOkqS42KPWmh7KIRTRhJOzV+ffNkqZZqVyVZrH8nbKEoLqwuRXcKkqjRbA07OYabyNK000gZSz1yGru643EZhwmIjlUWoGsabPx3bp9OF5ehSe/3+Td1qJRku5+aSkJttMl9Htcv6B1faZWCNTUCgx5ZqFfmcRyVU1X2fU0EBIs2vHH9apzuxwaAamUlVRVh+5txWmJQquo8+4EWrrRKizsGVtskbT36XPz8MycPLy1tK56U28DL47z+7aJWjPOZzcOsdW/tLwaldW1KDpW7p3vkLFSaMMuWsLkvDNa+7UpTUiRVkk0GLni9dIvh8JOr4Rz4zARyQGpCtDeklPe/N1yHdbzemfins/XadaF/WHj/rDZkoON3QIpLy3K934Wai2y3IWShWkpviYYLcVeK9mX+s2rbXqDgMcSyXRt1UizPdiafbhgYc/oIoTw8xzZXHTcuyxPmsn/5+Xux+erCjXrwhYcPomhnVtonqf/4z/gjk/WaG6rDxxxULSi1yPzAfhPPBpVTDJiYu86TT1O9fDR0uzj4wjjT/eNllULuQYabolGhLgoWMDozTEEazJYD9bsmbDT+9EfcI6qJux36+oKM/+oKshcWmGcKEqtccocPVmFb2zmHXGbu8d1c7yvmxPJLR16ZijNLuoHtJawv/Ss9pg6vJNPmzrRl16qXz3s9jdjapDz6Dx/SV/N9mCbG9VzW2yzZ8JGaUU1sqbNRmlFtd9k0sET+vnU1bnLlfbnsT1bRrQZZ4jOW4cVurdu7No4lmwtNu+kgZHASIj33fbjnWdjcKfmGNixGWZMyfa2b1NFMyfpZH/Uw+lbiR7BNKe0SkvGsC6ee948Vd+xIBh8fP1g/H1snXLB3jhM2DjjH/N1tyl/fyO66gvI8qoa9Hh4nnd9cKfmPtkcI4U2kp91IIXJu7RshC9vHurWkByhHL16cjVBdW2dM+ps1crUCEoTHQAkxYfXLuM0VYEVFtw50rusNnsFkxFdW6Brq8b429iu3jZOl8BEPOkNPRqRlqDUCg5atsN9jwqnvHbFAKx8cKz3XSM+gB9cw6QEDOgQmjqiehjJq8Nllbhy8GnedaVwaZWmn3HULH97sLGS5O2/l/tVTLWE0qQYaHyAnYLh708d5F1u38wzAc6aPVNvsPK6LSBw48hOpv1CxYiuGchonOy1z8bZ+CXcf14Pv7Zwuyoanb/kZBUenNTT9jG3mAR0BZvINfoBtymKyDx0fi9Hx/j8xqF47YoBIXuzYGHP4EhZJY7rlPpzyk9b/CNmX9Dw0gkWPTPTDLfLNm55HsHOJNmNIzujkyLaNBIwG32lg0T46RpRtI0tRuO6QSA1i43o0lLb5RKw7hlz1zj/bJl2ad0kBRPOMC5k4yamwp6I2hPRYiLaTEQbiehvUvujRLSXiNZKfxMV+9xPRPlEtIWIxgfzApjAGfDEAvR59Afb+2nlapf52ydrfdZnLN2JvSXuFsD+6e5RutvMfrPqH7WVH/n401uhhzQZG2la51drjMvfNUryCOnbbJQ1/EPfNn5tTtIoOMXK/OzI7vYTtv2osNeridbAP8CaZl8N4C4hRE8AgwHcQkTye8uLQoh+0t8cAJC2XQbgdAATAPyPiOw57DJhxWjiVcncXP/EZ3ocOO5+3pQsA+3a6oSrnOjKimb/+pXZmHfH2dYGF2TsCt24OELB9Em2NNLxp3t895VvMWYxBdcN74ibRna2NTYtRvdoaclmn5aSiB1Pe/VM3DyqMz5Q2MXVPOTAnBUtmAp7IUSREGK1tHwCwGYAbQ12mQzgEyFEhRBiJ4B8AAPdGCzjLsdOVaGi2j88f3An37woe46c9EbORhp6KRrMZL0s2+VJSLtm02BUiLLD97cNd/2Y6jmVoV1a4Pf7R/t4rsjLKYnaouOh83uhUbI13U7P5XFsz1Z4++qz0L6ptfKFSpv39+v3GZp/AvG6knnnmrP82sxKTQLASw4nk93Cls2eiLIA9AcgV564lYjWE9HbRCTXMmsLYI9it0IYPxyYMNH3sR9w0f9+865nTZuNmb8V+PUb8exiDHp6YQhHZh09bwyt6M9hXeoeYuq6n+GeYLVLexfruA7q2AyAtsDKbNLAR0C2TW+AgumTsPyBsbqBaLLw7WpgGwf0I3RrpNw0vTVKBpqx58gpNG2o7zfvxl0epfE5vXlVXbyC3ptxqs2IZLexLOyJqBGALwHcIYQ4DuBVAJ0B9ANQBOAFuavG7n6PWiK6gYhyiCinuNhZIAnjnG2Sp8XGfb6+1f+YtTEcw3FMok7gT8Mk/4nEBIXLjSy/5PS/ekLg+hHBjeIMBKMso3aQg67s5P9q0iARt47u6tP2x/4enU42iZlNsOoVs1Gn4bBD4+QEpFp8s3CKlmKgDEB79A+na+53tgXtP5hYEvZElAiPoP9QCPEVAAghDgghaoQQtQDeRJ2pphCAslROOwB+sfBCiDeEENlCiOyMjPB+CLFIcWnwco87wUwL1EPrrXxsz5Z4WMMdTlkFSv7BJkuZD/Vs9r3bafvPy/t/fpO9jJdu4pYlSb72QLM9pjf0zCPEe4W9cX+9eRzZlVcvvYYR8fFkrNkH8Q1umuSSm9E4GZec2c5nW9v0Bq6nk7CLFW8cAjADwGYhxL8U7UqfoT8CyJWWZwG4jIiSiagjgK4AVrg3ZMYNjL54Rn7z/YMUPETkzJ6qtc9bU87yKxABAGWVdUFC8l7HpZJwejKgfVPjzI+h9E5R888/9XHlOHKErdF9//624XjtigGGx5Ft8LIZx+zhcUZbbfdYWaN/aFJPPGLRh13O0NmuaQOkN0zE+X0yNR/EWt/fyf38vY6ccOPZnbDj6YlIS0nEMxf19tlmN/VEMLAygmEArgQwWuVm+SwRbSCi9QDOAfB3ABBCbATwGYBNAOYBuEUIEfzaXowtWjXWj5w0ErqntzH2X7fCoxf0woWqH1gcEZo5yFGSoVP3VEuDG9WtpWK7578c6aun2evVVd15qMyvrbVBNGowOPO0puadLBAvmbeMhP0ZbZtY9gk/Q/qO9G9vPL42TbQfpLXSOFKTE3CtxehUeXK5b7t0EBFe/vMAnJXVzKdPzkNj0UfjTe2JC8+wdA4ziMj7oFMXjFGnrAgHVrxxlgohSAjRR+lmKYS4UgjRW2r/gxCiSLHPU0KIzkKI7kKIucG9BMYJRknJ9IT920t3ouRk4MFXU4ZmITXZ16ZeUV3ryMPFzmv5PEWNXHm/RtI4GupMniXreJ3IKGMH/jKog+WxuIHepdsVK3KQUdMAE4LJz4pBnZpj+QNjfNIua6FV/xUAaix+D/oqJnDJGySnzZJ7Ruk+uPXMRaMc+PDrYbVaWDAJ/wiYoCGEwKK8A5rBT0a/Jz0l5PHvN+H79UXaG21ARLhYZdOsrK7VtPEqPWiCid5Dw8yMfbKi7qX15lGB+5e7gd1H5l3juuH9qQP9NGG7KD25jHLuyOgJdavZLpVxFrKicEqnQLiTNMLPumQmA/yTzIUDFvZRRnVNLW7/eA027TuOV5dsx7Xv5uAJRZ1YGSNPCbVbYjDo38H3Fb9FoyTU1Aq/4tjn9vQtsBEIsouhFnoPuETJU2WgjiBUCqxQa29W71Oyib04MT4OI7oGrsUeVgVcDeroeVC/8mdtW79aB5FNHVZ81gHf5HVyLd+vdSKJzfLPTOrtb6IKdDJX77rDBQv7KGPHoTLMWrcPE1/6Bc/O2wIAmPn7LszLLUKZorjI+sJjeocIC/FxhFoh8CeVxq/8kVqN7NXjuhH6idi0BOel2e3RvFEyCqZPwmc6XjdWA4jcpGD6JM+CjixSm8OSwmRCaJqahILpkzCpT6amSadG9dok55dXpmA2QvnduELK6qlnSjMzmb94aT+seHCM3z5P/7G34wC2SX1Cl/fGCizsowy97/RNH6zGtK82eNeX79RPNzw3N3BTjV2ICEJ4XrevHprl0y5z7bCO+G3aaEfHv/+8HprauSwYSeOXcG4v/bcK2QunV6Z54I+ebdpNOiiCrNQvbZP7u+NtYkYPgyIu3Vt5Jm1lU9fAjs1QXeM70LvGdcODE3viAo2cPEr+fWk/AHXzLYDHx/+tq7LxmI6Pu555RyYpIQ4tVU4L8XGEPw/q4JPzvz7Dwj7KMHrz3H2kruqU0WTo6t0luttG92ipuy0QjpRVorSiGodKK5CSWKctKzWyuDhCG40i2B9ep58LRaZVWophGmOtj23fMf3EbfKErpXJxFJFXninWSO1JpCV9/rZi/Xty+eFKLOiUVKyW0d3wZc3D8V9E3rgzauy8f7UgX5BU8kJ8bj+7E5+DgK3j/EN3jq/TybuHtcN94yvy/NDRBjbq5WuKa2Rg8/9pMkDor7Bwj7qMJD2CsFkZQJN+xDByQkjuzJ+u3afz+u9cmJN71Vcfv0HgDeuPFP3HHYn6YwmCmWBVGthMvGEwnw2pJP2hLPaD1vtpy3nAFIH68go507BDLIAAB5KSURBVGDUIwpVJoi2Gg9imfg48rqKnturFZIT4i1PxGarXEwT4uNw6+iufh5dRlg1ZXXKqJv0VR5f+WCRuXxgB812La4ZlmWpXzBhYR9lGP2wjygKYzv10Q5iWVAvyrwvPpq9wcWdJgVR6b1yt0pLMfxstCbjurbUN0skeAOH7H0getegFkbqdXm/sxSTzMojpSrSQ6ifx6EoaD2sS3NcMeg0844K1MJezx1YmWbgkxsG2x8crJcenHVrnX1emcvmNI0gvWcu6o1bzrGWMtrouxQqWNhHGUZf6T1H6swSTos5Oy2IbQel0FAKLiOZNfOagbh9TFdN+/hzF/fBkM7NbQs9I/kgexPp+efroTeERJN6r17ThuLzUNqse2TWCZN+qijRUCj2fxrQznbFJav+9ACw4oEx+PLmoX4ZWa1iteyk8jNVmpMCVXL0ooVDSejKzjAhwaq72M/bIjf5nFJoLMqrq3hl5GqY1SIVd56rnYUxo7EnmMaugmv0WT5zUW9cMyzLtjlMT76ZuW2SV9YLRRvhg6mD8P6yAiQn1D10/tC3DVo1Tsalbyzz9gsWk/pkYvb6Ikdup2qFw+j+tkxLQcsAIpSdpOJQfm5OzZf5T52HgsMnDatjhQrW7KOI4+VVun7GMq8t2Q4AeOfXghCMKHDi4wj92ns0VacR57JA1hImsneIli+6kYxMSYzXDL03Q8scAAAX9PH1QFGfW09YDe/aAq9fme3XrpzIDmbuffnYTu6NOuulUVR3oITClKVFQnxcRAh6gDX7qMJKacHpc/NcqSQUKpQTl04LM8sapNbut47u6peq13u+IAiIjhrVtQZ0SEc7VcK1MT1bIS0lAcclTx5ZMFo1JyhTAARzmkWeS3fyWQWrxqwWgeamkYeqVaqxvsCaPeMKcnpbtyk8esorrALNJWXFnKFMtbxi5+HATqg5Bv+27q3T/K6tSYNEzL59hHf913zPWL5b55ctXJMmivsRTJlaG4Bm73TeyAlOFYVogoV9PWb5jsPImjYbBRoZGENF89QkbHlyQtBCw1ftOqpYc/aDlQWs2e99zcPn+nhjHCo1rrdqh/sm9ECvzDS0VmR6bCNNJv+hbxvNB5GWgDqh8Nm3SqVBYfhAkeW1k3kBdVCV1UnUYBMsxSXcsBkngjlwvBylFdW64ePfrPVoeb9uP2RYfDuYpCTGIzkh3kcMd2jW0CeAyy2cygLZVm8mkNRZH7cXlzo7oQY3j+rsnR8474zWmHBGa0zuV1etM2+/f6IsrdE6sWuv31NiOd+MXWQvIidmEqXb6gMTe0SMbXvtI+PCPYSgwMI+gpHrvnpzoahIkn5oVdXB09zMGCj5fSsF6ZmnNdUV9p0znD+UQq33bZVKN7rNq1f4B35pmVq0nk25e+1nT3QaQGeFJy48A+2aNsCo7vYjq5U2+xvOjux5pLQGHlHZKk07TXJ9gIV9PaZK0ozCWWJQjvRUCiYj7w+tdAdK1JWfOrZIDdjobJQmwYhQBsLIV9gzMw3T5c/Upcfb6J7BSXEBeIq7PDjJWjUpNS0b1x/BeU73lvjX//WNuORmdmCbfT1mzgZPwrJXFm8P2xjkPDZKsbS5SF8jNpuUO3bKtziK0uUwmP7iWgQrD5AW8gNySKfm6Bugq6kavaId4SZbSkx3ncVqVOGEiHDRgHY+8Qz1DRb29Ri5apS6xJ8dPphqnkTMCsrJxC0G5g8zd7uemZ5Iw2uHeQRAIAU1ZN95py8GoawbKrwTnYpGDWFvZ/Lwrauy8anD9AKhxEnAE2MfFvZRQEJ8nKWEXDJZ02Z7l4cHmCNexurP1UzwPj7Zk6L2ppGd0LRhok+6Y7s4qWmrxKzoh1WsJOHScmFs1rBu/PIEq53Sh2N7tcIgh+kFooV7xnc3TL0cS7Cwr8dcdlZ7AJ6MiP/7KT9o51ELXPm8SqxaWJSavVYmQNkdr2VaCtY8Mg7dFT9Uu5GgRcfKAQB7j+qnKjYiOdH5K/tfR3X2ZuDsoBM1q6QulqDug1SmIHj9yjPx0fWDcPc4a1kWGQ+3nNMF8+44O9zDiAh4grYekxAvuxQCz/+wNWjnaZPu682hLNwtY2RP3/T4eCzZUoybP1ztEwGqFU2qDqEH6kxEdmNwZBfQds2MJ4X1cKLZt01vgN5tm+DeCT0AeEwpfdqbF7/wPgT1iogTMLSzO29hkUboQqtiGxb2UUKz1CQcKXMvCEhJlSr4peRkFR6c2NNH6zZS7BsmJXiTWCknaLX20cqEKAfb2I24TEmMk87jzCbsRNj/qqqkNdag2pUdIiXgyE2i74oiG9NvMxG1J6LFRLSZiDYS0d+k9mZEtICItkn/m0rtREQvEVE+Ea0nosiquhtFyHKxvKomaIIe0M59f/3ZnXzyjJt5yshavFwrFAC+X+9f/vBsjcLX8gSeXWEve3uo3TmtEsoJWjPClcgrmLSV8gEp6xcwwcOKZl8N4C4hxGoiagxgFREtAHA1gIVCiOlENA3ANAD3ATgPQFfpbxCAV6X/jENOVlajYZL/rZJF39Nz8oJ6/gwL/tC5e40LmDeTik8r2bTPP0BIyzPj6Yt64+VF+bYLrjx6wem4emgWWjusAevWBK0bRGNul0m9M9HsuiQM6Rzbk8ihwvTbLIQoEkKslpZPANgMoC2AyQBmSt1mArhQWp4M4D3hYRmAdCKqv5EILiGEcJxqttcj83WOGciIrJNoISpJq/jGvRO64zmD2qhWldXOGY3w4qX9bGvaSQlx6NbKuSdGUnz99amuDxARhnZpEfL4iVjF1q+HiLIA9AewHEArIUQR4HkgAJAjUNoC2KPYrVBqUx/rBiLKIaKc4uLILaThFh3vn4O7PlsX8HFeX7IdP0gTpBVVdQWRz8pyVmbQCu2aNsDFOrVPZZR1YGW6t2qMS7L9PXdkjjtI6gUA/7msH2ZM8c/h7jaJCaETQt55BZ6tZIKEZWFPRI0AfAngDiGEUYIO7fxN6gYh3hBCZAshsjMygpOkKdL4yqSwiBHHpACqZ+bm4Yb3V/kdzzc7pDWmDDGvGdqjdWPExZGhhg5om1+ClcJ2cr+2GNPTnYlP7eN7gtQymzjz4nECK7dMsLEk7IkoER5B/6EQ4iup+YBsnpH+y/XjCgEo1bl2AKwl4Y5S7AQ86fHb9kM+6+8v2+V7DgensFLPU37FNnvV1hL2ai8eM+6T3BXDzX8u64+C6ZMcT+w6Qf74QlnQg4ktrHjjEIAZADYLIf6l2DQLwBRpeQqAbxXtV0leOYMBHJPNPbHKzsOB55tX1/h8+JvcgI95pgXTz+Yi/5c4rYhE2TWwqSKcv1xhZtIiSxVs9OeB1qNDo41mqZ5JcHWa5Wcu6o2+7cz99BnGDCveOMMAXAlgAxGtldoeADAdwGdENBXAbgCXSNvmAJgIIB/ASQDXuDriesjyHUcCPsb+4+V+2n2gNE4211wzNTxZtLR42TVQqZdWmKRevnNcd9z+8RrveiS5Ooaai/q3hRACF/b3nd66fGAHXB7DD0HGPUyFvRBiKfTjH8Zo9BcAbglwXFGFVlSomoMnypHRKNlrLlHb4P+7cBsOnnA3lXGDJHNvk/SG/vllxvVq7dcmW3mUJqvKamPNvqzCd4JWy6MnVoiLI8PJbIYJlNhVpUKIme03d+8xDHxqIT7PKfS2qQtnuCXo7SYH03IXvW10F782cqDZK/OZF0yf5GeqYhjGPfjXFQIqdDTcrGmzkTVtNj5cvhsAsKKgztwTjBzkfx/bDRdKpfCmnWdtMnScRri/VoBPqvSWoJxkNRP2IzSiZRmGCQ6cGycEmAm9j1d4hH2ipNl+tnIPdh1xPqk7Y0o2ps7M8WufOqIjGibG465x3ZCabH7rVz98LtIteqQkxMd5I2QfkiaP9R5yMpzHnGFCBwt7FymvqsHGfcf9wvorqqzViJWLNt/75fqAxqH0QR/ZLQNLtnqC1uLIo5VbEfRA4Pngza5blvWRlJaAYaIV/pW5yKOzNuJPr/6GXZKr5Wc5e5B/sNRUw5UJhqL77jVneZfdqmlqFbO5CiLCfRN6YNatw0M0IoaJXVizd5FNkk96yckqnNYcuPeL9UhOiMP1Izp5++wrOaVbdNvNHCEfXz8YLdOSfY7ptPC2Xc48rSlW7TqKszqalxS8eVTnEIyIYRgW9i6yvtCT+fFwWYU3VUBFda2PZp9g4F7oZhpbrUyCdo7fVueBZIUGUoUnKy6noeaFS/oikc1GTAzCwj4IrCw4iiGd6hKDKSdodxSXoWXjFM2UwMEOlQ+VEUf2l49EYf8nk4RuDBOtsIoTBI6dqsI9X9RluFSmDZCXH9JId/DubwX4dOVuW+d6aFJPy31DVQDjkQtOx9ndMnweeAzDhBfW7IPAR8t9BbZSs1+ytRiz1u7TzQh535cbbJ1rytAsPDl7s6W+ZgUwWqelYP9xT5FurefCm1dlW8rJ37FFKt67dqClMTEMExpY2IcApQviO78WAACSXIoWVdcm/UPfNo6PpXwWaAn7c12qp8owTOhhM04AlFVU47n5eag0CZoqq/Qv0lHpkj1bra2/eGk/x8dSeu6E2k2TYZjgwsI+AK6bmYNXFm/HN2uNi5L8ss3dbJVGaEWlWk0wdk4PZQFx14bEMEwEwMI+AH7fcRgAsGZ3ScjPTQTT6lEyP/x9JF68tK9pv39ccDoW3TUSDZPiMS1CCokwDOMObLN3gd0B5LExY94dIzDh37/4tV8x6DTLKXE7tkhFxxaputu/u3U45m/cj8T4OHTKaIRNj09wPF6GYSIT1uxdoE2TBkGrt9o8VTv75Ucr7LloGtG7XRPcPb67a8djGCbyYGHvAkO7NMftn6wx7+gAoarV3q99OoDgFfNmGCY6YWHvAmUVNZi9PjhldlMSfatJrd0T+vkBhmHqPyzsXeDRWRuDduyGiealA7+8eUjQzs8wTHTAwl6DaV+uxyWv/Wa5f3UQTSpWSvWVW8yXzzBM7MLeOBp8snKP4facgiO4+LXfvetxBITThB6MEoYMw0QXpmojEb1NRAeJKFfR9igR7SWitdLfRMW2+4kon4i2ENH4YA08nCgFPRCe8nqt0uoEfLdWjUJ+foZh6hdWNPt3AbwM4D1V+4tCiOeVDUTUC8BlAE4H0AbAj0TUTQhhrVRThPPIt7nomZnm1x7kzMSa3DWuzlXSzaInDMNEJ6bCXgjxMxFlWTzeZACfCCEqAOwkonwAAwH8brxbZLLrcBlOa14XjPTe77s0+wXTZq9HUUl5yM/JMEz9JZAJ2luJaL1k5pErbLcFoDR4F0ptfhDRDUSUQ0Q5xcXFAQwjeIx87iesL4xMV8fOLfUjYhmGYdQ4FfavAugMoB+AIgAvSO1a9gRNtVcI8YYQIlsIkZ2RkaHVJSLYfeSkX1v/Duk+6/dOCH30aeHRUz7rvds24XquDMPo4kjYCyEOCCFqhBC1AN6Ex1QDeDR5ZcKWdgD2BTbEyEOd+OyLnEJHx9kcQA6aU5W+0yDf3TYc93HyMoZhdHAk7IkoU7H6RwCyp84sAJcRUTIRdQTQFcCKwIYYXuS87ifKq3T77DjkLBFag6S6gKl5d4zwLmc09njaZDVvqLuv3IdhGMYKphO0RPQxgFEAWhBRIYB/ABhFRP3gMdEUALgRAIQQG4noMwCbAFQDuKW+e+I8Oz8Pk/pk4vI3l7l63LvHdfNZ79G6zstn5YNjTfcf2rm5q+NhGCa6seKNc7lG8wyD/k8BeCqQQUUSuw6fRL/Hf0DJSX3N3gm3ju7q1/bhdYOQf7DUrz37tKbI2XUUo3u0xKK8gwCAZAtpFBiGYWQ4XYIF3Bb0rdNSNNuHdWmBKUOz/Npfv/JMNE9Nwp3n1r0NWK0+xTAMA3C6BC+HSyuwcd9xnN0t+J5BN43s5F3u2z4dI7q0MOzfvFEyVj18rk9bYhw/pxmGsQ4Le4m/vLUceftPIPcxdzI8/HjnSGQ2ScGO4jJc8PJSn23tm9VNvH57yzBHx09MYGHPMIx1WGJIbDlwAgDw1OzNrhyvY4tUpCYnoHe7Jt422bumVxv/lAt2SWFhzzCMDVizB5C3/7g3v82+klPGnS2ilRxt0V2jcOxUFZqmJjk+7tpHzsX+4+WWUh8zDMPIsLAH8MmKugwPp6qC5ykaF0cBCXoASG+YhPSGgR2DYZjYI+aF/UPfbMAHy+qKd6/YeSSMo2EYhgkOMW8LUAp6hmGYaCXmhT3DMEwsENPCvromsNqt7107EL/ce45f+9y/jdDozTAMEz5i2mb/yKyNAe2vF4ClVc2KYRgmnMS0Zj9nQ5HjfXu3rfOfb8kZKBmGiXBiWrMPpHbsjKuzvctL7jkHOw6VYtJLS/GPC3r59f3qr0NRXROGQrUMwzASMS3sA6Fl47pkZg2S4nF6myYomD5Js++ADk012xmGYUJFTJtxGIZhYoWYFvbCoR1nbM+WLo+EYRgmuMS0sHfCiK4t8MaV2eYdGYZhIoiYFvZ6ev3401vp7pPVPBVxGknOGIZhIpmYFvYnyqs12+dvPKC7zxCu/cowTD0k5oR9Ta3A/mPleOTbXL9tZlWqLj6zHSb2zgzW0BiGYYJGzLle/nNeHt74eYfmtkbJxkW8OygqTDEMw9QnTDV7InqbiA4SUa6irRkRLSCibdL/plI7EdFLRJRPROuJaEAwB2+XlQVHdAU9ACSZFATp3yHd7SExDMOEBCtmnHcBTFC1TQOwUAjRFcBCaR0AzgPQVfq7AcCr7gzTHS557XfD7ftKyr3Lc24fgXeuPguXD+zgbRtuUhicYRgmUjEV9kKInwGoK3pMBjBTWp4J4EJF+3vCwzIA6URUb4zcKwrqLrNXmzSc06MlhnWpm5AlYi8chmHqJ04naFsJIYoAQPovRxm1BbBH0a9QavODiG4gohwiyikuLnY4DPdY8cAYzfZmXAKQYZgowG1vHC3VV9OdXQjxhhAiWwiRnZFh7AUTCL9tP4SPlu9GZbVx7vqWaSma7a2baLczDMPUJ5wK+wOyeUb6f1BqLwTQXtGvHYB9zocXOH9+czke+HoDKi0UKpHTFr91VV2EbAanL2YYJgpwKuxnAZgiLU8B8K2i/SrJK2cwgGOyuSfcHCmt1N3WOSMVABAvRcY2Ta0z3TROSQzuwBiGYUKAFdfLjwH8DqA7ERUS0VQA0wGcS0TbAJwrrQPAHAA7AOQDeBPAX4MyagekJOlfavfWjQEAXVs2AgA0aeAv4FulsYbPMEz9xTSoSghxuc4mvxlN4UkjeUuggwoGRsVD+rbz+M8/ceEZmNyvLbpIQl9GL089wzBMfSGq0yUcKq3wLg+dvki33/UjOgEAUhLjMbwr+9IzDBN9RLWwv+Kt5Zb6cRZLhmGinagW9nn7T4R7CAzDMBFBVAt7K2x8bHy4h8AwDBN0olbYV1vwq7+wXxukJsdc4k+GYWKQqBX2XR6ca9qndzvOYskwTGwQtcLeCuVVNeEeAsMwTEiIaWE/4YzW4R4CwzBMSIhpYS/046wYhmGiipgS9lufPM9nPS2FJ2cZhokNokra1dQKfLJyN/4vu71Pe3JCHH6+9xwkJcThgYk90CApAWN6tNRNa8wwDBNtRJWw/2LVHjz4dS5KTlZ52+4/rwduHNnZu37D2Z21dmUYholqosqMU1rh8a5Zs7sEAHDjyE4+gp5hGCZWiSphXyUFUv24+QAAYN2eknAOh2EYJmKIKmE/fW6ez3r+wbIwjYRhGCayiCphr0aZ4phhGCaWiWphzzAMw3iIamGf89DYcA+BYRgmIohqYd+iEdeNZRiGAaJY2PeQiogzDMMwUSzs371mYLiHwDAMEzEEFEFLRAUATgCoAVAthMgmomYAPgWQBaAAwP8JIY4GNkxz5HTF7Zs1wPSL+qB1E06FwDAMI+OGZn+OEKKfECJbWp8GYKEQoiuAhdJ60Bn+z0UAgPQGSRjWpUUoTskwDFNvCIYZZzKAmdLyTAAXBuEcfhwqrQQAbNh7LBSnYxiGqVcEKuwFgB+IaBUR3SC1tRJCFAGA9L9lgOewxcTeXJCEYRhGTaBZL4cJIfYRUUsAC4goz3QPCenhcAMAdOjQIcBh1PHipf1cOxbDMEy0EJBmL4TYJ/0/COBrAAMBHCCiTACQ/h/U2fcNIUS2ECI7IyMjkGEAAAZ08BQPT06ID/hYDMMw0YZjYU9EqUTUWF4GMA5ALoBZAKZI3aYA+DbQQVqhY4tGaM3FSBiGYTQJxIzTCsDXRCQf5yMhxDwiWgngMyKaCmA3gEsCH6YxczYU4cvVhcE+DcMwTL3FsbAXQuwA0Fej/TCAMYEMyi5//XB1KE/HMAxT74jaCFqGYRimDhb2DMMwMUC9F/alFdXhHgLDMEzEU++F/Wcr94R7CAzDMBFPvRf2S7YWe5ffuirboCfDMEzsEmgEbdhp3igJAPDtLcPQt316mEfDMAwTmdRrzf5kZTW+Wr0XANC+WcMwj4ZhGCZyqdfC/pFvN3qXGyXX+5cUhmGYoFGvhf1pCm0+KaFeXwrDMExQqdfq8G1juiI1OQF7S06FeygMwzARTb0W9gBw7fCO4R4CwzBMxMO2D4ZhmBiAhT3DMEwMwMKeYRgmBmBhzzAMEwOwsGcYhokBWNgzDMPEACzsGYZhYgAW9gzDMDEACSHCPQYQUTGAXQ53bwHgkIvDqQ/wNccGfM2xQSDXfJoQIsNKx4gQ9oFARDlCiJhKZM/XHBvwNccGobpmNuMwDMPEACzsGYZhYoBoEPZvhHsAYYCvOTbga44NQnLN9d5mzzAMw5gTDZo9wzAMYwILe4ZhmBigXgt7IppARFuIKJ+IpoV7PHYgovZEtJiINhPRRiL6m9TejIgWENE26X9TqZ2I6CXpWtcT0QDFsaZI/bcR0RRF+5lEtEHa5yUiotBfqT9EFE9Ea4joe2m9IxEtl8b/KRElSe3J0nq+tD1LcYz7pfYtRDRe0R5x3wkiSieiL4goT7rfQ6L9PhPR36XvdS4RfUxEKdF2n4nobSI6SES5irag31e9c5gihKiXfwDiAWwH0AlAEoB1AHqFe1w2xp8JYIC03BjAVgC9ADwLYJrUPg3AP6XliQDmAiAAgwEsl9qbAdgh/W8qLTeVtq0AMETaZy6A88J93dK47gTwEYDvpfXPAFwmLb8G4GZp+a8AXpOWLwPwqbTcS7rfyQA6St+D+Ej9TgCYCeA6aTkJQHo032cAbQHsBNBAcX+vjrb7DOBsAAMA5Cragn5f9c5hOt5w/xAC+KCHAJivWL8fwP3hHlcA1/MtgHMBbAGQKbVlAtgiLb8O4HJF/y3S9ssBvK5of11qywSQp2j36RfG62wHYCGA0QC+l77IhwAkqO8rgPkAhkjLCVI/Ut9ruV8kficApEmCj1TtUXuf4RH2eyQBliDd5/HReJ8BZMFX2Af9vuqdw+yvPptx5C+UTKHUVu+QXlv7A1gOoJUQoggApP8tpW5612vUXqjRHm7+DeBeALXSenMAJUKIamldOU7vtUnbj0n97X4W4aQTgGIA70imq7eIKBVRfJ+FEHsBPA9gN4AieO7bKkT3fZYJxX3VO4ch9VnYa9kl650fKRE1AvAlgDuEEMeNumq0CQftYYOIzgdwUAixStms0VWYbKs31wyPpjoAwKtCiP4AyuB59daj3l+zZEOeDI/ppQ2AVADnaXSNpvtsRtivsT4L+0IA7RXr7QDsC9NYHEFEifAI+g+FEF9JzQeIKFPangngoNSud71G7e002sPJMAB/IKICAJ/AY8r5N4B0IkqQ+ijH6b02aXsTAEdg/7MIJ4UACoUQy6X1L+AR/tF8n8cC2CmEKBZCVAH4CsBQRPd9lgnFfdU7hyH1WdivBNBVmuFPgmdiZ1aYx2QZaWZ9BoDNQoh/KTbNAiDPyE+Bx5Yvt18lzeoPBnBMeoWbD2AcETWVNKpx8NgziwCcIKLB0rmuUhwrLAgh7hdCtBNCZMFzvxYJIf4CYDGAi6Vu6muWP4uLpf5Car9M8uLoCKArPJNZEfedEELsB7CHiLpLTWMAbEIU32d4zDeDiaihNCb5mqP2PisIxX3VO4cx4ZzIcWFyZCI8XizbATwY7vHYHPtweF7L1gNYK/1NhMdWuRDANul/M6k/AXhFutYNALIVx7oWQL70d42iPRtArrTPy1BNEob5+kehzhunEzw/4nwAnwNIltpTpPV8aXsnxf4PSte1BQrvk0j8TgDoByBHutffwON1EdX3GcBjAPKkcb0Pj0dNVN1nAB/DMydRBY8mPjUU91XvHGZ/nC6BYRgmBqjPZhyGYRjGIizsGYZhYgAW9gzDMDEAC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMD/D9pwksMstgtRgAAAABJRU5ErkJggg==\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "#code block 12" - ] - }, - { - "source": [ - "## Variando Hiperparâmetros e Observando o Resultado na Prática\n", - "\n", - "Agora seria interessante realmente ver como o modelo treinado se comporta. Vamos executar a simulação, e seguiremos a mesma estratégia de seleção de ações utilizada durante o treinamento: amostragem de acordo com a distribuição de probabilidade na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 13" - ] - }, - { - "source": [ - "## Salvando o resultado em um GIF animado\n", - "\n", - "Se você quiser impressionar seus amigos, pode enviar a eles a imagem animada do GIF do bastão de equilíbrio. Para fazer isso, podemos usar `env.render` para produzir um quadro de imagem e, em seguida, salvar esses quadros em um GIF animado usando a biblioteca PIL:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "360\n" - ] - } - ], - "source": [ - "from PIL import Image\n", - "obs = env.reset()\n", - "done = False\n", - "i=0\n", - "ims = []\n", - "while not done:\n", - " s = discretize(obs)\n", - " img=env.render(mode='rgb_array')\n", - " ims.append(Image.fromarray(img))\n", - " v = probs(np.array([Qbest.get((s,a),0) for a in actions]))\n", - " a = random.choices(actions,weights=v)[0]\n", - " obs,_,done,_ = env.step(a)\n", - " i+=1\n", - "env.close()\n", - "ims[0].save('images/cartpole-balance.gif',save_all=True,append_images=ims[1::2],loop=0,duration=5)\n", - "print(i)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional feita por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/8-Reinforcement/2-Gym/solution/Julia/README.md b/translations/br/8-Reinforcement/2-Gym/solution/Julia/README.md deleted file mode 100644 index e4130463c..000000000 --- a/translations/br/8-Reinforcement/2-Gym/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/2-Gym/solution/R/README.md b/translations/br/8-Reinforcement/2-Gym/solution/R/README.md deleted file mode 100644 index db0d98329..000000000 --- a/translations/br/8-Reinforcement/2-Gym/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/8-Reinforcement/2-Gym/solution/notebook.ipynb b/translations/br/8-Reinforcement/2-Gym/solution/notebook.ipynb deleted file mode 100644 index 5810d3428..000000000 --- a/translations/br/8-Reinforcement/2-Gym/solution/notebook.ipynb +++ /dev/null @@ -1,524 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "5c0e485e58d63c506f1791c4dbf990ce", - "translation_date": "2025-08-30T00:14:03+00:00", - "source_file": "8-Reinforcement/2-Gym/solution/notebook.ipynb", - "language_code": "br" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "## Patinação no CartPole\n", - "\n", - "> **Problema**: Se Peter quer escapar do lobo, ele precisa ser mais rápido do que ele. Vamos ver como Peter pode aprender a patinar, em particular, a manter o equilíbrio, usando Q-Learning.\n", - "\n", - "Primeiro, vamos instalar o gym e importar as bibliotecas necessárias:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: gym in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.18.3)\n", - "Requirement already satisfied: Pillow<=8.2.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (7.0.0)\n", - "Requirement already satisfied: scipy in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.4.1)\n", - "Requirement already satisfied: numpy>=1.10.4 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.19.2)\n", - "Requirement already satisfied: cloudpickle<1.7.0,>=1.2.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.6.0)\n", - "Requirement already satisfied: pyglet<=1.5.15,>=1.4.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.5.15)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n" - ] - } - ], - "source": [ - "import sys\n", - "!pip install gym \n", - "\n", - "import gym\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random" - ] - }, - { - "source": [ - "## Criar um ambiente de cartpole\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "env = gym.make(\"CartPole-v1\")\n", - "print(env.action_space)\n", - "print(env.observation_space)\n", - "print(env.action_space.sample())" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": 2, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Discrete(2)\nBox(-3.4028234663852886e+38, 3.4028234663852886e+38, (4,), float32)\n0\n" - ] - } - ] - }, - { - "source": [ - "Para ver como o ambiente funciona, vamos executar uma simulação curta por 100 etapas.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "env.reset()\n", - "\n", - "for i in range(100):\n", - " env.render()\n", - " env.step(env.action_space.sample())\n", - "env.close()" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": 3, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/gym/logger.py:30: UserWarning: \u001b[33mWARN: You are calling 'step()' even though this environment has already returned done = True. You should always call 'reset()' once you receive 'done = True' -- any further steps are undefined behavior.\u001b[0m\n warnings.warn(colorize('%s: %s'%('WARN', msg % args), 'yellow'))\n" - ] - } - ] - }, - { - "source": [ - "Durante a simulação, precisamos obter observações para decidir como agir. Na verdade, a função `step` nos retorna as observações atuais, a função de recompensa e a flag `done` que indica se faz sentido continuar a simulação ou não:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "env.reset()\n", - "\n", - "done = False\n", - "while not done:\n", - " env.render()\n", - " obs, rew, done, info = env.step(env.action_space.sample())\n", - " print(f\"{obs} -> {rew}\")\n", - "env.close()" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": 4, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[ 0.03044442 -0.19543914 -0.04496216 0.28125618] -> 1.0\n", - "[ 0.02653564 -0.38989186 -0.03933704 0.55942606] -> 1.0\n", - "[ 0.0187378 -0.19424049 -0.02814852 0.25461393] -> 1.0\n", - "[ 0.01485299 -0.38894946 -0.02305624 0.53828712] -> 1.0\n", - "[ 0.007074 -0.19351108 -0.0122905 0.23842953] -> 1.0\n", - "[ 0.00320378 0.00178427 -0.00752191 -0.05810469] -> 1.0\n", - "[ 0.00323946 0.19701326 -0.008684 -0.35315131] -> 1.0\n", - "[ 0.00717973 0.00201587 -0.01574703 -0.06321931] -> 1.0\n", - "[ 0.00722005 0.19736001 -0.01701141 -0.36082863] -> 1.0\n", - "[ 0.01116725 0.39271958 -0.02422798 -0.65882671] -> 1.0\n", - "[ 0.01902164 0.19794307 -0.03740452 -0.37387001] -> 1.0\n", - "[ 0.0229805 0.39357584 -0.04488192 -0.67810827] -> 1.0\n", - "[ 0.03085202 0.58929164 -0.05844408 -0.98457719] -> 1.0\n", - "[ 0.04263785 0.78514572 -0.07813563 -1.2950295 ] -> 1.0\n", - "[ 0.05834076 0.98116859 -0.10403622 -1.61111521] -> 1.0\n", - "[ 0.07796413 0.78741784 -0.13625852 -1.35259196] -> 1.0\n", - "[ 0.09371249 0.98396202 -0.16331036 -1.68461179] -> 1.0\n", - "[ 0.11339173 0.79106371 -0.1970026 -1.44691436] -> 1.0\n", - "[ 0.12921301 0.59883361 -0.22594088 -1.22169133] -> 1.0\n" - ] - } - ] - }, - { - "source": [ - "Podemos obter o valor mínimo e máximo desses números:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[-4.8000002e+00 -3.4028235e+38 -4.1887903e-01 -3.4028235e+38]\n[4.8000002e+00 3.4028235e+38 4.1887903e-01 3.4028235e+38]\n" - ] - } - ], - "source": [ - "print(env.observation_space.low)\n", - "print(env.observation_space.high)" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "def discretize(x):\n", - " return tuple((x/np.array([0.25, 0.25, 0.01, 0.1])).astype(np.int))" - ] - }, - { - "source": [ - "Vamos também explorar outro método de discretização usando bins:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Sample bins for interval (-5,5) with 10 bins\n [-5. -4. -3. -2. -1. 0. 1. 2. 3. 4. 5.]\n" - ] - } - ], - "source": [ - "def create_bins(i,num):\n", - " return np.arange(num+1)*(i[1]-i[0])/num+i[0]\n", - "\n", - "print(\"Sample bins for interval (-5,5) with 10 bins\\n\",create_bins((-5,5),10))\n", - "\n", - "ints = [(-5,5),(-2,2),(-0.5,0.5),(-2,2)] # intervals of values for each parameter\n", - "nbins = [20,20,10,10] # number of bins for each parameter\n", - "bins = [create_bins(ints[i],nbins[i]) for i in range(4)]\n", - "\n", - "def discretize_bins(x):\n", - " return tuple(np.digitize(x[i],bins[i]) for i in range(4))" - ] - }, - { - "source": [ - "Vamos agora executar uma simulação curta e observar esses valores discretos do ambiente.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "(0, 0, -1, -3)\n(0, 0, -2, 0)\n(0, 0, -2, -3)\n(0, 1, -3, -6)\n(0, 2, -4, -9)\n(0, 3, -6, -12)\n(0, 2, -8, -9)\n(0, 3, -10, -13)\n(0, 4, -13, -16)\n(0, 4, -16, -19)\n(0, 4, -20, -17)\n(0, 4, -24, -20)\n" - ] - } - ], - "source": [ - "env.reset()\n", - "\n", - "done = False\n", - "while not done:\n", - " #env.render()\n", - " obs, rew, done, info = env.step(env.action_space.sample())\n", - " #print(discretize_bins(obs))\n", - " print(discretize(obs))\n", - "env.close()" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "Q = {}\n", - "actions = (0,1)\n", - "\n", - "def qvalues(state):\n", - " return [Q.get((state,a),0) for a in actions]" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "# hyperparameters\n", - "alpha = 0.3\n", - "gamma = 0.9\n", - "epsilon = 0.90" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "0: 108.0, alpha=0.3, epsilon=0.9\n" - ] - } - ], - "source": [ - "def probs(v,eps=1e-4):\n", - " v = v-v.min()+eps\n", - " v = v/v.sum()\n", - " return v\n", - "\n", - "Qmax = 0\n", - "cum_rewards = []\n", - "rewards = []\n", - "for epoch in range(100000):\n", - " obs = env.reset()\n", - " done = False\n", - " cum_reward=0\n", - " # == do the simulation ==\n", - " while not done:\n", - " s = discretize(obs)\n", - " if random.random() Qmax:\n", - " Qmax = np.average(cum_rewards)\n", - " Qbest = Q\n", - " cum_rewards=[]" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 20 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(rewards)" - ] - }, - { - "source": [ - "A partir deste gráfico, não é possível dizer nada, porque devido à natureza do processo de treinamento estocástico, a duração das sessões de treinamento varia muito. Para dar mais sentido a este gráfico, podemos calcular a **média móvel** sobre uma série de experimentos, digamos 100. Isso pode ser feito convenientemente usando `np.convolve`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 22 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXsAAAD4CAYAAAANbUbJAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nO2dd3gVZfbHvycdAiGUAKEZelGqkY4gICDo4rr6U3dVVKxrWdeKde2ylnXX1bWiYu8FpYmAKCol9AABAgQIBAglQALp7++PO3Mzd+70O7fk3vN5njyZeeedmXfu3HvmzHlPISEEGIZhmOgmLtwDYBiGYYIPC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMDJIR7AADQokULkZWVFe5hMAzD1CtWrVp1SAiRYaVvRAj7rKws5OTkhHsYDMMw9Qoi2mW1L5txGIZhYgAW9gzDMDEAC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMDsLBnGIaJAUyFPRGlENEKIlpHRBuJ6DGp/V0i2klEa6W/flI7EdFLRJRPROuJaECwL4JhwoUQAp/n7EFldW24h8IwhlgJqqoAMFoIUUpEiQCWEtFcads9QogvVP3PA9BV+hsE4FXpP8NEHXNz9+OeL9aj4HAZ7hnfI9zDYRhdTDV74aFUWk2U/owqnkwG8J603zIA6USUGfhQGSbyOHaqCgBw6ERlmEfCMMZYstkTUTwRrQVwEMACIcRyadNTkqnmRSJKltraAtij2L1QalMf8wYiyiGinOLi4gAugWHCB4V7AAxjEUvCXghRI4ToB6AdgIFEdAaA+wH0AHAWgGYA7pO6a33//d4EhBBvCCGyhRDZGRmW8vgwDMMwDrHljSOEKAHwE4AJQogiyVRTAeAdAAOlboUA2it2awdgnwtjZRiGYRxixRsng4jSpeUGAMYCyJPt8EREAC4EkCvtMgvAVZJXzmAAx4QQRUEZPcOEmVrpnVUYTmPFBt+v34dVu46GexiMDlY0+0wAi4loPYCV8NjsvwfwIRFtALABQAsAT0r95wDYASAfwJsA/ur6qBkmQnjn150AgFnr+OX11o/W4E+v/hbuYTA6mLpeCiHWA+iv0T5ap78AcEvgQ2OYyGfbQY+jWnmVr599eVUNVhYcwYiuPB/FRAYcQcswQeDRWRtx5YwVyNt/PNxDYRgALOyZKOPD5bvw2co95h2DjKzxnyivDtk5K6pr8I9vc1FVw9G8jD8s7Jmo4sGvc3Hvl+tt7fPBsl3YeajM1XHIE5Wh9MO/94v1mPn7Lpz97OIQnpWpL7CwZ2KSkpOVKD5RASEEHvomFxe+8mtAx5twemvNdgqhtP9l2yEAQNGxchwqrbC0z9wNRciaNtsbCcxELyzsmZhkwBMLcNZTP3pdJwMVdh2aN9Rs31tSHtBx7XCkrC5lw/8WbzfsW3yiAmUV1XhtiaffzkNluPWj1fh4xe6gjpEJHyzsmZjE6x8vAvOPv3poFgCgVVqK5vZtB04EdHynmD28znrqR5z/36UorfDMKdQKge/XF+H+rzb49T1cWoGsabOxcPMBS+cuq3A2T3Gqsiak8w3Xv5cTUw83FvZMTBNoKJRsptETrtW14Qm2+s6C3//OQ2XYXuyZqyg1mEjeVOTxKHrn1wJL5z79H/ORf9D+Q67nI/PQ9cG55h1dYsGmA5oPt2Bj1cTmNizsmZimNkDN/rf8wwCAlxZu09xeFaY895U2NeSftribjHDjPnsup1v2h+cNKNQs33EY2U/+iHm5oU8qwMKeiXpeXrQNd362VnNbgLIeW0zMNG5r9vtKTiFr2mx8u3avq8dtmZbsXe720FzNCetgpoQ4WRk6F1XA13zn5C3EKTmSl9a6wmMhO6cMC3sm6nn+h634arW5cHzw6w2ue6XY1bDNeG7+FgDA3z7Rfng5JbNJ3ZxDZXUt1u4p8a6T5ED6a/5h3dw3gc591ITY3KU83dh//YwCl11v9ZAfag0S40NyPiUs7JmoJGvabNz3hbm/vdKM8+Hy3brmGKe4bcZJSdT/yd43wXmlrMR4a6JAby5ALazJps9pqOc21Oa7/cdD4zU1e73HfPP1GnffzKzAwp6JWj7N8Y2k3V5c6tdHrZAGatZR47YMS06o0wgHPf0j8vYfR8GhMmRNm42PVuxyfNz4OGvCOU5HiKuFtcXDeQl11K/64ZSU4FwU7iguxUPfbECthZtdcPgkAGD/sdC55MqwsGdihjEvLPFrU/88F2856Oo50xsmunq8FMXr/4HjFXjz550Y9fxPAIA9R045Pq6eEAeA2RvqJhP1uqmFNdmMHS456dx8tufISaxTmJ2soH6ot0hN1u5ogZs+WIUPlu3GVhPbf/GJCnTKSAUAnKqqcXw+p7CwZ2Ia9eu8kfWhsroWk176Bb/mH7J8/GqXNdZklQYaqDeRTFqKdgLcE+VVPr7oeh9PpcpcdeSkvZq8pQ598wFgxLOLMdlmBLRbnxsAlFV4BHd1jf4xtx44gbOe+hE7ikMzN6AFC3sm5thz5KR3Wf2bH9lNPyXxvpJT2LjvuC3f7CqX7TjJicER9o00hP2O4lJMfTfHp03vYaiM3gX0Hx56lIdY01V/biWnnBeM31vieaP6YlWhbp/cvaH3vlHDwp6JOUYoEoXd+tFqn21G5gdZPOxWPCzMqDHQ9pyg9uLQe5b8aUA7W8fVemaMfmEJVhQc8WnTM/esUZlRGibZE/bqCeK1e0rwyLe5ul4+xSc8Ub2L8qxF9cpU1dTio+W7/Wz26jcTJ5yq1H9gac0XhRoW9kxMIycPk3n7151+Oej3HDmJDQ79oqtq3fbG8RX2esLQonONl2cll04zCo9qzwscV7ms2nXFVNv8L3zlV7z3+y6/ojAysqZ8rerNw4zXl2zHA19vwOc5vlp4WoPA51aM5me27GdhzzARx6SXlvqsj3h2MS54ealO7zpOf2SenznCyI7rBPVEpJ4Zx6p3jczPW61F0Cona5WotdpaIXD9eznIUb0Z6KGnWS/bcdjS/laRbeay6UXG7n06dqoKX632fWAcLtM3BVVUh35CVg0LeybieG5+HuZv3B+047dpop20TMZKgI+W5lpWWYN3fyvwaat2WbP/RFWYRe/wahu6kkADoLR4YcFWn/XiExVYsOkArn/PXPP+bt0+fLNW23//pI5ppOCw/0RnTa3Aw9/k+szJKDl4vBxfSf7tB1R+9XbnPvo+9gPu/GwdNu6re+NTH1NJhc7DbF/JqaDcDy1Y2DMRxyuLt+PG91f5tdfUCld+GOkNkxztpzy3nvfI9Ll5PutVLmv2TVTmBr0UBvM36tuyQyFb5DQSRy24VN728RpsLtLOpaPnovjYd5v82tbsPor3l+3C3z/Vji6+Q9HevplvSuqaWoH8g6XImjYby228TWzcWzfuHq0b6/ar0LiO938vwNDpi3Drx2ssny8QWNgz9YbOD8zBzR+sNu9owiYdwWIHPWHfv0O6z7rbrpcNk6xN0KrZUHgMD3/jmfB0w4PnyhnLMeCJBbrbW0spnxPsRlepsOOPLkft1kjX98rifOQfrLOV/7a9TojLkawyNULgmTmbAQCv/7xD9xzPzN2MborMnD9trYvLGNalhe5+WuUpP1qxR3MswcJU2BNRChGtIKJ1RLSRiB6T2jsS0XIi2kZEnxJRktSeLK3nS9uzgnsJTCwxL0DzTiBeF0rBeqqyRtNdsEtGI591ZWRpba0wfNW3NgZfQW1Vbl/y+m94f9kulFZUY6mNOAE9ftl2CEfKKnVt0bLg7dgiNaDznLKRIE1+rtTWCuwrOYXn5m/BJa/9ptlXbbOvqRVYmOcR3Ivy9APrXl+ywyff0dDOdQLeaJ5kh0buncY23VMDxYpmXwFgtBCiL4B+ACYQ0WAA/wTwohCiK4CjAKZK/acCOCqE6ALgRakfw0QE3wSQk0QpaEe/sASXvv67Rh/fdeXE3yuL8zHo6YW6NmUr2H1Y1dQKHC+v8nq1LNx8EFe/s9Lx+dVco3Msed7DKDLXCqcqrV+vLGxrhMDlby7z7C89kI+ZmJOcJmLLaFwXeWv3EFbSK7iJqbAXHuR3oUTpTwAYDeALqX0mgAul5cnSOqTtY8huViQmavlpy0EUn3CneMPGfcfw8iJ7ics+DKAykVogrCs85memUNvQlRO0SySPl0CSbvnbwI0FxqSXfkGfR3/wrt+hY892itI0okR+MDr55Zcoom+bNUqyLBTlB0tNLbBLykEjP59HPm9chN2p4FW+WdUKgRlLd+K5+Xn6OyjI0ckgGiws2eyJKJ6I1gI4CGABgO0ASoQQ8jtWIYC20nJbAHsAQNp+DEBzjWPeQEQ5RJRTXOxu4QQmMhFC4Op3VuKyN/w1Yidc8N+leP6HrYZ91JpwUYn1/DGnKmt8smC+9ctOvz5+9m/VqnKCVv5xV+j4jjvBzIyTF6aiIAelB7qT9ABK09fD3+Si0wNzLAljWdgfVXgiyZ+PWe6d71R28xcXbLVUhvGmDxSOBAJ44vtNeMWk/m+4sCTshRA1Qoh+ANoBGAigp1Y36b/Ws9zvTgkh3hBCZAshsjMy9EPUmehB/r1q2S9lRktJvewczwi1Nn7QxltFz0fm4V8Kl8IvV/uHw6vH0CzV19NHy/UykND8Sb0zHe/rFupJ5x83+QvFuZI/vlk+fy3ziVbZPjmD6c9bi5E1bbbmseT9lG9OAsJSKoZftvkqnP9ZuA1TZ3rcRn/NP4SsabNNJ9vdzLcTDGx54wghSgD8BGAwgHQikmcY2gGQHWULAbQHAGl7EwDWIiuYqMb7am/Qx+hBoIeRO6bd4KJAGdTJ9yVWK1gnkPS2Qzr7vSSHnNtUroLXafjSWw1SeusXf8+XCf/+xa/tsCTI//dTvu6xrnp7hV9bVY2wlD5Zzw8eAP7y1nIAwAfLjFNIq1NLRBpWvHEyiChdWm4AYCyAzQAWA7hY6jYFwLfS8ixpHdL2RSJUUQNMRFNnx3VXAMvfLq2vmVNty2nZP2WQDaBdlGOrSSlDNXn7j+OdXz0mJPXRwvHDmptr7hE1tIvnoWRUkWnBpgN4Zq41+7b8nXFiWtebV1BiZR5pywHjlAdHDQLZjLhueEdH+9nFiu9PJoCZRBQPz8PhMyHE90S0CcAnRPQkgDUAZkj9ZwB4n4jy4dHoLwvCuJl6iMvBpF4Kj57CjkOl2FfirzEfL3eWJ/3Vn5zZXZXeGYDH5FFRXYN4xQPOivBRImu61wzr6Gekj1Q9qpmUH753uya6faxE18pU1wg8Omujo7eitTZz3euR1sBYXOq9zew+bOx91ad9uuF2tzAV9kKI9QD6a7TvgMd+r24vB3CJK6NjogorZhw91HZXZaTq6Bd+QnWtwMCsZv47OpSFTic2m6uKYFTXCnR/aB7OPK2pt00vmZgVIkGzt4a7I3t/2S5NW74V1u62J+yzmjf0VpRSYpbBVK94ydnPGXsCZSu+G8GEI2iZkBHIBNYuxY/vVGUNXltSp3nLppKaCNRyZW1Pr1C3HY6drLKl2RYdc/5QCRR54nXFTnfs2E4FPQD8bjOZml49XrM6uQePOxtjqBzTWdgzISOQGBKl//oJHdOMlmdHuMW/m7VVNxYdw3u/+04SGj3fLvivvepNbmImGJduCzyKN1jojd0sqZ3Te223hKNTWNgzIcOJfVkIgQWbDvjYQ4+d0hb2WrbZUCv7ZRXVPuMwE3p6ZE2b7edi+MrifNw6uovlYwSiDQfKGoXppEDDw+qKGctDORxbqEs/ymjlt1GiDnjL23/c0kR/qBzGQpucgYlpnMi9GUt34snZmzFU4XJ47os/W95/9e7QRine9fk6n3Ut3+zz+xj7yiv91pVFU37NP+xXNtHtZ9nbV2fbLgiixU6FgB/1/E946fL+OHSiAteGyPMkGHyrk4ZZDy0XUk1Y2DPRhmyzlwXUF6sKMbxLC7Q2yC//5GxPJkK7Hiwyf/0w8CyZgaBVg9aozi3g67depkoE5nISTT9G92gVlOPeLvnmbztYig6q9MKRhtIcGIr8NWzGYaIOWdjLybnu/nxdRL/Ou4GWZm9nolrd1T/rpfvCKJjeIR+v2I1/zrPmW+8WRoF1fTVcQ5XC/sUfjdNx6GHnIREqMw4Le8YV9L7cQghvoJGydJ1snlDmG49GtD4WI+28TJUnXy3MQ6FpntFW3ze+PmKU0fLu8d392pR1g79Y5Z8iwwr/WWg9QV+o8kSysGcCZs6GInR6YI5m6t73ft+FSS8txW/5h/Dh8rqMk3IIuhJ19Gm0onYRnbOhCFnTZuO6mSv9hItSTt00srPfHMRelc9+kt1K4xo8MLEnLh/YPuDjuMnoHi2Dclx1MRjA15/eaaUxW8Le0Rnsw8KeCZj7vlwPAPhcQwvK2++pCrXzcJmpa5q60He0otbW5XmFHzcfRO5e3wee0uX0tSXbsXiLb8Ku3YoH7PIHxmDj4+NxaXZggjopIQ4jutpPTtiiUbJ5J4cESyAmJ/gLe6UHlds1hLXQ8y5zGxb2TMDILmk/aFSRypVqdC7bcSTkbpCRipFZQZ2Qy+wzi1MYfFulpSAxPk63Lm2wCaY1wqkLqxmZGs4BynkRvYLnbtKicfAekkpY2DOuoZViYIOkqS42KPWmh7KIRTRhJOzV+ffNkqZZqVyVZrH8nbKEoLqwuRXcKkqjRbA07OYabyNK000gZSz1yGru643EZhwmIjlUWoGsabPx3bp9OF5ehSe/3+Td1qJRku5+aSkJttMl9Htcv6B1faZWCNTUCgx5ZqFfmcRyVU1X2fU0EBIs2vHH9apzuxwaAamUlVRVh+5txWmJQquo8+4EWrrRKizsGVtskbT36XPz8MycPLy1tK56U28DL47z+7aJWjPOZzcOsdW/tLwaldW1KDpW7p3vkLFSaMMuWsLkvDNa+7UpTUiRVkk0GLni9dIvh8JOr4Rz4zARyQGpCtDeklPe/N1yHdbzemfins/XadaF/WHj/rDZkoON3QIpLy3K934Wai2y3IWShWkpviYYLcVeK9mX+s2rbXqDgMcSyXRt1UizPdiafbhgYc/oIoTw8xzZXHTcuyxPmsn/5+Xux+erCjXrwhYcPomhnVtonqf/4z/gjk/WaG6rDxxxULSi1yPzAfhPPBpVTDJiYu86TT1O9fDR0uzj4wjjT/eNllULuQYabolGhLgoWMDozTEEazJYD9bsmbDT+9EfcI6qJux36+oKM/+oKshcWmGcKEqtccocPVmFb2zmHXGbu8d1c7yvmxPJLR16ZijNLuoHtJawv/Ss9pg6vJNPmzrRl16qXz3s9jdjapDz6Dx/SV/N9mCbG9VzW2yzZ8JGaUU1sqbNRmlFtd9k0sET+vnU1bnLlfbnsT1bRrQZZ4jOW4cVurdu7No4lmwtNu+kgZHASIj33fbjnWdjcKfmGNixGWZMyfa2b1NFMyfpZH/Uw+lbiR7BNKe0SkvGsC6ee948Vd+xIBh8fP1g/H1snXLB3jhM2DjjH/N1tyl/fyO66gvI8qoa9Hh4nnd9cKfmPtkcI4U2kp91IIXJu7RshC9vHurWkByhHL16cjVBdW2dM+ps1crUCEoTHQAkxYfXLuM0VYEVFtw50rusNnsFkxFdW6Brq8b429iu3jZOl8BEPOkNPRqRlqDUCg5atsN9jwqnvHbFAKx8cKz3XSM+gB9cw6QEDOgQmjqiehjJq8Nllbhy8GnedaVwaZWmn3HULH97sLGS5O2/l/tVTLWE0qQYaHyAnYLh708d5F1u38wzAc6aPVNvsPK6LSBw48hOpv1CxYiuGchonOy1z8bZ+CXcf14Pv7Zwuyoanb/kZBUenNTT9jG3mAR0BZvINfoBtymKyDx0fi9Hx/j8xqF47YoBIXuzYGHP4EhZJY7rlPpzyk9b/CNmX9Dw0gkWPTPTDLfLNm55HsHOJNmNIzujkyLaNBIwG32lg0T46RpRtI0tRuO6QSA1i43o0lLb5RKw7hlz1zj/bJl2ad0kBRPOMC5k4yamwp6I2hPRYiLaTEQbiehvUvujRLSXiNZKfxMV+9xPRPlEtIWIxgfzApjAGfDEAvR59Afb+2nlapf52ydrfdZnLN2JvSXuFsD+6e5RutvMfrPqH7WVH/n401uhhzQZG2la51drjMvfNUryCOnbbJQ1/EPfNn5tTtIoOMXK/OzI7vYTtv2osNeridbAP8CaZl8N4C4hRE8AgwHcQkTye8uLQoh+0t8cAJC2XQbgdAATAPyPiOw57DJhxWjiVcncXP/EZ3ocOO5+3pQsA+3a6oSrnOjKimb/+pXZmHfH2dYGF2TsCt24OELB9Em2NNLxp3t895VvMWYxBdcN74ibRna2NTYtRvdoaclmn5aSiB1Pe/VM3DyqMz5Q2MXVPOTAnBUtmAp7IUSREGK1tHwCwGYAbQ12mQzgEyFEhRBiJ4B8AAPdGCzjLsdOVaGi2j88f3An37woe46c9EbORhp6KRrMZL0s2+VJSLtm02BUiLLD97cNd/2Y6jmVoV1a4Pf7R/t4rsjLKYnaouOh83uhUbI13U7P5XFsz1Z4++qz0L6ptfKFSpv39+v3GZp/AvG6knnnmrP82sxKTQLASw4nk93Cls2eiLIA9AcgV564lYjWE9HbRCTXMmsLYI9it0IYPxyYMNH3sR9w0f9+865nTZuNmb8V+PUb8exiDHp6YQhHZh09bwyt6M9hXeoeYuq6n+GeYLVLexfruA7q2AyAtsDKbNLAR0C2TW+AgumTsPyBsbqBaLLw7WpgGwf0I3RrpNw0vTVKBpqx58gpNG2o7zfvxl0epfE5vXlVXbyC3ptxqs2IZLexLOyJqBGALwHcIYQ4DuBVAJ0B9ANQBOAFuavG7n6PWiK6gYhyiCinuNhZIAnjnG2Sp8XGfb6+1f+YtTEcw3FMok7gT8Mk/4nEBIXLjSy/5PS/ekLg+hHBjeIMBKMso3aQg67s5P9q0iARt47u6tP2x/4enU42iZlNsOoVs1Gn4bBD4+QEpFp8s3CKlmKgDEB79A+na+53tgXtP5hYEvZElAiPoP9QCPEVAAghDgghaoQQtQDeRJ2pphCAslROOwB+sfBCiDeEENlCiOyMjPB+CLFIcWnwco87wUwL1EPrrXxsz5Z4WMMdTlkFSv7BJkuZD/Vs9r3bafvPy/t/fpO9jJdu4pYlSb72QLM9pjf0zCPEe4W9cX+9eRzZlVcvvYYR8fFkrNkH8Q1umuSSm9E4GZec2c5nW9v0Bq6nk7CLFW8cAjADwGYhxL8U7UqfoT8CyJWWZwG4jIiSiagjgK4AVrg3ZMYNjL54Rn7z/YMUPETkzJ6qtc9bU87yKxABAGWVdUFC8l7HpZJwejKgfVPjzI+h9E5R888/9XHlOHKErdF9//624XjtigGGx5Ft8LIZx+zhcUZbbfdYWaN/aFJPPGLRh13O0NmuaQOkN0zE+X0yNR/EWt/fyf38vY6ccOPZnbDj6YlIS0nEMxf19tlmN/VEMLAygmEArgQwWuVm+SwRbSCi9QDOAfB3ABBCbATwGYBNAOYBuEUIEfzaXowtWjXWj5w0ErqntzH2X7fCoxf0woWqH1gcEZo5yFGSoVP3VEuDG9WtpWK7578c6aun2evVVd15qMyvrbVBNGowOPO0puadLBAvmbeMhP0ZbZtY9gk/Q/qO9G9vPL42TbQfpLXSOFKTE3CtxehUeXK5b7t0EBFe/vMAnJXVzKdPzkNj0UfjTe2JC8+wdA4ziMj7oFMXjFGnrAgHVrxxlgohSAjRR+lmKYS4UgjRW2r/gxCiSLHPU0KIzkKI7kKIucG9BMYJRknJ9IT920t3ouRk4MFXU4ZmITXZ16ZeUV3ryMPFzmv5PEWNXHm/RtI4GupMniXreJ3IKGMH/jKog+WxuIHepdsVK3KQUdMAE4LJz4pBnZpj+QNjfNIua6FV/xUAaix+D/oqJnDJGySnzZJ7Ruk+uPXMRaMc+PDrYbVaWDAJ/wiYoCGEwKK8A5rBT0a/Jz0l5PHvN+H79UXaG21ARLhYZdOsrK7VtPEqPWiCid5Dw8yMfbKi7qX15lGB+5e7gd1H5l3juuH9qQP9NGG7KD25jHLuyOgJdavZLpVxFrKicEqnQLiTNMLPumQmA/yTzIUDFvZRRnVNLW7/eA027TuOV5dsx7Xv5uAJRZ1YGSNPCbVbYjDo38H3Fb9FoyTU1Aq/4tjn9vQtsBEIsouhFnoPuETJU2WgjiBUCqxQa29W71Oyib04MT4OI7oGrsUeVgVcDeroeVC/8mdtW79aB5FNHVZ81gHf5HVyLd+vdSKJzfLPTOrtb6IKdDJX77rDBQv7KGPHoTLMWrcPE1/6Bc/O2wIAmPn7LszLLUKZorjI+sJjeocIC/FxhFoh8CeVxq/8kVqN7NXjuhH6idi0BOel2e3RvFEyCqZPwmc6XjdWA4jcpGD6JM+CjixSm8OSwmRCaJqahILpkzCpT6amSadG9dok55dXpmA2QvnduELK6qlnSjMzmb94aT+seHCM3z5P/7G34wC2SX1Cl/fGCizsowy97/RNH6zGtK82eNeX79RPNzw3N3BTjV2ICEJ4XrevHprl0y5z7bCO+G3aaEfHv/+8HprauSwYSeOXcG4v/bcK2QunV6Z54I+ebdpNOiiCrNQvbZP7u+NtYkYPgyIu3Vt5Jm1lU9fAjs1QXeM70LvGdcODE3viAo2cPEr+fWk/AHXzLYDHx/+tq7LxmI6Pu555RyYpIQ4tVU4L8XGEPw/q4JPzvz7Dwj7KMHrz3H2kruqU0WTo6t0luttG92ipuy0QjpRVorSiGodKK5CSWKctKzWyuDhCG40i2B9ep58LRaZVWophGmOtj23fMf3EbfKErpXJxFJFXninWSO1JpCV9/rZi/Xty+eFKLOiUVKyW0d3wZc3D8V9E3rgzauy8f7UgX5BU8kJ8bj+7E5+DgK3j/EN3jq/TybuHtcN94yvy/NDRBjbq5WuKa2Rg8/9pMkDor7Bwj7qMJD2CsFkZQJN+xDByQkjuzJ+u3afz+u9cmJN71Vcfv0HgDeuPFP3HHYn6YwmCmWBVGthMvGEwnw2pJP2hLPaD1vtpy3nAFIH68go507BDLIAAB5KSURBVGDUIwpVJoi2Gg9imfg48rqKnturFZIT4i1PxGarXEwT4uNw6+iufh5dRlg1ZXXKqJv0VR5f+WCRuXxgB812La4ZlmWpXzBhYR9lGP2wjygKYzv10Q5iWVAvyrwvPpq9wcWdJgVR6b1yt0pLMfxstCbjurbUN0skeAOH7H0getegFkbqdXm/sxSTzMojpSrSQ6ifx6EoaD2sS3NcMeg0844K1MJezx1YmWbgkxsG2x8crJcenHVrnX1emcvmNI0gvWcu6o1bzrGWMtrouxQqWNhHGUZf6T1H6swSTos5Oy2IbQel0FAKLiOZNfOagbh9TFdN+/hzF/fBkM7NbQs9I/kgexPp+efroTeERJN6r17ThuLzUNqse2TWCZN+qijRUCj2fxrQznbFJav+9ACw4oEx+PLmoX4ZWa1iteyk8jNVmpMCVXL0ooVDSejKzjAhwaq72M/bIjf5nFJoLMqrq3hl5GqY1SIVd56rnYUxo7EnmMaugmv0WT5zUW9cMyzLtjlMT76ZuW2SV9YLRRvhg6mD8P6yAiQn1D10/tC3DVo1Tsalbyzz9gsWk/pkYvb6Ikdup2qFw+j+tkxLQcsAIpSdpOJQfm5OzZf5T52HgsMnDatjhQrW7KOI4+VVun7GMq8t2Q4AeOfXghCMKHDi4wj92ns0VacR57JA1hImsneIli+6kYxMSYzXDL03Q8scAAAX9PH1QFGfW09YDe/aAq9fme3XrpzIDmbuffnYTu6NOuulUVR3oITClKVFQnxcRAh6gDX7qMJKacHpc/NcqSQUKpQTl04LM8sapNbut47u6peq13u+IAiIjhrVtQZ0SEc7VcK1MT1bIS0lAcclTx5ZMFo1JyhTAARzmkWeS3fyWQWrxqwWgeamkYeqVaqxvsCaPeMKcnpbtyk8esorrALNJWXFnKFMtbxi5+HATqg5Bv+27q3T/K6tSYNEzL59hHf913zPWL5b55ctXJMmivsRTJlaG4Bm73TeyAlOFYVogoV9PWb5jsPImjYbBRoZGENF89QkbHlyQtBCw1ftOqpYc/aDlQWs2e99zcPn+nhjHCo1rrdqh/sm9ECvzDS0VmR6bCNNJv+hbxvNB5GWgDqh8Nm3SqVBYfhAkeW1k3kBdVCV1UnUYBMsxSXcsBkngjlwvBylFdW64ePfrPVoeb9uP2RYfDuYpCTGIzkh3kcMd2jW0CeAyy2cygLZVm8mkNRZH7cXlzo7oQY3j+rsnR8474zWmHBGa0zuV1etM2+/f6IsrdE6sWuv31NiOd+MXWQvIidmEqXb6gMTe0SMbXvtI+PCPYSgwMI+gpHrvnpzoahIkn5oVdXB09zMGCj5fSsF6ZmnNdUV9p0znD+UQq33bZVKN7rNq1f4B35pmVq0nk25e+1nT3QaQGeFJy48A+2aNsCo7vYjq5U2+xvOjux5pLQGHlHZKk07TXJ9gIV9PaZK0ozCWWJQjvRUCiYj7w+tdAdK1JWfOrZIDdjobJQmwYhQBsLIV9gzMw3T5c/Upcfb6J7BSXEBeIq7PDjJWjUpNS0b1x/BeU73lvjX//WNuORmdmCbfT1mzgZPwrJXFm8P2xjkPDZKsbS5SF8jNpuUO3bKtziK0uUwmP7iWgQrD5AW8gNySKfm6Bugq6kavaId4SZbSkx3ncVqVOGEiHDRgHY+8Qz1DRb29Ri5apS6xJ8dPphqnkTMCsrJxC0G5g8zd7uemZ5Iw2uHeQRAIAU1ZN95py8GoawbKrwTnYpGDWFvZ/Lwrauy8anD9AKhxEnAE2MfFvZRQEJ8nKWEXDJZ02Z7l4cHmCNexurP1UzwPj7Zk6L2ppGd0LRhok+6Y7s4qWmrxKzoh1WsJOHScmFs1rBu/PIEq53Sh2N7tcIgh+kFooV7xnc3TL0cS7Cwr8dcdlZ7AJ6MiP/7KT9o51ELXPm8SqxaWJSavVYmQNkdr2VaCtY8Mg7dFT9Uu5GgRcfKAQB7j+qnKjYiOdH5K/tfR3X2ZuDsoBM1q6QulqDug1SmIHj9yjPx0fWDcPc4a1kWGQ+3nNMF8+44O9zDiAh4grYekxAvuxQCz/+wNWjnaZPu682hLNwtY2RP3/T4eCzZUoybP1ztEwGqFU2qDqEH6kxEdmNwZBfQds2MJ4X1cKLZt01vgN5tm+DeCT0AeEwpfdqbF7/wPgT1iogTMLSzO29hkUboQqtiGxb2UUKz1CQcKXMvCEhJlSr4peRkFR6c2NNH6zZS7BsmJXiTWCknaLX20cqEKAfb2I24TEmMk87jzCbsRNj/qqqkNdag2pUdIiXgyE2i74oiG9NvMxG1J6LFRLSZiDYS0d+k9mZEtICItkn/m0rtREQvEVE+Ea0nosiquhtFyHKxvKomaIIe0M59f/3ZnXzyjJt5yshavFwrFAC+X+9f/vBsjcLX8gSeXWEve3uo3TmtEsoJWjPClcgrmLSV8gEp6xcwwcOKZl8N4C4hxGoiagxgFREtAHA1gIVCiOlENA3ANAD3ATgPQFfpbxCAV6X/jENOVlajYZL/rZJF39Nz8oJ6/gwL/tC5e40LmDeTik8r2bTPP0BIyzPj6Yt64+VF+bYLrjx6wem4emgWWjusAevWBK0bRGNul0m9M9HsuiQM6Rzbk8ihwvTbLIQoEkKslpZPANgMoC2AyQBmSt1mArhQWp4M4D3hYRmAdCKqv5EILiGEcJxqttcj83WOGciIrJNoISpJq/jGvRO64zmD2qhWldXOGY3w4qX9bGvaSQlx6NbKuSdGUnz99amuDxARhnZpEfL4iVjF1q+HiLIA9AewHEArIUQR4HkgAJAjUNoC2KPYrVBqUx/rBiLKIaKc4uLILaThFh3vn4O7PlsX8HFeX7IdP0gTpBVVdQWRz8pyVmbQCu2aNsDFOrVPZZR1YGW6t2qMS7L9PXdkjjtI6gUA/7msH2ZM8c/h7jaJCaETQt55BZ6tZIKEZWFPRI0AfAngDiGEUYIO7fxN6gYh3hBCZAshsjMygpOkKdL4yqSwiBHHpACqZ+bm4Yb3V/kdzzc7pDWmDDGvGdqjdWPExZGhhg5om1+ClcJ2cr+2GNPTnYlP7eN7gtQymzjz4nECK7dMsLEk7IkoER5B/6EQ4iup+YBsnpH+y/XjCgEo1bl2AKwl4Y5S7AQ86fHb9kM+6+8v2+V7DgensFLPU37FNnvV1hL2ai8eM+6T3BXDzX8u64+C6ZMcT+w6Qf74QlnQg4ktrHjjEIAZADYLIf6l2DQLwBRpeQqAbxXtV0leOYMBHJPNPbHKzsOB55tX1/h8+JvcgI95pgXTz+Yi/5c4rYhE2TWwqSKcv1xhZtIiSxVs9OeB1qNDo41mqZ5JcHWa5Wcu6o2+7cz99BnGDCveOMMAXAlgAxGtldoeADAdwGdENBXAbgCXSNvmAJgIIB/ASQDXuDriesjyHUcCPsb+4+V+2n2gNE4211wzNTxZtLR42TVQqZdWmKRevnNcd9z+8RrveiS5Ooaai/q3hRACF/b3nd66fGAHXB7DD0HGPUyFvRBiKfTjH8Zo9BcAbglwXFGFVlSomoMnypHRKNlrLlHb4P+7cBsOnnA3lXGDJHNvk/SG/vllxvVq7dcmW3mUJqvKamPNvqzCd4JWy6MnVoiLI8PJbIYJlNhVpUKIme03d+8xDHxqIT7PKfS2qQtnuCXo7SYH03IXvW10F782cqDZK/OZF0yf5GeqYhjGPfjXFQIqdDTcrGmzkTVtNj5cvhsAsKKgztwTjBzkfx/bDRdKpfCmnWdtMnScRri/VoBPqvSWoJxkNRP2IzSiZRmGCQ6cGycEmAm9j1d4hH2ipNl+tnIPdh1xPqk7Y0o2ps7M8WufOqIjGibG465x3ZCabH7rVz98LtIteqQkxMd5I2QfkiaP9R5yMpzHnGFCBwt7FymvqsHGfcf9wvorqqzViJWLNt/75fqAxqH0QR/ZLQNLtnqC1uLIo5VbEfRA4Pngza5blvWRlJaAYaIV/pW5yKOzNuJPr/6GXZKr5Wc5e5B/sNRUw5UJhqL77jVneZfdqmlqFbO5CiLCfRN6YNatw0M0IoaJXVizd5FNkk96yckqnNYcuPeL9UhOiMP1Izp5++wrOaVbdNvNHCEfXz8YLdOSfY7ptPC2Xc48rSlW7TqKszqalxS8eVTnEIyIYRgW9i6yvtCT+fFwWYU3VUBFda2PZp9g4F7oZhpbrUyCdo7fVueBZIUGUoUnKy6noeaFS/oikc1GTAzCwj4IrCw4iiGd6hKDKSdodxSXoWXjFM2UwMEOlQ+VEUf2l49EYf8nk4RuDBOtsIoTBI6dqsI9X9RluFSmDZCXH9JId/DubwX4dOVuW+d6aFJPy31DVQDjkQtOx9ndMnweeAzDhBfW7IPAR8t9BbZSs1+ytRiz1u7TzQh535cbbJ1rytAsPDl7s6W+ZgUwWqelYP9xT5FurefCm1dlW8rJ37FFKt67dqClMTEMExpY2IcApQviO78WAACSXIoWVdcm/UPfNo6PpXwWaAn7c12qp8owTOhhM04AlFVU47n5eag0CZoqq/Qv0lHpkj1bra2/eGk/x8dSeu6E2k2TYZjgwsI+AK6bmYNXFm/HN2uNi5L8ss3dbJVGaEWlWk0wdk4PZQFx14bEMEwEwMI+AH7fcRgAsGZ3ScjPTQTT6lEyP/x9JF68tK9pv39ccDoW3TUSDZPiMS1CCokwDOMObLN3gd0B5LExY94dIzDh37/4tV8x6DTLKXE7tkhFxxaputu/u3U45m/cj8T4OHTKaIRNj09wPF6GYSIT1uxdoE2TBkGrt9o8VTv75Ucr7LloGtG7XRPcPb67a8djGCbyYGHvAkO7NMftn6wx7+gAoarV3q99OoDgFfNmGCY6YWHvAmUVNZi9PjhldlMSfatJrd0T+vkBhmHqPyzsXeDRWRuDduyGiealA7+8eUjQzs8wTHTAwl6DaV+uxyWv/Wa5f3UQTSpWSvWVW8yXzzBM7MLeOBp8snKP4facgiO4+LXfvetxBITThB6MEoYMw0QXpmojEb1NRAeJKFfR9igR7SWitdLfRMW2+4kon4i2ENH4YA08nCgFPRCe8nqt0uoEfLdWjUJ+foZh6hdWNPt3AbwM4D1V+4tCiOeVDUTUC8BlAE4H0AbAj0TUTQhhrVRThPPIt7nomZnm1x7kzMSa3DWuzlXSzaInDMNEJ6bCXgjxMxFlWTzeZACfCCEqAOwkonwAAwH8brxbZLLrcBlOa14XjPTe77s0+wXTZq9HUUl5yM/JMEz9JZAJ2luJaL1k5pErbLcFoDR4F0ptfhDRDUSUQ0Q5xcXFAQwjeIx87iesL4xMV8fOLfUjYhmGYdQ4FfavAugMoB+AIgAvSO1a9gRNtVcI8YYQIlsIkZ2RkaHVJSLYfeSkX1v/Duk+6/dOCH30aeHRUz7rvds24XquDMPo4kjYCyEOCCFqhBC1AN6Ex1QDeDR5ZcKWdgD2BTbEyEOd+OyLnEJHx9kcQA6aU5W+0yDf3TYc93HyMoZhdHAk7IkoU7H6RwCyp84sAJcRUTIRdQTQFcCKwIYYXuS87ifKq3T77DjkLBFag6S6gKl5d4zwLmc09njaZDVvqLuv3IdhGMYKphO0RPQxgFEAWhBRIYB/ABhFRP3gMdEUALgRAIQQG4noMwCbAFQDuKW+e+I8Oz8Pk/pk4vI3l7l63LvHdfNZ79G6zstn5YNjTfcf2rm5q+NhGCa6seKNc7lG8wyD/k8BeCqQQUUSuw6fRL/Hf0DJSX3N3gm3ju7q1/bhdYOQf7DUrz37tKbI2XUUo3u0xKK8gwCAZAtpFBiGYWQ4XYIF3Bb0rdNSNNuHdWmBKUOz/Npfv/JMNE9Nwp3n1r0NWK0+xTAMA3C6BC+HSyuwcd9xnN0t+J5BN43s5F3u2z4dI7q0MOzfvFEyVj18rk9bYhw/pxmGsQ4Le4m/vLUceftPIPcxdzI8/HjnSGQ2ScGO4jJc8PJSn23tm9VNvH57yzBHx09MYGHPMIx1WGJIbDlwAgDw1OzNrhyvY4tUpCYnoHe7Jt422bumVxv/lAt2SWFhzzCMDVizB5C3/7g3v82+klPGnS2ilRxt0V2jcOxUFZqmJjk+7tpHzsX+4+WWUh8zDMPIsLAH8MmKugwPp6qC5ykaF0cBCXoASG+YhPSGgR2DYZjYI+aF/UPfbMAHy+qKd6/YeSSMo2EYhgkOMW8LUAp6hmGYaCXmhT3DMEwsENPCvromsNqt7107EL/ce45f+9y/jdDozTAMEz5i2mb/yKyNAe2vF4ClVc2KYRgmnMS0Zj9nQ5HjfXu3rfOfb8kZKBmGiXBiWrMPpHbsjKuzvctL7jkHOw6VYtJLS/GPC3r59f3qr0NRXROGQrUMwzASMS3sA6Fl47pkZg2S4nF6myYomD5Js++ADk012xmGYUJFTJtxGIZhYoWYFvbCoR1nbM+WLo+EYRgmuMS0sHfCiK4t8MaV2eYdGYZhIoiYFvZ6ev3401vp7pPVPBVxGknOGIZhIpmYFvYnyqs12+dvPKC7zxCu/cowTD0k5oR9Ta3A/mPleOTbXL9tZlWqLj6zHSb2zgzW0BiGYYJGzLle/nNeHt74eYfmtkbJxkW8OygqTDEMw9QnTDV7InqbiA4SUa6irRkRLSCibdL/plI7EdFLRJRPROuJaEAwB2+XlQVHdAU9ACSZFATp3yHd7SExDMOEBCtmnHcBTFC1TQOwUAjRFcBCaR0AzgPQVfq7AcCr7gzTHS557XfD7ftKyr3Lc24fgXeuPguXD+zgbRtuUhicYRgmUjEV9kKInwGoK3pMBjBTWp4J4EJF+3vCwzIA6URUb4zcKwrqLrNXmzSc06MlhnWpm5AlYi8chmHqJ04naFsJIYoAQPovRxm1BbBH0a9QavODiG4gohwiyikuLnY4DPdY8cAYzfZmXAKQYZgowG1vHC3VV9OdXQjxhhAiWwiRnZFh7AUTCL9tP4SPlu9GZbVx7vqWaSma7a2baLczDMPUJ5wK+wOyeUb6f1BqLwTQXtGvHYB9zocXOH9+czke+HoDKi0UKpHTFr91VV2EbAanL2YYJgpwKuxnAZgiLU8B8K2i/SrJK2cwgGOyuSfcHCmt1N3WOSMVABAvRcY2Ta0z3TROSQzuwBiGYUKAFdfLjwH8DqA7ERUS0VQA0wGcS0TbAJwrrQPAHAA7AOQDeBPAX4MyagekJOlfavfWjQEAXVs2AgA0aeAv4FulsYbPMEz9xTSoSghxuc4mvxlN4UkjeUuggwoGRsVD+rbz+M8/ceEZmNyvLbpIQl9GL089wzBMfSGq0yUcKq3wLg+dvki33/UjOgEAUhLjMbwr+9IzDBN9RLWwv+Kt5Zb6cRZLhmGinagW9nn7T4R7CAzDMBFBVAt7K2x8bHy4h8AwDBN0olbYV1vwq7+wXxukJsdc4k+GYWKQqBX2XR6ca9qndzvOYskwTGwQtcLeCuVVNeEeAsMwTEiIaWE/4YzW4R4CwzBMSIhpYS/046wYhmGiipgS9lufPM9nPS2FJ2cZhokNokra1dQKfLJyN/4vu71Pe3JCHH6+9xwkJcThgYk90CApAWN6tNRNa8wwDBNtRJWw/2LVHjz4dS5KTlZ52+4/rwduHNnZu37D2Z21dmUYholqosqMU1rh8a5Zs7sEAHDjyE4+gp5hGCZWiSphXyUFUv24+QAAYN2eknAOh2EYJmKIKmE/fW6ez3r+wbIwjYRhGCayiCphr0aZ4phhGCaWiWphzzAMw3iIamGf89DYcA+BYRgmIohqYd+iEdeNZRiGAaJY2PeQiogzDMMwUSzs371mYLiHwDAMEzEEFEFLRAUATgCoAVAthMgmomYAPgWQBaAAwP8JIY4GNkxz5HTF7Zs1wPSL+qB1E06FwDAMI+OGZn+OEKKfECJbWp8GYKEQoiuAhdJ60Bn+z0UAgPQGSRjWpUUoTskwDFNvCIYZZzKAmdLyTAAXBuEcfhwqrQQAbNh7LBSnYxiGqVcEKuwFgB+IaBUR3SC1tRJCFAGA9L9lgOewxcTeXJCEYRhGTaBZL4cJIfYRUUsAC4goz3QPCenhcAMAdOjQIcBh1PHipf1cOxbDMEy0EJBmL4TYJ/0/COBrAAMBHCCiTACQ/h/U2fcNIUS2ECI7IyMjkGEAAAZ08BQPT06ID/hYDMMw0YZjYU9EqUTUWF4GMA5ALoBZAKZI3aYA+DbQQVqhY4tGaM3FSBiGYTQJxIzTCsDXRCQf5yMhxDwiWgngMyKaCmA3gEsCH6YxczYU4cvVhcE+DcMwTL3FsbAXQuwA0Fej/TCAMYEMyi5//XB1KE/HMAxT74jaCFqGYRimDhb2DMMwMUC9F/alFdXhHgLDMEzEU++F/Wcr94R7CAzDMBFPvRf2S7YWe5ffuirboCfDMEzsEmgEbdhp3igJAPDtLcPQt316mEfDMAwTmdRrzf5kZTW+Wr0XANC+WcMwj4ZhGCZyqdfC/pFvN3qXGyXX+5cUhmGYoFGvhf1pCm0+KaFeXwrDMExQqdfq8G1juiI1OQF7S06FeygMwzARTb0W9gBw7fCO4R4CwzBMxMO2D4ZhmBiAhT3DMEwMwMKeYRgmBmBhzzAMEwOwsGcYhokBWNgzDMPEACzsGYZhYgAW9gzDMDEACSHCPQYQUTGAXQ53bwHgkIvDqQ/wNccGfM2xQSDXfJoQIsNKx4gQ9oFARDlCiJhKZM/XHBvwNccGobpmNuMwDMPEACzsGYZhYoBoEPZvhHsAYYCvOTbga44NQnLN9d5mzzAMw5gTDZo9wzAMYwILe4ZhmBigXgt7IppARFuIKJ+IpoV7PHYgovZEtJiINhPRRiL6m9TejIgWENE26X9TqZ2I6CXpWtcT0QDFsaZI/bcR0RRF+5lEtEHa5yUiotBfqT9EFE9Ea4joe2m9IxEtl8b/KRElSe3J0nq+tD1LcYz7pfYtRDRe0R5x3wkiSieiL4goT7rfQ6L9PhPR36XvdS4RfUxEKdF2n4nobSI6SES5irag31e9c5gihKiXfwDiAWwH0AlAEoB1AHqFe1w2xp8JYIC03BjAVgC9ADwLYJrUPg3AP6XliQDmAiAAgwEsl9qbAdgh/W8qLTeVtq0AMETaZy6A88J93dK47gTwEYDvpfXPAFwmLb8G4GZp+a8AXpOWLwPwqbTcS7rfyQA6St+D+Ej9TgCYCeA6aTkJQHo032cAbQHsBNBAcX+vjrb7DOBsAAMA5Cragn5f9c5hOt5w/xAC+KCHAJivWL8fwP3hHlcA1/MtgHMBbAGQKbVlAtgiLb8O4HJF/y3S9ssBvK5of11qywSQp2j36RfG62wHYCGA0QC+l77IhwAkqO8rgPkAhkjLCVI/Ut9ruV8kficApEmCj1TtUXuf4RH2eyQBliDd5/HReJ8BZMFX2Af9vuqdw+yvPptx5C+UTKHUVu+QXlv7A1gOoJUQoggApP8tpW5612vUXqjRHm7+DeBeALXSenMAJUKIamldOU7vtUnbj0n97X4W4aQTgGIA70imq7eIKBVRfJ+FEHsBPA9gN4AieO7bKkT3fZYJxX3VO4ch9VnYa9kl650fKRE1AvAlgDuEEMeNumq0CQftYYOIzgdwUAixStms0VWYbKs31wyPpjoAwKtCiP4AyuB59daj3l+zZEOeDI/ppQ2AVADnaXSNpvtsRtivsT4L+0IA7RXr7QDsC9NYHEFEifAI+g+FEF9JzQeIKFPangngoNSud71G7e002sPJMAB/IKICAJ/AY8r5N4B0IkqQ+ijH6b02aXsTAEdg/7MIJ4UACoUQy6X1L+AR/tF8n8cC2CmEKBZCVAH4CsBQRPd9lgnFfdU7hyH1WdivBNBVmuFPgmdiZ1aYx2QZaWZ9BoDNQoh/KTbNAiDPyE+Bx5Yvt18lzeoPBnBMeoWbD2AcETWVNKpx8NgziwCcIKLB0rmuUhwrLAgh7hdCtBNCZMFzvxYJIf4CYDGAi6Vu6muWP4uLpf5Car9M8uLoCKArPJNZEfedEELsB7CHiLpLTWMAbEIU32d4zDeDiaihNCb5mqP2PisIxX3VO4cx4ZzIcWFyZCI8XizbATwY7vHYHPtweF7L1gNYK/1NhMdWuRDANul/M6k/AXhFutYNALIVx7oWQL70d42iPRtArrTPy1BNEob5+kehzhunEzw/4nwAnwNIltpTpPV8aXsnxf4PSte1BQrvk0j8TgDoByBHutffwON1EdX3GcBjAPKkcb0Pj0dNVN1nAB/DMydRBY8mPjUU91XvHGZ/nC6BYRgmBqjPZhyGYRjGIizsGYZhYgAW9gzDMDEAC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMD/D9pwksMstgtRgAAAABJRU5ErkJggg==\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "def running_average(x,window):\n", - " return np.convolve(x,np.ones(window)/window,mode='valid')\n", - "\n", - "plt.plot(running_average(rewards,100))" - ] - }, - { - "source": [ - "## Variando Hiperparâmetros e Observando o Resultado na Prática\n", - "\n", - "Agora seria interessante ver como o modelo treinado se comporta. Vamos executar a simulação, e seguiremos a mesma estratégia de seleção de ações utilizada durante o treinamento: amostragem de acordo com a distribuição de probabilidades na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [], - "source": [ - "obs = env.reset()\n", - "done = False\n", - "while not done:\n", - " s = discretize(obs)\n", - " env.render()\n", - " v = probs(np.array(qvalues(s)))\n", - " a = random.choices(actions,weights=v)[0]\n", - " obs,_,done,_ = env.step(a)\n", - "env.close()" - ] - }, - { - "source": [ - "## Salvando o resultado em um GIF animado\n", - "\n", - "Se você quiser impressionar seus amigos, pode enviar a eles a imagem animada do GIF do bastão de equilíbrio. Para fazer isso, podemos chamar `env.render` para produzir um quadro de imagem e, em seguida, salvar esses quadros em um GIF animado usando a biblioteca PIL:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "360\n" - ] - } - ], - "source": [ - "from PIL import Image\n", - "obs = env.reset()\n", - "done = False\n", - "i=0\n", - "ims = []\n", - "while not done:\n", - " s = discretize(obs)\n", - " img=env.render(mode='rgb_array')\n", - " ims.append(Image.fromarray(img))\n", - " v = probs(np.array([Qbest.get((s,a),0) for a in actions]))\n", - " a = random.choices(actions,weights=v)[0]\n", - " obs,_,done,_ = env.step(a)\n", - " i+=1\n", - "env.close()\n", - "ims[0].save('images/cartpole-balance.gif',save_all=True,append_images=ims[1::2],loop=0,duration=5)\n", - "print(i)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/8-Reinforcement/README.md b/translations/br/8-Reinforcement/README.md deleted file mode 100644 index 3916ca5f1..000000000 --- a/translations/br/8-Reinforcement/README.md +++ /dev/null @@ -1,67 +0,0 @@ - -# Introdução ao aprendizado por reforço - -O aprendizado por reforço, RL, é considerado um dos paradigmas básicos de aprendizado de máquina, ao lado do aprendizado supervisionado e não supervisionado. RL trata de decisões: tomar as decisões certas ou, pelo menos, aprender com elas. - -Imagine que você tem um ambiente simulado, como o mercado de ações. O que acontece se você impuser uma determinada regulamentação? Isso terá um efeito positivo ou negativo? Se algo negativo acontecer, você precisa aceitar esse _reforço negativo_, aprender com ele e mudar de direção. Se o resultado for positivo, você precisa construir sobre esse _reforço positivo_. - -![Pedro e o lobo](../../../translated_images/pt-BR/peter.779730f9ba3a8a8d.webp) - -> Pedro e seus amigos precisam escapar do lobo faminto! Imagem por [Jen Looper](https://twitter.com/jenlooper) - -## Tópico regional: Pedro e o Lobo (Rússia) - -[Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf) é um conto musical escrito pelo compositor russo [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). É uma história sobre o jovem pioneiro Pedro, que corajosamente sai de sua casa para a clareira da floresta para perseguir o lobo. Nesta seção, treinaremos algoritmos de aprendizado de máquina que ajudarão Pedro a: - -- **Explorar** a área ao redor e construir um mapa de navegação ideal. -- **Aprender** a usar um skate e se equilibrar nele, para se mover mais rápido. - -[![Pedro e o Lobo](https://img.youtube.com/vi/Fmi5zHg4QSM/0.jpg)](https://www.youtube.com/watch?v=Fmi5zHg4QSM) - -> 🎥 Clique na imagem acima para ouvir Pedro e o Lobo de Prokofiev - -## Aprendizado por reforço - -Nas seções anteriores, você viu dois exemplos de problemas de aprendizado de máquina: - -- **Supervisionado**, onde temos conjuntos de dados que sugerem soluções de exemplo para o problema que queremos resolver. [Classificação](../4-Classification/README.md) e [regressão](../2-Regression/README.md) são tarefas de aprendizado supervisionado. -- **Não supervisionado**, no qual não temos dados de treinamento rotulados. O principal exemplo de aprendizado não supervisionado é [Agrupamento](../5-Clustering/README.md). - -Nesta seção, apresentaremos um novo tipo de problema de aprendizado que não requer dados de treinamento rotulados. Existem vários tipos de problemas desse tipo: - -- **[Aprendizado semi-supervisionado](https://wikipedia.org/wiki/Semi-supervised_learning)**, onde temos muitos dados não rotulados que podem ser usados para pré-treinar o modelo. -- **[Aprendizado por reforço](https://wikipedia.org/wiki/Reinforcement_learning)**, no qual um agente aprende como se comportar realizando experimentos em algum ambiente simulado. - -### Exemplo - jogo de computador - -Suponha que você queira ensinar um computador a jogar um jogo, como xadrez ou [Super Mario](https://wikipedia.org/wiki/Super_Mario). Para que o computador jogue, precisamos que ele preveja qual movimento fazer em cada estado do jogo. Embora isso possa parecer um problema de classificação, não é - porque não temos um conjunto de dados com estados e ações correspondentes. Embora possamos ter alguns dados, como partidas de xadrez existentes ou gravações de jogadores jogando Super Mario, é provável que esses dados não cubram suficientemente um número grande de estados possíveis. - -Em vez de procurar dados existentes do jogo, o **Aprendizado por Reforço** (RL) baseia-se na ideia de *fazer o computador jogar* muitas vezes e observar o resultado. Assim, para aplicar o Aprendizado por Reforço, precisamos de duas coisas: - -- **Um ambiente** e **um simulador** que nos permitam jogar muitas vezes. Esse simulador definiria todas as regras do jogo, bem como os estados e ações possíveis. - -- **Uma função de recompensa**, que nos diria quão bem nos saímos durante cada movimento ou partida. - -A principal diferença entre outros tipos de aprendizado de máquina e RL é que, no RL, geralmente não sabemos se ganhamos ou perdemos até terminarmos o jogo. Assim, não podemos dizer se um determinado movimento isolado é bom ou não - só recebemos uma recompensa no final do jogo. Nosso objetivo é projetar algoritmos que nos permitam treinar um modelo sob condições incertas. Vamos aprender sobre um algoritmo de RL chamado **Q-learning**. - -## Lições - -1. [Introdução ao aprendizado por reforço e Q-Learning](1-QLearning/README.md) -2. [Usando um ambiente de simulação Gym](2-Gym/README.md) - -## Créditos - -"Introdução ao Aprendizado por Reforço" foi escrito com ♥️ por [Dmitry Soshnikov](http://soshnikov.com) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/9-Real-World/1-Applications/README.md b/translations/br/9-Real-World/1-Applications/README.md deleted file mode 100644 index b68428009..000000000 --- a/translations/br/9-Real-World/1-Applications/README.md +++ /dev/null @@ -1,159 +0,0 @@ - -# Pós-escrito: Aprendizado de máquina no mundo real - -![Resumo do aprendizado de máquina no mundo real em um sketchnote](../../../../sketchnotes/ml-realworld.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -Neste currículo, você aprendeu várias maneiras de preparar dados para treinamento e criar modelos de aprendizado de máquina. Você construiu uma série de modelos clássicos de regressão, agrupamento, classificação, processamento de linguagem natural e séries temporais. Parabéns! Agora, você pode estar se perguntando para que tudo isso serve... quais são as aplicações reais desses modelos? - -Embora a inteligência artificial, que geralmente utiliza aprendizado profundo, tenha atraído muito interesse na indústria, ainda existem aplicações valiosas para modelos clássicos de aprendizado de máquina. Você pode até estar usando algumas dessas aplicações hoje! Nesta lição, você explorará como oito diferentes indústrias e áreas de conhecimento utilizam esses tipos de modelos para tornar suas aplicações mais eficientes, confiáveis, inteligentes e valiosas para os usuários. - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## 💰 Finanças - -O setor financeiro oferece muitas oportunidades para o aprendizado de máquina. Muitos problemas nessa área podem ser modelados e resolvidos usando ML. - -### Detecção de fraude em cartões de crédito - -Aprendemos sobre [agrupamento k-means](../../5-Clustering/2-K-Means/README.md) anteriormente no curso, mas como ele pode ser usado para resolver problemas relacionados à fraude em cartões de crédito? - -O agrupamento k-means é útil em uma técnica de detecção de fraude chamada **detecção de outliers**. Outliers, ou desvios nas observações de um conjunto de dados, podem nos dizer se um cartão de crédito está sendo usado de forma normal ou se algo incomum está acontecendo. Como mostrado no artigo abaixo, você pode classificar dados de cartões de crédito usando um algoritmo de agrupamento k-means e atribuir cada transação a um grupo com base no quanto ela parece ser um outlier. Em seguida, você pode avaliar os grupos mais arriscados para identificar transações fraudulentas versus legítimas. -[Referência](https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.680.1195&rep=rep1&type=pdf) - -### Gestão de patrimônio - -Na gestão de patrimônio, um indivíduo ou empresa administra investimentos em nome de seus clientes. O objetivo é sustentar e aumentar a riqueza a longo prazo, sendo essencial escolher investimentos que tenham bom desempenho. - -Uma maneira de avaliar o desempenho de um investimento é por meio de regressão estatística. [Regressão linear](../../2-Regression/1-Tools/README.md) é uma ferramenta valiosa para entender como um fundo se comporta em relação a um benchmark. Também podemos deduzir se os resultados da regressão são estatisticamente significativos ou o quanto eles impactariam os investimentos de um cliente. Você pode expandir ainda mais sua análise usando regressão múltipla, onde fatores de risco adicionais podem ser considerados. Para um exemplo de como isso funcionaria para um fundo específico, confira o artigo abaixo sobre avaliação de desempenho de fundos usando regressão. -[Referência](http://www.brightwoodventures.com/evaluating-fund-performance-using-regression/) - -## 🎓 Educação - -O setor educacional também é uma área muito interessante onde o ML pode ser aplicado. Existem problemas intrigantes a serem resolvidos, como detectar trapaças em testes ou redações e gerenciar vieses, intencionais ou não, no processo de correção. - -### Previsão de comportamento estudantil - -[Coursera](https://coursera.com), um provedor de cursos online abertos, tem um ótimo blog técnico onde discutem muitas decisões de engenharia. Neste estudo de caso, eles traçaram uma linha de regressão para explorar qualquer correlação entre uma baixa classificação de NPS (Net Promoter Score) e a retenção ou abandono de cursos. -[Referência](https://medium.com/coursera-engineering/controlled-regression-quantifying-the-impact-of-course-quality-on-learner-retention-31f956bd592a) - -### Mitigação de vieses - -[Grammarly](https://grammarly.com), um assistente de escrita que verifica erros de ortografia e gramática, utiliza sistemas sofisticados de [processamento de linguagem natural](../../6-NLP/README.md) em seus produtos. Eles publicaram um estudo de caso interessante em seu blog técnico sobre como lidaram com o viés de gênero no aprendizado de máquina, algo que você aprendeu em nossa [lição introdutória sobre justiça](../../1-Introduction/3-fairness/README.md). -[Referência](https://www.grammarly.com/blog/engineering/mitigating-gender-bias-in-autocorrect/) - -## 👜 Varejo - -O setor de varejo pode se beneficiar muito do uso de ML, desde a criação de uma jornada do cliente mais personalizada até o gerenciamento otimizado de estoques. - -### Personalização da jornada do cliente - -Na Wayfair, uma empresa que vende produtos para casa, como móveis, ajudar os clientes a encontrar os produtos certos para seus gostos e necessidades é fundamental. Neste artigo, engenheiros da empresa descrevem como utilizam ML e NLP para "apresentar os resultados certos para os clientes". Notavelmente, seu motor de intenção de consulta foi construído para usar extração de entidades, treinamento de classificadores, extração de ativos e opiniões, e marcação de sentimentos em avaliações de clientes. Este é um caso clássico de como o NLP funciona no varejo online. -[Referência](https://www.aboutwayfair.com/tech-innovation/how-we-use-machine-learning-and-natural-language-processing-to-empower-search) - -### Gestão de estoque - -Empresas inovadoras e ágeis como [StitchFix](https://stitchfix.com), um serviço de assinatura que envia roupas para consumidores, dependem fortemente de ML para recomendações e gestão de estoque. Suas equipes de estilo trabalham em conjunto com suas equipes de merchandising. "Um de nossos cientistas de dados experimentou um algoritmo genético e o aplicou ao vestuário para prever o que seria uma peça de roupa bem-sucedida que ainda não existe. Levamos isso para a equipe de merchandising e agora eles podem usar isso como uma ferramenta." -[Referência](https://www.zdnet.com/article/how-stitch-fix-uses-machine-learning-to-master-the-science-of-styling/) - -## 🏥 Saúde - -O setor de saúde pode aproveitar o ML para otimizar tarefas de pesquisa e também problemas logísticos, como readmissão de pacientes ou controle de doenças. - -### Gestão de ensaios clínicos - -A toxicidade em ensaios clínicos é uma grande preocupação para os fabricantes de medicamentos. Qual é o nível de toxicidade tolerável? Neste estudo, a análise de vários métodos de ensaios clínicos levou ao desenvolvimento de uma nova abordagem para prever as chances de resultados de ensaios clínicos. Especificamente, eles conseguiram usar random forest para produzir um [classificador](../../4-Classification/README.md) capaz de distinguir entre grupos de medicamentos. -[Referência](https://www.sciencedirect.com/science/article/pii/S2451945616302914) - -### Gestão de readmissão hospitalar - -O atendimento hospitalar é caro, especialmente quando os pacientes precisam ser readmitidos. Este artigo discute uma empresa que usa ML para prever o potencial de readmissão usando algoritmos de [agrupamento](../../5-Clustering/README.md). Esses grupos ajudam os analistas a "descobrir grupos de readmissões que podem compartilhar uma causa comum". -[Referência](https://healthmanagement.org/c/healthmanagement/issuearticle/hospital-readmissions-and-machine-learning) - -### Gestão de doenças - -A recente pandemia destacou como o aprendizado de máquina pode ajudar a conter a disseminação de doenças. Neste artigo, você reconhecerá o uso de ARIMA, curvas logísticas, regressão linear e SARIMA. "Este trabalho é uma tentativa de calcular a taxa de disseminação deste vírus e, assim, prever mortes, recuperações e casos confirmados, para que possamos nos preparar melhor e sobreviver." -[Referência](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7979218/) - -## 🌲 Ecologia e Tecnologia Verde - -A natureza e a ecologia consistem em muitos sistemas sensíveis onde a interação entre animais e o meio ambiente entra em foco. É importante medir esses sistemas com precisão e agir adequadamente se algo acontecer, como um incêndio florestal ou uma queda na população animal. - -### Gestão florestal - -Você aprendeu sobre [Aprendizado por Reforço](../../8-Reinforcement/README.md) em lições anteriores. Ele pode ser muito útil ao tentar prever padrões na natureza. Em particular, pode ser usado para monitorar problemas ecológicos como incêndios florestais e a disseminação de espécies invasoras. No Canadá, um grupo de pesquisadores usou Aprendizado por Reforço para construir modelos de dinâmica de incêndios florestais a partir de imagens de satélite. Usando um inovador "processo de propagação espacial (SSP)", eles imaginaram um incêndio florestal como "o agente em qualquer célula na paisagem". "O conjunto de ações que o fogo pode realizar de um local em qualquer momento inclui se espalhar para o norte, sul, leste ou oeste ou não se espalhar." - -Essa abordagem inverte o cenário usual de RL, já que a dinâmica do Processo de Decisão de Markov (MDP) correspondente é uma função conhecida para a propagação imediata do incêndio. Leia mais sobre os algoritmos clássicos usados por este grupo no link abaixo. -[Referência](https://www.frontiersin.org/articles/10.3389/fict.2018.00006/full) - -### Monitoramento de movimentos de animais - -Embora o aprendizado profundo tenha revolucionado o rastreamento visual de movimentos de animais (você pode construir seu próprio [rastreador de ursos polares](https://docs.microsoft.com/learn/modules/build-ml-model-with-azure-stream-analytics/?WT.mc_id=academic-77952-leestott) aqui), o ML clássico ainda tem um lugar nessa tarefa. - -Sensores para rastrear movimentos de animais de fazenda e IoT utilizam esse tipo de processamento visual, mas técnicas mais básicas de ML são úteis para pré-processar dados. Por exemplo, neste artigo, posturas de ovelhas foram monitoradas e analisadas usando vários algoritmos de classificação. Você pode reconhecer a curva ROC na página 335. -[Referência](https://druckhaus-hofmann.de/gallery/31-wj-feb-2020.pdf) - -### ⚡️ Gestão de Energia - -Em nossas lições sobre [previsão de séries temporais](../../7-TimeSeries/README.md), invocamos o conceito de parquímetros inteligentes para gerar receita para uma cidade com base na compreensão de oferta e demanda. Este artigo discute em detalhes como agrupamento, regressão e previsão de séries temporais se combinam para ajudar a prever o uso futuro de energia na Irlanda, com base em medição inteligente. -[Referência](https://www-cdn.knime.com/sites/default/files/inline-images/knime_bigdata_energy_timeseries_whitepaper.pdf) - -## 💼 Seguros - -O setor de seguros é outro setor que utiliza ML para construir e otimizar modelos financeiros e atuariais viáveis. - -### Gestão de volatilidade - -A MetLife, uma provedora de seguros de vida, é transparente sobre como analisa e mitiga a volatilidade em seus modelos financeiros. Neste artigo, você verá visualizações de classificação binária e ordinal. Também encontrará visualizações de previsão. -[Referência](https://investments.metlife.com/content/dam/metlifecom/us/investments/insights/research-topics/macro-strategy/pdf/MetLifeInvestmentManagement_MachineLearnedRanking_070920.pdf) - -## 🎨 Artes, Cultura e Literatura - -Nas artes, por exemplo no jornalismo, há muitos problemas interessantes. Detectar notícias falsas é um grande desafio, pois já foi comprovado que elas influenciam a opinião das pessoas e até derrubam democracias. Museus também podem se beneficiar do uso de ML em tudo, desde encontrar conexões entre artefatos até planejamento de recursos. - -### Detecção de notícias falsas - -Detectar notícias falsas tornou-se um jogo de gato e rato na mídia atual. Neste artigo, pesquisadores sugerem que um sistema combinando várias das técnicas de ML que estudamos pode ser testado e o melhor modelo implantado: "Este sistema é baseado no processamento de linguagem natural para extrair características dos dados e, em seguida, essas características são usadas para o treinamento de classificadores de aprendizado de máquina, como Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD) e Regressão Logística (LR)." -[Referência](https://www.irjet.net/archives/V7/i6/IRJET-V7I6688.pdf) - -Este artigo mostra como combinar diferentes domínios de ML pode produzir resultados interessantes que ajudam a impedir a disseminação de notícias falsas e a criação de danos reais; neste caso, o impulso foi a disseminação de rumores sobre tratamentos para COVID que incitaram violência em massa. - -### ML em museus - -Os museus estão na vanguarda de uma revolução da IA, onde catalogar e digitalizar coleções e encontrar conexões entre artefatos está se tornando mais fácil à medida que a tecnologia avança. Projetos como [In Codice Ratio](https://www.sciencedirect.com/science/article/abs/pii/S0306457321001035#:~:text=1.,studies%20over%20large%20historical%20sources.) estão ajudando a desvendar os mistérios de coleções inacessíveis, como os Arquivos do Vaticano. Mas o aspecto comercial dos museus também se beneficia de modelos de ML. - -Por exemplo, o Instituto de Arte de Chicago construiu modelos para prever o que os públicos estão interessados e quando irão visitar exposições. O objetivo é criar experiências de visita individualizadas e otimizadas cada vez que o usuário visita o museu. "Durante o ano fiscal de 2017, o modelo previu a frequência e as admissões com uma precisão de 1%, diz Andrew Simnick, vice-presidente sênior do Instituto de Arte." -[Referência](https://www.chicagobusiness.com/article/20180518/ISSUE01/180519840/art-institute-of-chicago-uses-data-to-make-exhibit-choices) - -## 🏷 Marketing - -### Segmentação de clientes - -As estratégias de marketing mais eficazes segmentam os clientes de diferentes maneiras com base em vários agrupamentos. Neste artigo, os usos de algoritmos de agrupamento são discutidos para apoiar o marketing diferenciado. O marketing diferenciado ajuda as empresas a melhorar o reconhecimento da marca, alcançar mais clientes e gerar mais receita. -[Referência](https://ai.inqline.com/machine-learning-for-marketing-customer-segmentation/) - -## 🚀 Desafio - -Identifique outro setor que se beneficie de algumas das técnicas que você aprendeu neste currículo e descubra como ele utiliza ML. -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -A equipe de ciência de dados da Wayfair tem vários vídeos interessantes sobre como eles utilizam ML na empresa. Vale a pena [dar uma olhada](https://www.youtube.com/channel/UCe2PjkQXqOuwkW1gw6Ameuw/videos)! - -## Tarefa - -[Uma caça ao tesouro de ML](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/9-Real-World/1-Applications/assignment.md b/translations/br/9-Real-World/1-Applications/assignment.md deleted file mode 100644 index b571b01cb..000000000 --- a/translations/br/9-Real-World/1-Applications/assignment.md +++ /dev/null @@ -1,27 +0,0 @@ - -# Uma Caça ao Tesouro de ML - -## Instruções - -Nesta lição, você aprendeu sobre muitos casos de uso reais que foram resolvidos usando ML clássico. Embora o uso de aprendizado profundo, novas técnicas e ferramentas em IA, e o aproveitamento de redes neurais tenham ajudado a acelerar a produção de ferramentas para ajudar nesses setores, o ML clássico utilizando as técnicas deste currículo ainda tem grande valor. - -Nesta tarefa, imagine que você está participando de um hackathon. Use o que você aprendeu no currículo para propor uma solução usando ML clássico para resolver um problema em um dos setores discutidos nesta lição. Crie uma apresentação onde você discuta como irá implementar sua ideia. Pontos extras se você conseguir reunir dados de exemplo e construir um modelo de ML para apoiar seu conceito! - -## Rubrica - -| Critério | Exemplar | Adequado | Precisa Melhorar | -| -------- | ------------------------------------------------------------------- | ------------------------------------------------ | ---------------------- | -| | Uma apresentação em PowerPoint é apresentada - bônus por construir um modelo | Uma apresentação básica e não inovadora é apresentada | O trabalho está incompleto | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/9-Real-World/2-Debugging-ML-Models/README.md b/translations/br/9-Real-World/2-Debugging-ML-Models/README.md deleted file mode 100644 index 28ae7530c..000000000 --- a/translations/br/9-Real-World/2-Debugging-ML-Models/README.md +++ /dev/null @@ -1,184 +0,0 @@ - -# Pós-escrito: Depuração de Modelos de Machine Learning usando componentes do painel de IA Responsável - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -O aprendizado de máquina impacta nossas vidas cotidianas. A IA está se inserindo em alguns dos sistemas mais importantes que nos afetam como indivíduos e como sociedade, desde saúde, finanças, educação e emprego. Por exemplo, sistemas e modelos estão envolvidos em tarefas diárias de tomada de decisão, como diagnósticos médicos ou detecção de fraudes. Consequentemente, os avanços na IA, juntamente com sua adoção acelerada, estão sendo acompanhados por expectativas sociais em evolução e regulamentações crescentes em resposta. Constantemente vemos áreas onde os sistemas de IA continuam a não atender às expectativas; eles expõem novos desafios; e os governos estão começando a regulamentar soluções de IA. Por isso, é importante que esses modelos sejam analisados para fornecer resultados justos, confiáveis, inclusivos, transparentes e responsáveis para todos. - -Neste currículo, exploraremos ferramentas práticas que podem ser usadas para avaliar se um modelo apresenta problemas relacionados à IA responsável. Técnicas tradicionais de depuração de aprendizado de máquina tendem a ser baseadas em cálculos quantitativos, como precisão agregada ou perda média de erro. Imagine o que pode acontecer quando os dados que você está usando para construir esses modelos carecem de certos grupos demográficos, como raça, gênero, visão política, religião, ou representam esses grupos de forma desproporcional. E se a saída do modelo for interpretada de forma a favorecer algum grupo demográfico? Isso pode introduzir uma super ou sub-representação desses grupos sensíveis, resultando em problemas de justiça, inclusão ou confiabilidade no modelo. Outro fator é que os modelos de aprendizado de máquina são considerados "caixas-pretas", o que dificulta entender e explicar o que impulsiona as previsões de um modelo. Todos esses são desafios enfrentados por cientistas de dados e desenvolvedores de IA quando não possuem ferramentas adequadas para depurar e avaliar a justiça ou confiabilidade de um modelo. - -Nesta lição, você aprenderá a depurar seus modelos usando: - -- **Análise de Erros**: identificar onde na distribuição de dados o modelo apresenta altas taxas de erro. -- **Visão Geral do Modelo**: realizar análises comparativas entre diferentes coortes de dados para descobrir disparidades nas métricas de desempenho do modelo. -- **Análise de Dados**: investigar onde pode haver super ou sub-representação nos dados que podem enviesar o modelo para favorecer um grupo demográfico em detrimento de outro. -- **Importância das Features**: entender quais características estão impulsionando as previsões do modelo em nível global ou local. - -## Pré-requisito - -Como pré-requisito, revise [Ferramentas de IA Responsável para desenvolvedores](https://www.microsoft.com/ai/ai-lab-responsible-ai-dashboard) - -> ![Gif sobre Ferramentas de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/rai-overview.gif) - -## Análise de Erros - -Métricas tradicionais de desempenho de modelos usadas para medir precisão são, na maioria das vezes, cálculos baseados em previsões corretas versus incorretas. Por exemplo, determinar que um modelo é preciso 89% do tempo com uma perda de erro de 0,001 pode ser considerado um bom desempenho. No entanto, os erros geralmente não são distribuídos uniformemente no conjunto de dados subjacente. Você pode obter uma pontuação de precisão de 89%, mas descobrir que existem diferentes regiões nos dados em que o modelo falha 42% do tempo. As consequências desses padrões de falha em certos grupos de dados podem levar a problemas de justiça ou confiabilidade. É essencial entender as áreas onde o modelo está se saindo bem ou não. As regiões de dados com um alto número de imprecisões no modelo podem acabar sendo um grupo demográfico importante. - -![Analisar e depurar erros do modelo](../../../../9-Real-World/2-Debugging-ML-Models/images/ea-error-distribution.png) - -O componente de Análise de Erros no painel de IA Responsável ilustra como as falhas do modelo estão distribuídas entre vários coortes com uma visualização em árvore. Isso é útil para identificar características ou áreas onde há uma alta taxa de erro no conjunto de dados. Ao ver de onde vêm a maioria das imprecisões do modelo, você pode começar a investigar a causa raiz. Também é possível criar coortes de dados para realizar análises. Esses coortes de dados ajudam no processo de depuração para determinar por que o desempenho do modelo é bom em um coorte, mas apresenta erros em outro. - -![Análise de Erros](../../../../9-Real-World/2-Debugging-ML-Models/images/ea-error-cohort.png) - -Os indicadores visuais no mapa de árvore ajudam a localizar as áreas problemáticas mais rapidamente. Por exemplo, quanto mais escuro o tom de vermelho em um nó da árvore, maior a taxa de erro. - -O mapa de calor é outra funcionalidade de visualização que os usuários podem usar para investigar a taxa de erro usando uma ou duas características para encontrar contribuições para os erros do modelo em todo o conjunto de dados ou coortes. - -![Mapa de calor da Análise de Erros](../../../../9-Real-World/2-Debugging-ML-Models/images/ea-heatmap.png) - -Use a análise de erros quando você precisar: - -* Obter uma compreensão profunda de como as falhas do modelo estão distribuídas em um conjunto de dados e em várias dimensões de entrada e características. -* Dividir as métricas de desempenho agregadas para descobrir automaticamente coortes com erros e informar suas etapas de mitigação direcionadas. - -## Visão Geral do Modelo - -Avaliar o desempenho de um modelo de aprendizado de máquina requer uma compreensão holística de seu comportamento. Isso pode ser alcançado revisando mais de uma métrica, como taxa de erro, precisão, recall, precisão ou MAE (Erro Absoluto Médio), para encontrar disparidades entre as métricas de desempenho. Uma métrica de desempenho pode parecer ótima, mas imprecisões podem ser expostas em outra métrica. Além disso, comparar as métricas para disparidades em todo o conjunto de dados ou coortes ajuda a esclarecer onde o modelo está se saindo bem ou não. Isso é especialmente importante para observar o desempenho do modelo entre características sensíveis e insensíveis (por exemplo, raça, gênero ou idade de pacientes) para descobrir possíveis injustiças que o modelo possa ter. Por exemplo, descobrir que o modelo é mais impreciso em um coorte que possui características sensíveis pode revelar possíveis injustiças no modelo. - -O componente Visão Geral do Modelo do painel de IA Responsável ajuda não apenas na análise das métricas de desempenho da representação de dados em um coorte, mas também oferece aos usuários a capacidade de comparar o comportamento do modelo entre diferentes coortes. - -![Coortes de conjunto de dados - visão geral do modelo no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/model-overview-dataset-cohorts.png) - -A funcionalidade de análise baseada em características do componente permite que os usuários delimitem subgrupos de dados dentro de uma característica específica para identificar anomalias em um nível granular. Por exemplo, o painel possui inteligência integrada para gerar automaticamente coortes para uma característica selecionada pelo usuário (ex., *"tempo_no_hospital < 3"* ou *"tempo_no_hospital >= 7"*). Isso permite que o usuário isole uma característica específica de um grupo maior de dados para verificar se ela é um influenciador chave dos resultados errôneos do modelo. - -![Coortes de características - visão geral do modelo no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/model-overview-feature-cohorts.png) - -O componente Visão Geral do Modelo suporta duas classes de métricas de disparidade: - -**Disparidade no desempenho do modelo**: Esses conjuntos de métricas calculam a disparidade (diferença) nos valores da métrica de desempenho selecionada entre subgrupos de dados. Aqui estão alguns exemplos: - -* Disparidade na taxa de precisão -* Disparidade na taxa de erro -* Disparidade na precisão -* Disparidade no recall -* Disparidade no erro absoluto médio (MAE) - -**Disparidade na taxa de seleção**: Essa métrica contém a diferença na taxa de seleção (previsão favorável) entre subgrupos. Um exemplo disso é a disparidade nas taxas de aprovação de empréstimos. Taxa de seleção significa a fração de pontos de dados em cada classe classificados como 1 (em classificação binária) ou a distribuição dos valores de previsão (em regressão). - -## Análise de Dados - -> "Se você torturar os dados por tempo suficiente, eles confessarão qualquer coisa" - Ronald Coase - -Essa afirmação soa extrema, mas é verdade que os dados podem ser manipulados para apoiar qualquer conclusão. Tal manipulação às vezes pode acontecer de forma não intencional. Como seres humanos, todos temos preconceitos, e muitas vezes é difícil saber conscientemente quando estamos introduzindo preconceitos nos dados. Garantir justiça na IA e no aprendizado de máquina continua sendo um desafio complexo. - -Os dados são um grande ponto cego para métricas tradicionais de desempenho de modelos. Você pode ter altas pontuações de precisão, mas isso nem sempre reflete o viés subjacente que pode estar presente no conjunto de dados. Por exemplo, se um conjunto de dados de funcionários possui 27% de mulheres em cargos executivos em uma empresa e 73% de homens no mesmo nível, um modelo de IA de publicidade de empregos treinado com esses dados pode direcionar principalmente um público masculino para posições de alto nível. Ter esse desequilíbrio nos dados enviesou a previsão do modelo para favorecer um gênero. Isso revela um problema de justiça onde há um viés de gênero no modelo de IA. - -O componente de Análise de Dados no painel de IA Responsável ajuda a identificar áreas onde há super ou sub-representação no conjunto de dados. Ele ajuda os usuários a diagnosticar a causa raiz de erros e problemas de justiça introduzidos por desequilíbrios nos dados ou falta de representação de um grupo de dados específico. Isso dá aos usuários a capacidade de visualizar conjuntos de dados com base em resultados previstos e reais, grupos de erros e características específicas. Às vezes, descobrir um grupo de dados sub-representado também pode revelar que o modelo não está aprendendo bem, daí as altas imprecisões. Ter um modelo com viés nos dados não é apenas um problema de justiça, mas mostra que o modelo não é inclusivo ou confiável. - -![Componente de Análise de Dados no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/dataanalysis-cover.png) - -Use a análise de dados quando você precisar: - -* Explorar as estatísticas do seu conjunto de dados selecionando diferentes filtros para dividir seus dados em diferentes dimensões (também conhecidas como coortes). -* Entender a distribuição do seu conjunto de dados entre diferentes coortes e grupos de características. -* Determinar se suas descobertas relacionadas à justiça, análise de erros e causalidade (derivadas de outros componentes do painel) são resultado da distribuição do seu conjunto de dados. -* Decidir em quais áreas coletar mais dados para mitigar erros que surgem de problemas de representação, ruído de rótulo, ruído de características, viés de rótulo e fatores semelhantes. - -## Interpretabilidade do Modelo - -Modelos de aprendizado de máquina tendem a ser "caixas-pretas". Entender quais características-chave dos dados impulsionam as previsões de um modelo pode ser desafiador. É importante fornecer transparência sobre por que um modelo faz uma determinada previsão. Por exemplo, se um sistema de IA prevê que um paciente diabético está em risco de ser readmitido em um hospital em menos de 30 dias, ele deve ser capaz de fornecer dados de suporte que levaram à sua previsão. Ter indicadores de dados de suporte traz transparência para ajudar clínicos ou hospitais a tomarem decisões bem informadas. Além disso, ser capaz de explicar por que um modelo fez uma previsão para um paciente individual permite responsabilidade com as regulamentações de saúde. Quando você usa modelos de aprendizado de máquina de maneiras que afetam a vida das pessoas, é crucial entender e explicar o que influencia o comportamento de um modelo. A explicabilidade e interpretabilidade do modelo ajudam a responder perguntas em cenários como: - -* Depuração do modelo: Por que meu modelo cometeu esse erro? Como posso melhorar meu modelo? -* Colaboração humano-IA: Como posso entender e confiar nas decisões do modelo? -* Conformidade regulatória: Meu modelo atende aos requisitos legais? - -O componente Importância das Features do painel de IA Responsável ajuda você a depurar e obter uma compreensão abrangente de como um modelo faz previsões. Também é uma ferramenta útil para profissionais de aprendizado de máquina e tomadores de decisão explicarem e mostrarem evidências das características que influenciam o comportamento do modelo para conformidade regulatória. Em seguida, os usuários podem explorar explicações globais e locais para validar quais características impulsionam as previsões do modelo. Explicações globais listam as principais características que afetaram a previsão geral do modelo. Explicações locais exibem quais características levaram à previsão do modelo para um caso individual. A capacidade de avaliar explicações locais também é útil na depuração ou auditoria de um caso específico para entender e interpretar melhor por que um modelo fez uma previsão precisa ou imprecisa. - -![Componente Importância das Features do painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/9-feature-importance.png) - -* Explicações globais: Por exemplo, quais características afetam o comportamento geral de um modelo de readmissão hospitalar para diabetes? -* Explicações locais: Por exemplo, por que um paciente diabético com mais de 60 anos e hospitalizações anteriores foi previsto como readmitido ou não readmitido em menos de 30 dias em um hospital? - -No processo de depuração ao examinar o desempenho de um modelo entre diferentes coortes, a Importância das Features mostra o nível de impacto que uma característica tem entre os coortes. Ela ajuda a revelar anomalias ao comparar o nível de influência que a característica tem em impulsionar as previsões errôneas do modelo. O componente Importância das Features pode mostrar quais valores em uma característica influenciaram positivamente ou negativamente o resultado do modelo. Por exemplo, se um modelo fez uma previsão imprecisa, o componente dá a capacidade de detalhar e identificar quais características ou valores de características impulsionaram a previsão. Esse nível de detalhe ajuda não apenas na depuração, mas também fornece transparência e responsabilidade em situações de auditoria. Por fim, o componente pode ajudar a identificar problemas de justiça. Para ilustrar, se uma característica sensível como etnia ou gênero é altamente influente em impulsionar a previsão do modelo, isso pode ser um sinal de viés de raça ou gênero no modelo. - -![Importância das Features](../../../../9-Real-World/2-Debugging-ML-Models/images/9-features-influence.png) - -Use interpretabilidade quando você precisar: - -* Determinar o quão confiáveis são as previsões do seu sistema de IA, entendendo quais características são mais importantes para as previsões. -* Abordar a depuração do seu modelo entendendo-o primeiro e identificando se o modelo está usando características saudáveis ou apenas correlações falsas. -* Descobrir possíveis fontes de injustiça entendendo se o modelo está baseando previsões em características sensíveis ou em características altamente correlacionadas com elas. -* Construir confiança do usuário nas decisões do modelo gerando explicações locais para ilustrar seus resultados. -* Completar uma auditoria regulatória de um sistema de IA para validar modelos e monitorar o impacto das decisões do modelo sobre os seres humanos. - -## Conclusão - -Todos os componentes do painel de IA Responsável são ferramentas práticas para ajudar você a construir modelos de aprendizado de máquina que sejam menos prejudiciais e mais confiáveis para a sociedade. Eles melhoram a prevenção de ameaças aos direitos humanos; discriminação ou exclusão de certos grupos de oportunidades de vida; e o risco de danos físicos ou psicológicos. Também ajudam a construir confiança nas decisões do modelo, gerando explicações locais para ilustrar seus resultados. Alguns dos possíveis danos podem ser classificados como: - -- **Alocação**, se um gênero ou etnia, por exemplo, for favorecido em detrimento de outro. -- **Qualidade do serviço**. Se você treinar os dados para um cenário específico, mas a realidade for muito mais complexa, isso leva a um serviço de desempenho ruim. -- **Estereotipagem**. Associar um determinado grupo a atributos pré-atribuídos. -- **Denigração**. Criticar injustamente e rotular algo ou alguém. -- **Representação excessiva ou insuficiente**. A ideia é que um determinado grupo não seja visto em uma certa profissão, e qualquer serviço ou função que continue promovendo isso está contribuindo para o problema. - -### Painel Azure RAI - -O [Painel Azure RAI](https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard?WT.mc_id=aiml-90525-ruyakubu) é baseado em ferramentas de código aberto desenvolvidas por instituições acadêmicas e organizações líderes, incluindo a Microsoft. Ele é essencial para cientistas de dados e desenvolvedores de IA entenderem melhor o comportamento dos modelos, identificarem e mitigarem problemas indesejáveis em modelos de IA. - -- Aprenda como usar os diferentes componentes consultando a [documentação do painel RAI.](https://learn.microsoft.com/en-us/azure/machine-learning/how-to-responsible-ai-dashboard?WT.mc_id=aiml-90525-ruyakubu) - -- Confira alguns [notebooks de exemplo do painel RAI](https://github.com/Azure/RAI-vNext-Preview/tree/main/examples/notebooks) para depurar cenários de IA mais responsáveis no Azure Machine Learning. - ---- -## 🚀 Desafio - -Para evitar que vieses estatísticos ou de dados sejam introduzidos desde o início, devemos: - -- ter diversidade de origens e perspectivas entre as pessoas que trabalham nos sistemas -- investir em conjuntos de dados que reflitam a diversidade da nossa sociedade -- desenvolver melhores métodos para detectar e corrigir vieses quando eles ocorrerem - -Pense em cenários da vida real onde a injustiça é evidente na construção e uso de modelos. O que mais devemos considerar? - -## [Quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) -## Revisão e Autoestudo - -Nesta lição, você aprendeu algumas ferramentas práticas para incorporar IA responsável no aprendizado de máquina. - -Assista a este workshop para se aprofundar nos tópicos: - -- Painel de IA Responsável: Uma solução completa para operacionalizar IA responsável na prática, por Besmira Nushi e Mehrnoosh Sameki - -[![Painel de IA Responsável: Uma solução completa para operacionalizar IA responsável na prática](https://img.youtube.com/vi/f1oaDNl3djg/0.jpg)](https://www.youtube.com/watch?v=f1oaDNl3djg "Painel de IA Responsável: Uma solução completa para operacionalizar IA responsável na prática") - - -> 🎥 Clique na imagem acima para assistir ao vídeo: Painel de IA Responsável: Uma solução completa para operacionalizar IA responsável na prática, por Besmira Nushi e Mehrnoosh Sameki - -Consulte os seguintes materiais para aprender mais sobre IA responsável e como construir modelos mais confiáveis: - -- Ferramentas do painel RAI da Microsoft para depuração de modelos de aprendizado de máquina: [Recursos de ferramentas de IA responsável](https://aka.ms/rai-dashboard) - -- Explore o kit de ferramentas de IA responsável: [Github](https://github.com/microsoft/responsible-ai-toolbox) - -- Centro de recursos de IA responsável da Microsoft: [Recursos de IA Responsável – Microsoft AI](https://www.microsoft.com/ai/responsible-ai-resources?activetab=pivot1%3aprimaryr4) - -- Grupo de pesquisa FATE da Microsoft: [FATE: Justiça, Responsabilidade, Transparência e Ética em IA - Microsoft Research](https://www.microsoft.com/research/theme/fate/) - -## Tarefa - -[Explore o painel RAI](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/9-Real-World/2-Debugging-ML-Models/assignment.md b/translations/br/9-Real-World/2-Debugging-ML-Models/assignment.md deleted file mode 100644 index 79d33a6a0..000000000 --- a/translations/br/9-Real-World/2-Debugging-ML-Models/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Explore o painel Responsible AI (RAI) - -## Instruções - -Nesta lição, você aprendeu sobre o painel RAI, um conjunto de componentes baseados em ferramentas "open-source" para ajudar cientistas de dados a realizar análise de erros, exploração de dados, avaliação de equidade, interpretabilidade de modelos, avaliações contrafactuais/"e se" e análise causal em sistemas de IA. Para esta tarefa, explore alguns dos [notebooks](https://github.com/Azure/RAI-vNext-Preview/tree/main/examples/notebooks) de exemplo do painel RAI e relate suas descobertas em um artigo ou apresentação. - -## Rubrica - -| Critérios | Exemplares | Adequados | Necessita Melhorar | -| --------- | ---------- | --------- | ------------------ | -| | Um artigo ou apresentação em PowerPoint é apresentado discutindo os componentes do painel RAI, o notebook que foi executado e as conclusões tiradas a partir da execução | Um artigo é apresentado sem conclusões | Nenhum artigo é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/9-Real-World/README.md b/translations/br/9-Real-World/README.md deleted file mode 100644 index e4c19ba9f..000000000 --- a/translations/br/9-Real-World/README.md +++ /dev/null @@ -1,32 +0,0 @@ - -# Pós-escrito: Aplicações reais de aprendizado de máquina clássico - -Nesta seção do currículo, você será apresentado a algumas aplicações reais do aprendizado de máquina clássico. Pesquisamos na internet para encontrar artigos e publicações sobre aplicações que utilizam essas estratégias, evitando ao máximo redes neurais, aprendizado profundo e IA. Descubra como o aprendizado de máquina é usado em sistemas empresariais, aplicações ecológicas, finanças, artes e cultura, entre outros. - -![chess](../../../translated_images/pt-BR/chess.e704a268781bdad8.webp) - -> Foto por Alexis Fauvet no Unsplash - -## Aula - -1. [Aplicações Reais de Aprendizado de Máquina](1-Applications/README.md) -2. [Depuração de Modelos de Aprendizado de Máquina usando componentes do painel de IA Responsável](2-Debugging-ML-Models/README.md) - -## Créditos - -"Aplicações Reais" foi escrito por uma equipe de pessoas, incluindo [Jen Looper](https://twitter.com/jenlooper) e [Ornella Altunyan](https://twitter.com/ornelladotcom). - -"Depuração de Modelos de Aprendizado de Máquina usando componentes do painel de IA Responsável" foi escrito por [Ruth Yakubu](https://twitter.com/ruthieyakubu) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/AGENTS.md b/translations/br/AGENTS.md deleted file mode 100644 index 1b26ec25d..000000000 --- a/translations/br/AGENTS.md +++ /dev/null @@ -1,345 +0,0 @@ - -# AGENTS.md - -## Visão Geral do Projeto - -Este é o **Machine Learning para Iniciantes**, um currículo abrangente de 12 semanas e 26 aulas que cobre conceitos clássicos de aprendizado de máquina usando Python (principalmente com Scikit-learn) e R. O repositório foi projetado como um recurso de aprendizado autônomo com projetos práticos, questionários e tarefas. Cada aula explora conceitos de aprendizado de máquina através de dados reais de diversas culturas e regiões ao redor do mundo. - -Componentes principais: -- **Conteúdo Educacional**: 26 aulas cobrindo introdução ao aprendizado de máquina, regressão, classificação, clustering, NLP, séries temporais e aprendizado por reforço -- **Aplicativo de Questionário**: Aplicativo de questionário baseado em Vue.js com avaliações antes e depois das aulas -- **Suporte Multilíngue**: Traduções automáticas para mais de 40 idiomas via GitHub Actions -- **Suporte a Duas Linguagens**: Aulas disponíveis em Python (notebooks Jupyter) e R (arquivos R Markdown) -- **Aprendizado Baseado em Projetos**: Cada tópico inclui projetos práticos e tarefas - -## Estrutura do Repositório - -``` -ML-For-Beginners/ -├── 1-Introduction/ # ML basics, history, fairness, techniques -├── 2-Regression/ # Regression models with Python/R -├── 3-Web-App/ # Flask web app for ML model deployment -├── 4-Classification/ # Classification algorithms -├── 5-Clustering/ # Clustering techniques -├── 6-NLP/ # Natural Language Processing -├── 7-TimeSeries/ # Time series forecasting -├── 8-Reinforcement/ # Reinforcement learning -├── 9-Real-World/ # Real-world ML applications -├── quiz-app/ # Vue.js quiz application -├── translations/ # Auto-generated translations -└── sketchnotes/ # Visual learning aids -``` - -Cada pasta de aula geralmente contém: -- `README.md` - Conteúdo principal da aula -- `notebook.ipynb` - Notebook Jupyter em Python -- `solution/` - Código de solução (versões em Python e R) -- `assignment.md` - Exercícios práticos -- `images/` - Recursos visuais - -## Comandos de Configuração - -### Para Aulas em Python - -A maioria das aulas utiliza notebooks Jupyter. Instale as dependências necessárias: - -```bash -# Install Python 3.8+ if not already installed -python --version - -# Install Jupyter -pip install jupyter - -# Install common ML libraries -pip install scikit-learn pandas numpy matplotlib seaborn - -# For specific lessons, check lesson-specific requirements -# Example: Web App lesson -pip install flask -``` - -### Para Aulas em R - -As aulas em R estão nas pastas `solution/R/` como arquivos `.rmd` ou `.ipynb`: - -```bash -# Install R and required packages -# In R console: -install.packages(c("tidyverse", "tidymodels", "caret")) -``` - -### Para o Aplicativo de Questionário - -O aplicativo de questionário é uma aplicação Vue.js localizada no diretório `quiz-app/`: - -```bash -cd quiz-app -npm install -``` - -### Para o Site de Documentação - -Para executar a documentação localmente: - -```bash -# Install Docsify -npm install -g docsify-cli - -# Serve from repository root -docsify serve - -# Access at http://localhost:3000 -``` - -## Fluxo de Trabalho de Desenvolvimento - -### Trabalhando com Notebooks de Aula - -1. Navegue até o diretório da aula (ex.: `2-Regression/1-Tools/`) -2. Abra o notebook Jupyter: - ```bash - jupyter notebook notebook.ipynb - ``` -3. Trabalhe no conteúdo e nos exercícios da aula -4. Verifique as soluções na pasta `solution/` se necessário - -### Desenvolvimento em Python - -- As aulas utilizam bibliotecas padrão de ciência de dados em Python -- Notebooks Jupyter para aprendizado interativo -- Código de solução disponível na pasta `solution/` de cada aula - -### Desenvolvimento em R - -- As aulas em R estão no formato `.rmd` (R Markdown) -- Soluções localizadas em subdiretórios `solution/R/` -- Use RStudio ou Jupyter com kernel R para executar os notebooks em R - -### Desenvolvimento do Aplicativo de Questionário - -```bash -cd quiz-app - -# Start development server -npm run serve -# Access at http://localhost:8080 - -# Build for production -npm run build - -# Lint and fix files -npm run lint -``` - -## Instruções de Teste - -### Teste do Aplicativo de Questionário - -```bash -cd quiz-app - -# Lint code -npm run lint - -# Build to verify no errors -npm run build -``` - -**Nota**: Este é principalmente um repositório de currículo educacional. Não há testes automatizados para o conteúdo das aulas. A validação é feita através de: -- Conclusão dos exercícios das aulas -- Execução bem-sucedida das células dos notebooks -- Verificação dos resultados contra as soluções esperadas - -## Diretrizes de Estilo de Código - -### Código em Python -- Siga as diretrizes de estilo PEP 8 -- Use nomes de variáveis claros e descritivos -- Inclua comentários para operações complexas -- Os notebooks Jupyter devem ter células markdown explicando os conceitos - -### JavaScript/Vue.js (Aplicativo de Questionário) -- Segue o guia de estilo do Vue.js -- Configuração do ESLint em `quiz-app/package.json` -- Execute `npm run lint` para verificar e corrigir problemas automaticamente - -### Documentação -- Arquivos markdown devem ser claros e bem estruturados -- Inclua exemplos de código em blocos de código delimitados -- Use links relativos para referências internas -- Siga as convenções de formatação existentes - -## Construção e Implantação - -### Implantação do Aplicativo de Questionário - -O aplicativo de questionário pode ser implantado no Azure Static Web Apps: - -1. **Pré-requisitos**: - - Conta no Azure - - Repositório GitHub (já bifurcado) - -2. **Implantar no Azure**: - - Crie um recurso Azure Static Web App - - Conecte ao repositório GitHub - - Defina a localização do aplicativo: `/quiz-app` - - Defina a localização de saída: `dist` - - O Azure cria automaticamente o workflow do GitHub Actions - -3. **Workflow do GitHub Actions**: - - Arquivo de workflow criado em `.github/workflows/azure-static-web-apps-*.yml` - - Constrói e implanta automaticamente ao fazer push na branch principal - -### PDF da Documentação - -Gerar PDF a partir da documentação: - -```bash -npm install -npm run convert -``` - -## Fluxo de Trabalho de Tradução - -**Importante**: As traduções são automatizadas via GitHub Actions usando o Co-op Translator. - -- As traduções são geradas automaticamente quando alterações são feitas na branch `main` -- **NÃO traduza o conteúdo manualmente** - o sistema cuida disso -- Workflow definido em `.github/workflows/co-op-translator.yml` -- Utiliza serviços Azure AI/OpenAI para tradução -- Suporta mais de 40 idiomas - -## Diretrizes de Contribuição - -### Para Contribuidores de Conteúdo - -1. **Bifurque o repositório** e crie uma branch de recurso -2. **Faça alterações no conteúdo das aulas** se estiver adicionando/atualizando aulas -3. **Não modifique arquivos traduzidos** - eles são gerados automaticamente -4. **Teste seu código** - certifique-se de que todas as células dos notebooks sejam executadas com sucesso -5. **Verifique se os links e imagens** funcionam corretamente -6. **Envie um pull request** com uma descrição clara - -### Diretrizes para Pull Request - -- **Formato do título**: `[Seção] Breve descrição das alterações` - - Exemplo: `[Regression] Corrigir erro de digitação na aula 5` - - Exemplo: `[Quiz-App] Atualizar dependências` -- **Antes de enviar**: - - Certifique-se de que todas as células dos notebooks sejam executadas sem erros - - Execute `npm run lint` se estiver modificando o quiz-app - - Verifique a formatação do markdown - - Teste quaisquer novos exemplos de código -- **O PR deve incluir**: - - Descrição das alterações - - Motivo das alterações - - Capturas de tela se houver alterações na interface -- **Código de Conduta**: Siga o [Código de Conduta de Código Aberto da Microsoft](CODE_OF_CONDUCT.md) -- **CLA**: Você precisará assinar o Acordo de Licença de Contribuidor - -## Estrutura das Aulas - -Cada aula segue um padrão consistente: - -1. **Questionário pré-aula** - Teste de conhecimento inicial -2. **Conteúdo da aula** - Instruções e explicações escritas -3. **Demonstrações de código** - Exemplos práticos em notebooks -4. **Verificações de conhecimento** - Confirme a compreensão ao longo da aula -5. **Desafio** - Aplique os conceitos de forma independente -6. **Tarefa** - Prática estendida -7. **Questionário pós-aula** - Avalie os resultados do aprendizado - -## Referência de Comandos Comuns - -```bash -# Python/Jupyter -jupyter notebook # Start Jupyter server -jupyter notebook notebook.ipynb # Open specific notebook -pip install -r requirements.txt # Install dependencies (where available) - -# Quiz App -cd quiz-app -npm install # Install dependencies -npm run serve # Development server -npm run build # Production build -npm run lint # Lint and fix - -# Documentation -docsify serve # Serve documentation locally -npm run convert # Generate PDF - -# Git workflow -git checkout -b feature/my-change # Create feature branch -git add . # Stage changes -git commit -m "Description" # Commit changes -git push origin feature/my-change # Push to remote -``` - -## Recursos Adicionais - -- **Coleção Microsoft Learn**: [Módulos de ML para Iniciantes](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -- **Aplicativo de Questionário**: [Questionários online](https://ff-quizzes.netlify.app/en/ml/) -- **Fórum de Discussão**: [Discussões no GitHub](https://github.com/microsoft/ML-For-Beginners/discussions) -- **Tutoriais em Vídeo**: [Playlist no YouTube](https://aka.ms/ml-beginners-videos) - -## Tecnologias Principais - -- **Python**: Linguagem principal para aulas de aprendizado de máquina (Scikit-learn, Pandas, NumPy, Matplotlib) -- **R**: Implementação alternativa usando tidyverse, tidymodels, caret -- **Jupyter**: Notebooks interativos para aulas em Python -- **R Markdown**: Documentos para aulas em R -- **Vue.js 3**: Framework do aplicativo de questionário -- **Flask**: Framework de aplicação web para implantação de modelos de aprendizado de máquina -- **Docsify**: Gerador de site de documentação -- **GitHub Actions**: CI/CD e traduções automatizadas - -## Considerações de Segurança - -- **Sem segredos no código**: Nunca comprometa chaves de API ou credenciais -- **Dependências**: Mantenha os pacotes npm e pip atualizados -- **Entrada do usuário**: Exemplos de aplicativos web Flask incluem validação básica de entrada -- **Dados sensíveis**: Os conjuntos de dados de exemplo são públicos e não sensíveis - -## Solução de Problemas - -### Notebooks Jupyter - -- **Problemas no kernel**: Reinicie o kernel se as células travarem: Kernel → Restart -- **Erros de importação**: Certifique-se de que todos os pacotes necessários estão instalados com pip -- **Problemas de caminho**: Execute os notebooks a partir do diretório onde estão localizados - -### Aplicativo de Questionário - -- **npm install falha**: Limpe o cache do npm: `npm cache clean --force` -- **Conflitos de porta**: Altere a porta com: `npm run serve -- --port 8081` -- **Erros de build**: Exclua `node_modules` e reinstale: `rm -rf node_modules && npm install` - -### Aulas em R - -- **Pacote não encontrado**: Instale com: `install.packages("nome-do-pacote")` -- **Renderização de RMarkdown**: Certifique-se de que o pacote rmarkdown está instalado -- **Problemas no kernel**: Pode ser necessário instalar IRkernel para Jupyter - -## Notas Específicas do Projeto - -- Este é principalmente um **currículo de aprendizado**, não código de produção -- O foco está em **compreender conceitos de aprendizado de máquina** através de prática prática -- Exemplos de código priorizam **clareza em vez de otimização** -- A maioria das aulas é **autossuficiente** e pode ser concluída de forma independente -- **Soluções fornecidas**, mas os alunos devem tentar os exercícios primeiro -- O repositório utiliza **Docsify** para documentação web sem etapa de construção -- **Sketchnotes** fornecem resumos visuais dos conceitos -- **Suporte multilíngue** torna o conteúdo acessível globalmente - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/CODE_OF_CONDUCT.md b/translations/br/CODE_OF_CONDUCT.md deleted file mode 100644 index 1a303daa2..000000000 --- a/translations/br/CODE_OF_CONDUCT.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Código de Conduta de Código Aberto da Microsoft - -Este projeto adotou o [Código de Conduta de Código Aberto da Microsoft](https://opensource.microsoft.com/codeofconduct/). - -Recursos: - -- [Código de Conduta de Código Aberto da Microsoft](https://opensource.microsoft.com/codeofconduct/) -- [FAQ do Código de Conduta da Microsoft](https://opensource.microsoft.com/codeofconduct/faq/) -- Entre em contato com [opencode@microsoft.com](mailto:opencode@microsoft.com) para dúvidas ou preocupações - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/CONTRIBUTING.md b/translations/br/CONTRIBUTING.md deleted file mode 100644 index ca0c23187..000000000 --- a/translations/br/CONTRIBUTING.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Contribuindo - -Este projeto aceita contribuições e sugestões. A maioria das contribuições exige que você concorde com um Acordo de Licença de Contribuidor (CLA), declarando que você tem o direito de, e realmente concede a nós, os direitos de usar sua contribuição. Para mais detalhes, visite https://cla.microsoft.com. - -> Importante: ao traduzir textos neste repositório, certifique-se de não usar tradução automática. Verificaremos as traduções por meio da comunidade, então, por favor, só se ofereça para traduzir em idiomas nos quais você seja proficiente. - -Quando você enviar um pull request, um CLA-bot determinará automaticamente se você precisa fornecer um CLA e decorará o PR de forma apropriada (por exemplo, com rótulos ou comentários). Basta seguir as instruções fornecidas pelo bot. Você só precisará fazer isso uma vez em todos os repositórios que utilizam nosso CLA. - -Este projeto adotou o [Código de Conduta de Código Aberto da Microsoft](https://opensource.microsoft.com/codeofconduct/). -Para mais informações, veja as [Perguntas Frequentes sobre o Código de Conduta](https://opensource.microsoft.com/codeofconduct/faq/) -ou entre em contato com [opencode@microsoft.com](mailto:opencode@microsoft.com) para quaisquer dúvidas ou comentários adicionais. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/PyTorch_Fundamentals.ipynb b/translations/br/PyTorch_Fundamentals.ipynb deleted file mode 100644 index 0ed1a09ef..000000000 --- a/translations/br/PyTorch_Fundamentals.ipynb +++ /dev/null @@ -1,2828 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 0, - "metadata": { - "colab": { - "provenance": [], - "gpuType": "T4", - "authorship_tag": "ABX9TyOgv0AozH1FKQBD+RkgT2bV", - "include_colab_link": true - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3" - }, - "language_info": { - "name": "python" - }, - "accelerator": "GPU", - "coopTranslator": { - "original_hash": "0ca21b6ee62904d616f2e36dc1cf0da7", - "translation_date": "2025-08-29T22:44:51+00:00", - "source_file": "PyTorch_Fundamentals.ipynb", - "language_code": "br" - } - }, - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "view-in-github", - "colab_type": "text" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "EHh5JllMh1rG", - "outputId": "f55755ad-c369-414c-85ec-6e9d4f061a02", - "colab": { - "base_uri": "https://localhost:8080/", - "height": 35 - } - }, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "'2.2.1+cu121'" - ], - "application/vnd.google.colaboratory.intrinsic+json": { - "type": "string" - } - }, - "metadata": {}, - "execution_count": 1 - } - ], - "source": [ - "import torch\n", - "torch.__version__" - ] - }, - { - "cell_type": "code", - "source": [ - "print(\"I am excited to run this\")" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "UPlb-duwXAfz", - "outputId": "cfd687e4-1238-49f4-ab6b-ee1305b740d2" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "I am excited to run this\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "import pandas as pd\n", - "import numpy as np\n", - "import matplotlib.pyplot as plt\n", - "print(torch.__version__)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "byWVlJ9wXDSk", - "outputId": "fd74a5c4-4d4a-41b2-ef3c-562ea3e4811f" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "2.2.1+cu121\n" - ] - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "Osm80zoEYklS" - } - }, - { - "cell_type": "code", - "source": [ - "# scalar\n", - "scalar = torch.tensor(7)\n", - "scalar" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "-o8wvJ-VXZmI", - "outputId": "558816f5-1205-4de1-fe1f-2f96e9bd79e6" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(7)" - ] - }, - "metadata": {}, - "execution_count": 4 - } - ] - }, - { - "cell_type": "code", - "source": [ - "scalar.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "mCZ2tXC4Y_Sg", - "outputId": "2d86dbdc-56e1-45c6-d3dd-14515f2a457a" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ] - }, - { - "cell_type": "code", - "source": [ - "scalar.item()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ssN00By0ZQgS", - "outputId": "490f40d1-5135-4969-a6d3-c8c902cdc473" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "7" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ] - }, - { - "cell_type": "code", - "source": [ - "# vector\n", - "vector = torch.tensor([7, 7])\n", - "vector\n", - "#vector.ndim\n", - "#vector.item()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Bws__5wlZnmF", - "outputId": "944e38f9-5ba1-4ddc-a9c6-cfb6a19bb488" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([7, 7])" - ] - }, - "metadata": {}, - "execution_count": 7 - } - ] - }, - { - "cell_type": "code", - "source": [ - "vector.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "9pjCvnsZZzNG", - "outputId": "e030a4da-8f81-4858-fbce-86da2aaafe52" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([2])" - ] - }, - "metadata": {}, - "execution_count": 8 - } - ] - }, - { - "cell_type": "code", - "source": [ - "# Matrix\n", - "MATRIX = torch.tensor([[7, 8],[9, 10]])\n", - "MATRIX" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "a747hI9SaBGW", - "outputId": "af835ddb-81ff-4981-badb-441567194d15" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[ 7, 8],\n", - " [ 9, 10]])" - ] - }, - "metadata": {}, - "execution_count": 9 - } - ] - }, - { - "cell_type": "code", - "source": [ - "MATRIX.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XdTfFa7vaRUj", - "outputId": "0fbbab9c-8263-4cad-a380-0d2a16ca499e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ] - }, - { - "cell_type": "code", - "source": [ - "MATRIX[0]\n", - "MATRIX[1]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "TFeD3jSDafm7", - "outputId": "69b44ab3-5ba7-451a-c6b2-f019a03d0c96" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 9, 10])" - ] - }, - "metadata": {}, - "execution_count": 11 - } - ] - }, - { - "cell_type": "code", - "source": [ - "# Tensor\n", - "TENSOR = torch.tensor([[[1, 2, 3],[3,6,9], [2,4,5]]])\n", - "TENSOR" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ic3cE47tah42", - "outputId": "f250e295-91de-43ec-9d80-588a6fe0abde" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[1, 2, 3],\n", - " [3, 6, 9],\n", - " [2, 4, 5]]])" - ] - }, - "metadata": {}, - "execution_count": 12 - } - ] - }, - { - "cell_type": "code", - "source": [ - "TENSOR.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Wvjf5fczbAM1", - "outputId": "9c72b5b8-bafe-4ae7-9883-b051e209eada" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([1, 3, 3])" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ] - }, - { - "cell_type": "code", - "source": [ - "TENSOR.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "mwtXZwiMbN3m", - "outputId": "331a5e36-b1b0-4a5f-a9b8-e7049cbaa8f9" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "3" - ] - }, - "metadata": {}, - "execution_count": 14 - } - ] - }, - { - "cell_type": "code", - "source": [ - "TENSOR[0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "vzdZu_IfbP3J", - "outputId": "e24e7e71-e365-412d-ff50-fc094b56d2f3" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 2, 3],\n", - " [3, 6, 9],\n", - " [2, 4, 5]])" - ] - }, - "metadata": {}, - "execution_count": 15 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "A8OL9eWfcRrJ" - } - }, - { - "cell_type": "code", - "source": [ - "random_tensor = torch.rand(3,4)\n", - "random_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "hAqSDE1EcVS_", - "outputId": "946171c3-d054-400c-f893-79110356888c" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.4414, 0.7681, 0.8385, 0.3166],\n", - " [0.0468, 0.5812, 0.0670, 0.9173],\n", - " [0.2959, 0.3276, 0.7411, 0.4643]])" - ] - }, - "metadata": {}, - "execution_count": 16 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "g4fvPE5GcwzP", - "outputId": "8737f36b-6864-4059-eaed-6f9156c22306" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 17 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XsAg99QmdAU6", - "outputId": "35467c11-257c-4f16-99aa-eca930bcbc36" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([3, 4])" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor.size()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cii1pNdVdB68", - "outputId": "fc8d2de6-9215-43de-99f7-7b0d7f7d20fa" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([3, 4])" - ] - }, - "metadata": {}, - "execution_count": 19 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_image_tensor = torch.rand(size=(3, 224, 224)) #color channels, height, width\n", - "random_image_tensor.ndim, random_image_tensor.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "aTKq2j0cdDjb", - "outputId": "6be42057-20b9-4faf-d79d-8b65c42cc27e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(3, torch.Size([3, 224, 224]))" - ] - }, - "metadata": {}, - "execution_count": 20 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor_ofownsize = torch.rand(size=(5,10,10))\n", - "random_tensor_ofownsize.ndim, random_tensor_ofownsize.shape\n" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "IyhDdj-Pd6nC", - "outputId": "43e5e334-6d4d-4b67-f87d-7d364c6d8c67" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(3, torch.Size([5, 10, 10]))" - ] - }, - "metadata": {}, - "execution_count": 21 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "UOJW08uOert_" - } - }, - { - "cell_type": "code", - "source": [ - "zero = torch.zeros(size=(3, 4))\n", - "zero" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "uGvXtaXyefie", - "outputId": "d40d3e28-8667-4d2f-8b62-f0829c6162ad" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0., 0., 0., 0.],\n", - " [0., 0., 0., 0.],\n", - " [0., 0., 0., 0.]])" - ] - }, - "metadata": {}, - "execution_count": 22 - } - ] - }, - { - "cell_type": "code", - "source": [ - "zero*random_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "OyUkUPkDe0uH", - "outputId": "26c2e4be-36ba-4c6c-9a90-2704ec135828" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0., 0., 0., 0.],\n", - " [0., 0., 0., 0.],\n", - " [0., 0., 0., 0.]])" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ones = torch.ones(size=(3, 4))\n", - "ones\n" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "y_Ac62Aqe82G", - "outputId": "291de5d9-b9df-49de-c9d1-d098e3e9f4d8" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1., 1., 1., 1.],\n", - " [1., 1., 1., 1.],\n", - " [1., 1., 1., 1.]])" - ] - }, - "metadata": {}, - "execution_count": 24 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ones.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "TvGOA9odfIEO", - "outputId": "45949ef4-6649-4b6c-d6af-2d4bfb8de832" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.float32" - ] - }, - "metadata": {}, - "execution_count": 25 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ones*zero" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "--pTyge-fI-8", - "outputId": "c4d9bb7e-829b-43db-e2db-b1a2d64e61f0" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0., 0., 0., 0.],\n", - " [0., 0., 0., 0.],\n", - " [0., 0., 0., 0.]])" - ] - }, - "metadata": {}, - "execution_count": 26 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "qDcc7Z36fSJF" - } - }, - { - "cell_type": "code", - "source": [ - "one_to_ten = torch.arange(start = 1, end = 11, step = 1)\n", - "one_to_ten" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "w3CZB4zUfR1s", - "outputId": "197fcba1-da0a-4b4a-ed11-3974bd6c01aa" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])" - ] - }, - "metadata": {}, - "execution_count": 27 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ten_zeros = torch.zeros_like(one_to_ten)\n", - "ten_zeros" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "WZh99BwVfRy8", - "outputId": "51ef8bfb-6fa0-4099-ff66-b97d65b2ddea" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])" - ] - }, - "metadata": {}, - "execution_count": 28 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "pGGhgsbUgqbW" - } - }, - { - "cell_type": "code", - "source": [ - "float_32_tensor = torch.tensor([3.0, 6.0,9.0], dtype = None, device = None, requires_grad = False)\n", - "float_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "JORJl4XkfRsx", - "outputId": "71114171-0f49-481f-b6fc-6cb48e2fb895" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([3., 6., 9.])" - ] - }, - "metadata": {}, - "execution_count": 29 - } - ] - }, - { - "cell_type": "code", - "source": [ - "float_32_tensor.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "6wOPPwGyfRLn", - "outputId": "f23776a1-b682-404a-9f67-d5bcb0402666" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.float32" - ] - }, - "metadata": {}, - "execution_count": 30 - } - ] - }, - { - "cell_type": "code", - "source": [ - "float_16_tensor = float_32_tensor.type(torch.float16)\n", - "float_16_tensor.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "tFsHCvmZfOYe", - "outputId": "d3aa305a-7591-47f5-97fd-61bff60b44bd" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.float16" - ] - }, - "metadata": {}, - "execution_count": 31 - } - ] - }, - { - "cell_type": "code", - "source": [ - "float_16_tensor*float_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "TQiCGTPuwq0q", - "outputId": "98750fce-1ca3-4889-e269-8b753efdea96" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 9., 36., 81.])" - ] - }, - "metadata": {}, - "execution_count": 32 - } - ] - }, - { - "cell_type": "code", - "source": [ - "int_32_tensor = torch.tensor([3, 6, 9], dtype = torch.int32)\n", - "int_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "5hlrLvGUw5D_", - "outputId": "41d890a0-9aee-446c-d906-631ce2ab0995" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([3, 6, 9], dtype=torch.int32)" - ] - }, - "metadata": {}, - "execution_count": 33 - } - ] - }, - { - "cell_type": "code", - "source": [ - "int_32_tensor*float_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ihApD9u3xTNW", - "outputId": "d295eed0-6996-4e0f-8502-ff4b55cd1373" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 9., 36., 81.])" - ] - }, - "metadata": {}, - "execution_count": 34 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x = torch.arange(0,100,10)" - ], - "metadata": { - "id": "utKhlb_KxWDQ" - }, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "p78D74E9Rj7Y", - "outputId": "781a1614-a900-41f5-9e5d-358f0b2390aa" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 0, 10, 20, 30, 40, 50, 60, 70, 80, 90])" - ] - }, - "metadata": {}, - "execution_count": 36 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.min()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "4BcSs5NeRkcj", - "outputId": "3f24a8dc-58e9-4a5f-9834-e85856a34f9d" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0)" - ] - }, - "metadata": {}, - "execution_count": 37 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.max()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "hinqvXVLRm4q", - "outputId": "5c7d8a53-3913-4ac1-bba3-5ba8ff68250a" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(90)" - ] - }, - "metadata": {}, - "execution_count": 38 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.mean(x.type(torch.float32))" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "k7okc0_vRpnB", - "outputId": "91e5494f-dc57-417c-ea4d-25dbc547c893" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(45.)" - ] - }, - "metadata": {}, - "execution_count": 39 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.type(torch.float32).mean()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "29QcDTjHRq10", - "outputId": "62937c6c-78e0-49f2-dde3-1543ee8f7907" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(45.)" - ] - }, - "metadata": {}, - "execution_count": 40 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.sum()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "wlpY_G_sbdKF", - "outputId": "475d8258-af65-4011-a258-b93d4d8142d4" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(450)" - ] - }, - "metadata": {}, - "execution_count": 41 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.argmax()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "GT6HJzwhbk4n", - "outputId": "2e455c20-c322-4bcf-d07c-1259d3ccefc6" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(9)" - ] - }, - "metadata": {}, - "execution_count": 42 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.argmin()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "egL3oi2Mb19P", - "outputId": "f71fb32f-6338-44a3-b377-75bea0a3ab54" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0)" - ] - }, - "metadata": {}, - "execution_count": 43 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "p2U8DZKib3DP", - "outputId": "b9f613b9-74e9-45f4-ed01-05babb6a6793" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0)" - ] - }, - "metadata": {}, - "execution_count": 44 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[9]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "24qBFlGYcABe", - "outputId": "5813cfcb-7f63-4bd7-ee46-f95ccbfda939" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(90)" - ] - }, - "metadata": {}, - "execution_count": 45 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x = torch.arange(1, 10)\n", - "x.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "0GPOxEzkcBHO", - "outputId": "aefbd903-4f4c-4d2c-c90f-eccd682fe018" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([9])" - ] - }, - "metadata": {}, - "execution_count": 46 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_reshaped = x.reshape(1,9)\n", - "x_reshaped, x_reshaped.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "spmRgQjwddgp", - "outputId": "85a7c55c-2909-4ea2-fc68-386dddc65742" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(tensor([[1, 2, 3, 4, 5, 6, 7, 8, 9]]), torch.Size([1, 9]))" - ] - }, - "metadata": {}, - "execution_count": 47 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_reshaped.view(1,9)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "tH2ahWGydqqP", - "outputId": "65d92263-4fc4-434a-c06d-c5e08436f7fe" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 2, 3, 4, 5, 6, 7, 8, 9]])" - ] - }, - "metadata": {}, - "execution_count": 48 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked = torch.stack([x, x, x, x], dim = 1)\n", - "x_stacked" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "jgCeJcaud_-1", - "outputId": "7f293a37-6ef1-43b6-aee5-9d6d91c94f9e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 1, 1, 1],\n", - " [2, 2, 2, 2],\n", - " [3, 3, 3, 3],\n", - " [4, 4, 4, 4],\n", - " [5, 5, 5, 5],\n", - " [6, 6, 6, 6],\n", - " [7, 7, 7, 7],\n", - " [8, 8, 8, 8],\n", - " [9, 9, 9, 9]])" - ] - }, - "metadata": {}, - "execution_count": 49 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.squeeze()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XhJHIK6cfPse", - "outputId": "06c47b89-3a9e-453e-bcc3-00cbcb0b8b49" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 1, 1, 1],\n", - " [2, 2, 2, 2],\n", - " [3, 3, 3, 3],\n", - " [4, 4, 4, 4],\n", - " [5, 5, 5, 5],\n", - " [6, 6, 6, 6],\n", - " [7, 7, 7, 7],\n", - " [8, 8, 8, 8],\n", - " [9, 9, 9, 9]])" - ] - }, - "metadata": {}, - "execution_count": 50 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.unsqueeze(dim=1)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ej2c3Xxzf0tq", - "outputId": "94024061-eb37-446d-c4a8-e4d16cb6de81" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[1, 1, 1, 1]],\n", - "\n", - " [[2, 2, 2, 2]],\n", - "\n", - " [[3, 3, 3, 3]],\n", - "\n", - " [[4, 4, 4, 4]],\n", - "\n", - " [[5, 5, 5, 5]],\n", - "\n", - " [[6, 6, 6, 6]],\n", - "\n", - " [[7, 7, 7, 7]],\n", - "\n", - " [[8, 8, 8, 8]],\n", - "\n", - " [[9, 9, 9, 9]]])" - ] - }, - "metadata": {}, - "execution_count": 52 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.squeeze()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "4DJYo1a0f5M0", - "outputId": "efca2b47-1b14-44de-9a9a-2c83629d153f" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 1, 1, 1],\n", - " [2, 2, 2, 2],\n", - " [3, 3, 3, 3],\n", - " [4, 4, 4, 4],\n", - " [5, 5, 5, 5],\n", - " [6, 6, 6, 6],\n", - " [7, 7, 7, 7],\n", - " [8, 8, 8, 8],\n", - " [9, 9, 9, 9]])" - ] - }, - "metadata": {}, - "execution_count": 53 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.unsqueeze(dim=-2)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "J4iEjn2ah2HL", - "outputId": "22395593-7c16-4162-beae-dd2bbe7bda35" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[1, 1, 1, 1]],\n", - "\n", - " [[2, 2, 2, 2]],\n", - "\n", - " [[3, 3, 3, 3]],\n", - "\n", - " [[4, 4, 4, 4]],\n", - "\n", - " [[5, 5, 5, 5]],\n", - "\n", - " [[6, 6, 6, 6]],\n", - "\n", - " [[7, 7, 7, 7]],\n", - "\n", - " [[8, 8, 8, 8]],\n", - "\n", - " [[9, 9, 9, 9]]])" - ] - }, - "metadata": {}, - "execution_count": 55 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "tensor = torch.tensor([1, 2, 3])\n", - "tensor = tensor - 10\n", - "tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cFfiD7Nth7Z_", - "outputId": "1139e1f8-fc1a-46ca-d636-f2bc4fd2eef6" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-9, -8, -7])" - ] - }, - "metadata": {}, - "execution_count": 7 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.mul(tensor, 10)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "dyA7BM_GHhqE", - "outputId": "0e3b9671-d9e8-4a32-87bb-59bc05986142" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-90, -80, -70])" - ] - }, - "metadata": {}, - "execution_count": 9 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.sub(tensor, 100)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "owtUsZ1KNegI", - "outputId": "189b7b23-0041-4e09-b991-cd209a48506a" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-109, -108, -107])" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.add(tensor, 100)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "K5STXlQONsyc", - "outputId": "00cbb79a-0a1d-4e21-86ec-5c91c37a2d01" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([91, 92, 93])" - ] - }, - "metadata": {}, - "execution_count": 11 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.divide(tensor, 2)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xqMGnzIUNvp0", - "outputId": "c894cf3e-f148-45f8-cfc8-d78740735306" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-4.5000, -4.0000, -3.5000])" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.matmul(tensor, tensor)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ruGzKpV8NyBc", - "outputId": "fddb63bf-006f-48b6-ae28-287fbcda8bc5" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 15 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor@tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "8GS3r9yTeGfD", - "outputId": "c80b12ac-30b5-4f3d-c38c-9e41ba511b0e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 16 - } - ] - }, - { - "cell_type": "code", - "source": [ - "%%time\n", - "tensor@tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "QmuYHqXTemC0", - "outputId": "402fe3ba-70b5-4bb2-c83b-254db84ff810" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "CPU times: user 622 µs, sys: 0 ns, total: 622 µs\n", - "Wall time: 516 µs\n" - ] - }, - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 17 - } - ] - }, - { - "cell_type": "code", - "source": [ - "%%time\n", - "torch.matmul(tensor,tensor)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "dGr1fzdNepd8", - "outputId": "97bd6c91-bc25-4b38-cdf5-f22dcdef243e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "CPU times: user 424 µs, sys: 998 µs, total: 1.42 ms\n", - "Wall time: 1.43 ms\n" - ] - }, - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.rand(3,2)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "pGYDoK2gevfo", - "outputId": "2c8783d5-0453-47c5-c7ed-af10d25d6989" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.5999, 0.0073],\n", - " [0.9321, 0.3026],\n", - " [0.3463, 0.3872]])" - ] - }, - "metadata": {}, - "execution_count": 20 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.matmul(torch.rand(3,2), torch.rand(2,3))" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "KGBGQoB8e2DP", - "outputId": "4c2ef361-a2d0-41ee-c328-3992cbbc138d" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.3528, 0.1893, 0.0714],\n", - " [1.2791, 0.7110, 0.2563],\n", - " [0.8812, 0.4553, 0.1803]])" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch" - ], - "metadata": { - "id": "ib8DMtkBe_LJ" - }, - "execution_count": 1, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x = torch.rand(2,9)" - ], - "metadata": { - "id": "nJo8ZBdrQY1b" - }, - "execution_count": 2, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "wi6oRv4MQfgf", - "outputId": "55c99f55-31f6-4cf5-ba4e-19a47c3a0167" - }, - "execution_count": 3, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.5894, 0.4391, 0.2018, 0.5417, 0.3844, 0.3592, 0.9209, 0.9269, 0.0681],\n", - " [0.0746, 0.1740, 0.6821, 0.6890, 0.0999, 0.7444, 0.2391, 0.4625, 0.8302]])" - ] - }, - "metadata": {}, - "execution_count": 3 - } - ] - }, - { - "cell_type": "code", - "source": [ - "y=torch.randn(2,3,5)\n", - "y" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Zpx8myAUQgoc", - "outputId": "07756d70-56bd-437c-c74e-9aecc1a77311" - }, - "execution_count": 5, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[ 1.5552, -0.4877, 0.5175, -1.7958, -0.6187],\n", - " [-0.3359, -1.9710, 0.0112, -1.7578, -1.5295],\n", - " [ 0.0932, 1.4079, 0.9108, 0.3328, -0.6978]],\n", - "\n", - " [[-0.9406, -1.0809, -0.2595, 0.1282, 1.6605],\n", - " [ 1.1624, 1.0902, 1.7092, -0.2842, -1.3780],\n", - " [-0.1534, -1.2795, -0.5495, 0.9902, 0.1822]]])" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_original = torch.rand(size=(224,224,3))\n", - "x_original" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "s4U-X9bJQnWe", - "outputId": "657a7a76-962c-4b41-a76b-902d0482266c" - }, - "execution_count": 6, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[0.4549, 0.6809, 0.2118],\n", - " [0.4824, 0.9008, 0.8741],\n", - " [0.1715, 0.1757, 0.1845],\n", - " ...,\n", - " [0.8741, 0.6594, 0.2610],\n", - " [0.0092, 0.1984, 0.1955],\n", - " [0.4236, 0.4182, 0.0251]],\n", - "\n", - " [[0.9174, 0.1661, 0.5852],\n", - " [0.1837, 0.2351, 0.3810],\n", - " [0.3726, 0.4808, 0.8732],\n", - " ...,\n", - " [0.6794, 0.0554, 0.9202],\n", - " [0.0864, 0.8750, 0.3558],\n", - " [0.8445, 0.9759, 0.4934]],\n", - "\n", - " [[0.1600, 0.2635, 0.7194],\n", - " [0.9488, 0.3405, 0.3647],\n", - " [0.6683, 0.5168, 0.9592],\n", - " ...,\n", - " [0.0521, 0.0140, 0.2445],\n", - " [0.3596, 0.3999, 0.2730],\n", - " [0.5926, 0.9877, 0.7784]],\n", - "\n", - " ...,\n", - "\n", - " [[0.4794, 0.5635, 0.3764],\n", - " [0.9124, 0.6094, 0.5059],\n", - " [0.4528, 0.4447, 0.5021],\n", - " ...,\n", - " [0.0089, 0.4816, 0.8727],\n", - " [0.2173, 0.6296, 0.2347],\n", - " [0.2028, 0.9931, 0.7201]],\n", - "\n", - " [[0.3116, 0.6459, 0.4703],\n", - " [0.0148, 0.2345, 0.7149],\n", - " [0.8393, 0.5804, 0.6691],\n", - " ...,\n", - " [0.2105, 0.9460, 0.2696],\n", - " [0.5918, 0.9295, 0.2616],\n", - " [0.2537, 0.7819, 0.4700]],\n", - "\n", - " [[0.6654, 0.1200, 0.5841],\n", - " [0.9147, 0.5522, 0.6529],\n", - " [0.1799, 0.5276, 0.5415],\n", - " ...,\n", - " [0.7536, 0.4346, 0.8793],\n", - " [0.3793, 0.1750, 0.7792],\n", - " [0.9266, 0.8325, 0.9974]]])" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_permuted=x_original.permute(2, 0, 1)\n", - "print(x_original.shape)\n", - "print(x_permuted.shape)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "DD19_zvbQzHo", - "outputId": "1d64ce1b-eb48-47e3-90b6-7f1340e7f2b2" - }, - "execution_count": 9, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "torch.Size([224, 224, 3])\n", - "torch.Size([3, 224, 224])\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_original[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "NnPmMk4ZRF7w", - "outputId": "2cd5da7f-4a23-4a76-8c4a-bb982113f2a4" - }, - "execution_count": 10, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.4549)" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_permuted[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Z0ylNoAARgTo", - "outputId": "ddca0298-cddf-4048-9b71-a791655e5bed" - }, - "execution_count": 11, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.4549)" - ] - }, - "metadata": {}, - "execution_count": 11 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_original[0,0,0]=0.989" - ], - "metadata": { - "id": "RXw0xXsDRi4L" - }, - "execution_count": 13, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x_original[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "1sFdV6wzRo3f", - "outputId": "1cf87d2c-6d88-453a-d136-0f625a2800f1" - }, - "execution_count": 14, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.9890)" - ] - }, - "metadata": {}, - "execution_count": 14 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_permuted[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xTX-hx2SR1wp", - "outputId": "0d4908c4-c3bc-44e3-8ec6-1487104cc209" - }, - "execution_count": 15, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.9890)" - ] - }, - "metadata": {}, - "execution_count": 15 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x=torch.arange(1,10).reshape(1,3,3)\n", - "x, x.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "mZomOe7gR4Q8", - "outputId": "0b3c922f-ec11-46de-b8a5-9f9533d866ad" - }, - "execution_count": 18, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(tensor([[[1, 2, 3],\n", - " [4, 5, 6],\n", - " [7, 8, 9]]]),\n", - " torch.Size([1, 3, 3]))" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "3y7v4SQvSBs1", - "outputId": "8c53307d-e628-404d-db66-56c6bdffab7c" - }, - "execution_count": 19, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 2, 3],\n", - " [4, 5, 6],\n", - " [7, 8, 9]])" - ] - }, - "metadata": {}, - "execution_count": 19 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0][0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "hf9uG4xLSNya", - "outputId": "3075bc42-9ffa-426b-8a86-95628ffcd824" - }, - "execution_count": 21, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1, 2, 3])" - ] - }, - "metadata": {}, - "execution_count": 21 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0][0][0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "zA4G2Se4SRB3", - "outputId": "324312d2-ed0a-49eb-f81f-e904e53992fe" - }, - "execution_count": 22, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(1)" - ] - }, - "metadata": {}, - "execution_count": 22 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0][2][2]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Mwy3zmKKSdbk", - "outputId": "d35172c3-b099-40a6-ddf1-a453c2adfa44" - }, - "execution_count": 23, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(9)" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[:,1,1]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "fE3nCM1KS7XT", - "outputId": "01f5d755-9737-4235-9f73-dce89ff6ba16" - }, - "execution_count": 24, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([5])" - ] - }, - "metadata": {}, - "execution_count": 24 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0,0,:]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "luNDINKNTTxp", - "outputId": "091195ef-2f71-4602-e95f-529a69193150" - }, - "execution_count": 25, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1, 2, 3])" - ] - }, - "metadata": {}, - "execution_count": 25 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0,:,2]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "KG8A4xbfThCL", - "outputId": "5866bc41-9241-4619-be7b-e9206b3f80ab" - }, - "execution_count": 26, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([3, 6, 9])" - ] - }, - "metadata": {}, - "execution_count": 26 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import numpy as np" - ], - "metadata": { - "id": "CZ3PX0qlTwHJ" - }, - "execution_count": 27, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "array = np.arange(1.0, 8.0)" - ], - "metadata": { - "id": "UOBeTumiT3Lf" - }, - "execution_count": 28, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "array" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "RzcO32E9UCQl", - "outputId": "430def24-c42c-461f-e5e7-398544c695d3" - }, - "execution_count": 29, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array([1., 2., 3., 4., 5., 6., 7.])" - ] - }, - "metadata": {}, - "execution_count": 29 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor = torch.from_numpy(array)\n", - "tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "JJIL0q1DUC6O", - "outputId": "8a3b1d7c-4482-4d32-f34f-9212d9d3a177" - }, - "execution_count": 32, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1., 2., 3., 4., 5., 6., 7.], dtype=torch.float64)" - ] - }, - "metadata": {}, - "execution_count": 32 - } - ] - }, - { - "cell_type": "code", - "source": [ - "array[3]=11.0" - ], - "metadata": { - "id": "j3Ce6q3DUIEK" - }, - "execution_count": 33, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "array" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "dc_BCVdjUsCc", - "outputId": "65537325-8b11-4f36-fc73-e56f30d6a036" - }, - "execution_count": 34, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array([ 1., 2., 3., 11., 5., 6., 7.])" - ] - }, - "metadata": {}, - "execution_count": 34 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "VG1e_eITUta2", - "outputId": "a26c5198-23b6-4a6d-d73a-ba20cd9782b8" - }, - "execution_count": 35, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 1., 2., 3., 11., 5., 6., 7.], dtype=torch.float64)" - ] - }, - "metadata": {}, - "execution_count": 35 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor = torch.ones(7)\n", - "tensor, tensor.dtype\n", - "numpy_tensor = tensor.numpy()\n", - "numpy_tensor, numpy_tensor.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Swt8JF8vUuev", - "outputId": "c9e5bf6a-6d2c-41d6-8327-366867ffdd2d" - }, - "execution_count": 37, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(array([1., 1., 1., 1., 1., 1., 1.], dtype=float32), dtype('float32'))" - ] - }, - "metadata": {}, - "execution_count": 37 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "random_tensor_A = torch.rand(3,4)\n", - "random_tensor_B = torch.rand(3,4)\n", - "print(random_tensor_A)\n", - "print(random_tensor_B)\n", - "print(random_tensor_A == random_tensor_B)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "uGcagTteVFTD", - "outputId": "49405790-08e7-4210-b7f1-f00b904c7eb9" - }, - "execution_count": 38, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "tensor([[0.9870, 0.6636, 0.6873, 0.8863],\n", - " [0.8386, 0.4169, 0.3587, 0.0265],\n", - " [0.2981, 0.6025, 0.5652, 0.5840]])\n", - "tensor([[0.9821, 0.3481, 0.0913, 0.4940],\n", - " [0.7495, 0.4387, 0.9582, 0.8659],\n", - " [0.5064, 0.6919, 0.0809, 0.9771]])\n", - "tensor([[False, False, False, False],\n", - " [False, False, False, False],\n", - " [False, False, False, False]])\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "RANDOM_SEED = 42\n", - "torch.manual_seed(RANDOM_SEED)\n", - "random_tensor_C = torch.rand(3,4)\n", - "torch.manual_seed(RANDOM_SEED)\n", - "random_tensor_D = torch.rand(3,4)\n", - "print(random_tensor_C)\n", - "print(random_tensor_D)\n", - "print(random_tensor_C == random_tensor_D)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "HznyXyEaWjLM", - "outputId": "25956434-01b6-4059-9054-c9978884ddc1" - }, - "execution_count": 46, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "tensor([[0.8823, 0.9150, 0.3829, 0.9593],\n", - " [0.3904, 0.6009, 0.2566, 0.7936],\n", - " [0.9408, 0.1332, 0.9346, 0.5936]])\n", - "tensor([[0.8823, 0.9150, 0.3829, 0.9593],\n", - " [0.3904, 0.6009, 0.2566, 0.7936],\n", - " [0.9408, 0.1332, 0.9346, 0.5936]])\n", - "tensor([[True, True, True, True],\n", - " [True, True, True, True],\n", - " [True, True, True, True]])\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "!nvidia-smi" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "vltPTh0YXJSt", - "outputId": "807af6dc-a9ca-4301-ec32-b688dbde8be8" - }, - "execution_count": 2, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Thu May 23 02:57:59 2024 \n", - "+---------------------------------------------------------------------------------------+\n", - "| NVIDIA-SMI 535.104.05 Driver Version: 535.104.05 CUDA Version: 12.2 |\n", - "|-----------------------------------------+----------------------+----------------------+\n", - "| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |\n", - "| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |\n", - "| | | MIG M. |\n", - "|=========================================+======================+======================|\n", - "| 0 Tesla T4 Off | 00000000:00:04.0 Off | 0 |\n", - "| N/A 60C P8 11W / 70W | 0MiB / 15360MiB | 0% Default |\n", - "| | | N/A |\n", - "+-----------------------------------------+----------------------+----------------------+\n", - " \n", - "+---------------------------------------------------------------------------------------+\n", - "| Processes: |\n", - "| GPU GI CI PID Type Process name GPU Memory |\n", - "| ID ID Usage |\n", - "|=======================================================================================|\n", - "| No running processes found |\n", - "+---------------------------------------------------------------------------------------+\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "torch.cuda.is_available()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "L6mMyPDyYh1j", - "outputId": "279c5dd8-c2a8-4fbd-f321-2f5d7c6e90e6" - }, - "execution_count": 3, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "True" - ] - }, - "metadata": {}, - "execution_count": 3 - } - ] - }, - { - "cell_type": "code", - "source": [ - "device = \"cuda\" if torch.cuda.is_available() else \"cpu\"\n", - "device" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 35 - }, - "id": "oOdiYa7ZYytx", - "outputId": "d73b04fc-8963-4826-9722-08d118d5ab91" - }, - "execution_count": 5, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "'cuda'" - ], - "application/vnd.google.colaboratory.intrinsic+json": { - "type": "string" - } - }, - "metadata": {}, - "execution_count": 5 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.cuda.device_count()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "vOdsazLqZFM5", - "outputId": "8189cd6a-9017-4663-a652-3e15c517d9c3" - }, - "execution_count": 6, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "1" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor = torch.tensor([1,2,3], device = \"cpu\")\n", - "print(tensor, tensor.device)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cdik9Vw3ZMv0", - "outputId": "044a68fd-83a1-409d-8e3b-655142ca0270" - }, - "execution_count": 7, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "tensor([1, 2, 3]) cpu\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor_on_gpu = tensor.to(device)\n", - "tensor_on_gpu" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Zmp835rrZp-z", - "outputId": "37fa3413-18a3-47bf-ae51-5b36ff85a3ef" - }, - "execution_count": 8, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1, 2, 3], device='cuda:0')" - ] - }, - "metadata": {}, - "execution_count": 8 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor_on_gpu.numpy()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 159 - }, - "id": "jhriaa8uZ1yM", - "outputId": "bc5a3226-1a12-4fea-8769-a44f21cdc323" - }, - "execution_count": 10, - "outputs": [ - { - "output_type": "error", - "ename": "TypeError", - "evalue": "can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first.", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mTypeError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mtensor_on_gpu\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mnumpy\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", - "\u001b[0;31mTypeError\u001b[0m: can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first." - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor_on_cpu = tensor_on_gpu.cpu().numpy()" - ], - "metadata": { - "id": "LHGXK3GgaOzL" - }, - "execution_count": 12, - "outputs": [] - }, - { - "cell_type": "code", - "source": [], - "metadata": { - "id": "j-El4LlCajfq" - }, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/br/README.md b/translations/br/README.md deleted file mode 100644 index 0640d7881..000000000 --- a/translations/br/README.md +++ /dev/null @@ -1,232 +0,0 @@ - -[![GitHub license](https://img.shields.io/github/license/microsoft/ML-For-Beginners.svg)](https://github.com/microsoft/ML-For-Beginners/blob/master/LICENSE) -[![GitHub contributors](https://img.shields.io/github/contributors/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/graphs/contributors/) -[![GitHub issues](https://img.shields.io/github/issues/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/issues/) -[![GitHub pull-requests](https://img.shields.io/github/issues-pr/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/pulls/) -[![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com) - -[![GitHub watchers](https://img.shields.io/github/watchers/microsoft/ML-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/ML-For-Beginners/watchers/) -[![GitHub forks](https://img.shields.io/github/forks/microsoft/ML-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/ML-For-Beginners/network/) -[![GitHub stars](https://img.shields.io/github/stars/microsoft/ML-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/ML-For-Beginners/stargazers/) - -### 🌐 Suporte Multilíngue - -#### Suportado via GitHub Action (Automatizado e Sempre Atualizado) - - -[Árabe](../ar/README.md) | [Bengali](../bn/README.md) | [Búlgaro](../bg/README.md) | [Birmanês (Myanmar)](../my/README.md) | [Chinês (Simplificado)](../zh/README.md) | [Chinês (Tradicional, Hong Kong)](../hk/README.md) | [Chinês (Tradicional, Macau)](../mo/README.md) | [Chinês (Tradicional, Taiwan)](../tw/README.md) | [Croata](../hr/README.md) | [Tcheco](../cs/README.md) | [Dinamarquês](../da/README.md) | [Holandês](../nl/README.md) | [Estoniano](../et/README.md) | [Finlandês](../fi/README.md) | [Francês](../fr/README.md) | [Alemão](../de/README.md) | [Grego](../el/README.md) | [Hebraico](../he/README.md) | [Hindi](../hi/README.md) | [Húngaro](../hu/README.md) | [Indonésio](../id/README.md) | [Italiano](../it/README.md) | [Japonês](../ja/README.md) | [Kannada](../kn/README.md) | [Coreano](../ko/README.md) | [Lituano](../lt/README.md) | [Malaio](../ms/README.md) | [Malaiala](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Pidgin Nigeriano](../pcm/README.md) | [Norueguês](../no/README.md) | [Persa (Farsi)](../fa/README.md) | [Polonês](../pl/README.md) | [Português (Brasil)](./README.md) | [Português (Portugal)](../pt/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romeno](../ro/README.md) | [Russo](../ru/README.md) | [Sérvio (Cirílico)](../sr/README.md) | [Eslovaco](../sk/README.md) | [Esloveno](../sl/README.md) | [Espanhol](../es/README.md) | [Suaíli](../sw/README.md) | [Sueco](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tâmil](../ta/README.md) | [Telugo](../te/README.md) | [Tailandês](../th/README.md) | [Turco](../tr/README.md) | [Ucraniano](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamita](../vi/README.md) - -> **Prefere Clonar Localmente?** - -> Este repositório inclui mais de 50 traduções de idiomas, o que aumenta significativamente o tamanho do download. Para clonar sem as traduções, use o sparse checkout: -> ```bash -> git clone --filter=blob:none --sparse https://github.com/microsoft/ML-For-Beginners.git -> cd ML-For-Beginners -> git sparse-checkout set --no-cone '/*' '!translations' '!translated_images' -> ``` -> Isso oferece tudo que você precisa para completar o curso com um download muito mais rápido. - - -#### Junte-se à Nossa Comunidade - -[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) - -Estamos realizando uma série de aprendizado com IA no Discord, saiba mais e junte-se a nós em [Learn with AI Series](https://aka.ms/learnwithai/discord) de 18 a 30 de setembro de 2025. Você receberá dicas e truques para usar o GitHub Copilot para Ciência de Dados. - -![Learn with AI series](../../../../translated_images/pt-BR/3.9b58fd8d6c373c20.webp) - -# Machine Learning para Iniciantes - Um Currículo - -> 🌍 Viaje pelo mundo enquanto exploramos Machine Learning por meio das culturas do mundo 🌍 - -Os Cloud Advocates da Microsoft têm o prazer de oferecer um currículo de 12 semanas e 26 lições inteiramente sobre **Machine Learning**. Neste currículo, você aprenderá sobre o que às vezes é chamado de **machine learning clássico**, usando principalmente a biblioteca Scikit-learn e evitando deep learning, que é abordado em nosso currículo [AI for Beginners](https://aka.ms/ai4beginners). Combine essas lições também com nosso currículo ['Data Science for Beginners'](https://aka.ms/ds4beginners). - -Viaje conosco pelo mundo enquanto aplicamos essas técnicas clássicas em dados de diversas regiões. Cada lição inclui quizzes antes e depois da aula, instruções escritas para completar a lição, uma solução, uma tarefa e muito mais. Nossa pedagogia baseada em projetos permite que você aprenda enquanto constrói, uma maneira comprovada de fixar novas habilidades. - -**✍️ Agradecimentos calorosos aos nossos autores** Jen Looper, Stephen Howell, Francesca Lazzeri, Tomomi Imura, Cassie Breviu, Dmitry Soshnikov, Chris Noring, Anirban Mukherjee, Ornella Altunyan, Ruth Yakubu e Amy Boyd - -**🎨 Agradecimentos também aos nossos ilustradores** Tomomi Imura, Dasani Madipalli e Jen Looper - -**🙏 Agradecimentos especiais 🙏 aos nossos autores, revisores e colaboradores de conteúdo do Microsoft Student Ambassador**, notavelmente Rishit Dagli, Muhammad Sakib Khan Inan, Rohan Raj, Alexandru Petrescu, Abhishek Jaiswal, Nawrin Tabassum, Ioan Samuila e Snigdha Agarwal - -**🤩 Gratidão extra aos Microsoft Student Ambassadors Eric Wanjau, Jasleen Sondhi e Vidushi Gupta pelas lições em R!** - -# Começando - -Siga estes passos: -1. **Faça um Fork do Repositório**: Clique no botão "Fork" no canto superior direito desta página. -2. **Clone o Repositório**: `git clone https://github.com/microsoft/ML-For-Beginners.git` - -> [Encontre todos os recursos adicionais para este curso em nossa coleção Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) - -> 🔧 **Precisa de ajuda?** Consulte nosso [Guia de Solução de Problemas](TROUBLESHOOTING.md) para soluções comuns relacionadas a instalação, configuração e execução das lições. - - -**[Estudantes](https://aka.ms/student-page)**, para usar este currículo, faça o fork do repositório inteiro para sua própria conta GitHub e complete os exercícios sozinho ou em grupo: - -- Comece com um quiz pré-aula. -- Leia a aula e complete as atividades, pausando e refletindo a cada verificação de conhecimento. -- Tente criar os projetos compreendendo as lições ao invés de apenas rodar o código da solução; contudo, esse código está disponível nas pastas `/solution` de cada lição orientada a projeto. -- Faça o quiz pós-aula. -- Complete o desafio. -- Complete a tarefa. -- Após concluir um grupo de lições, visite o [Fórum de Discussão](https://github.com/microsoft/ML-For-Beginners/discussions) e "aprenda em voz alta" preenchendo o formulário PAT apropriado. PAT é uma Ferramenta de Avaliação de Progresso que você preenche para aprofundar seu aprendizado. Você também pode reagir a outros PATs para aprendermos juntos. - -> Para estudo adicional, recomendamos seguir estes módulos e trilhas de aprendizado do [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott). - -**Professores**, incluímos algumas [sugestões](for-teachers.md) sobre como usar este currículo. - ---- - -## Vídeos explicativos - -Algumas das lições estão disponíveis em vídeos curtos. Você pode encontrar todos eles incorporados nas lições, ou na [playlist ML for Beginners no canal Microsoft Developer do YouTube](https://aka.ms/ml-beginners-videos) clicando na imagem abaixo. - -[![ML for beginners banner](../../../../translated_images/pt-BR/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) - ---- - -## Conheça a Equipe - -[![Promo video](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) - -**Gif por** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) - -> 🎥 Clique na imagem acima para assistir a um vídeo sobre o projeto e as pessoas que o criaram! - ---- - -## Pedagogia - -Escolhemos dois princípios pedagógicos ao construir este currículo: garantir que ele seja prático e **baseado em projetos** e que inclua **quizzes frequentes**. Além disso, este currículo tem um **tema** comum para dar coesão. - -Ao garantir que o conteúdo esteja alinhado com projetos, o processo fica mais envolvente para os estudantes e a retenção dos conceitos será aumentada. Além disso, um quiz de baixo risco antes da aula orienta a intenção do aluno durante o aprendizado, enquanto um segundo quiz após a aula garante maior retenção. Este currículo foi elaborado para ser flexível e divertido, podendo ser feito completo ou parcialmente. Os projetos começam pequenos e tornam-se progressivamente mais complexos até o final do ciclo de 12 semanas. Este currículo também inclui um posfácio sobre aplicações reais de ML, que pode ser usado como crédito extra ou como base para discussões. - -> Consulte nosso [Código de Conduta](CODE_OF_CONDUCT.md), [Contribuindo](CONTRIBUTING.md), [Tradução](TRANSLATIONS.md) e [Resolução de Problemas](TROUBLESHOOTING.md). Aguardamos seu feedback construtivo! - -## Cada lição inclui - -- sketchnote opcional -- vídeo suplementar opcional -- vídeo explicativo (apenas algumas lições) -- [quiz aquecimento pré-aula](https://ff-quizzes.netlify.app/en/ml/) -- lição escrita -- para lições baseadas em projeto, guias passo a passo de como construir o projeto -- verificações de conhecimento -- um desafio -- leitura suplementar -- tarefa -- [quiz pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -> **Uma nota sobre idiomas**: Essas lições são principalmente escritas em Python, mas muitas também estão disponíveis em R. Para completar uma lição em R, acesse a pasta `/solution` e procure as lições em R. Elas incluem a extensão .rmd que representa um arquivo **R Markdown**, que pode ser simplesmente definido como a incorporação de `blocos de código` (de R ou outras linguagens) e um `cabeçalho YAML` (que orienta como formatar saídas, como PDF) em um `documento Markdown`. Como tal, serve como um framework exemplar para autoria em ciência de dados, pois permite combinar seu código, sua saída e seus pensamentos, ao possibilitar que você os escreva em Markdown. Além disso, documentos R Markdown podem ser renderizados em formatos de saída como PDF, HTML ou Word. -> **Uma nota sobre quizzes**: Todos os quizzes estão contidos na [pasta Quiz App](../../quiz-app), com um total de 52 quizzes de três perguntas cada. Eles são vinculados dentro das lições, mas o aplicativo de quiz pode ser executado localmente; siga as instruções na pasta `quiz-app` para hospedar localmente ou implantar no Azure. - -| Número da Aula | Tópico | Agrupamento da Aula | Objetivos de Aprendizagem | Aula Vinculada | Autor | -| :------------: | :------------------------------------------------------------: | :-------------------------------------------------: | ------------------------------------------------------------------------------------------------------------------------------- | :--------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------: | -| 01 | Introdução ao aprendizado de máquina | [Introdução](1-Introduction/README.md) | Aprenda os conceitos básicos por trás do aprendizado de máquina | [Aula](1-Introduction/1-intro-to-ML/README.md) | Muhammad | -| 02 | A História do aprendizado de máquina | [Introdução](1-Introduction/README.md) | Aprenda a história por trás desta área | [Aula](1-Introduction/2-history-of-ML/README.md) | Jen e Amy | -| 03 | Justiça e aprendizado de máquina | [Introdução](1-Introduction/README.md) | Quais são as questões filosóficas importantes sobre justiça que estudantes devem considerar ao construir e aplicar modelos de ML? | [Aula](1-Introduction/3-fairness/README.md) | Tomomi | -| 04 | Técnicas para aprendizado de máquina | [Introdução](1-Introduction/README.md) | Quais técnicas os pesquisadores de ML usam para construir modelos de ML? | [Aula](1-Introduction/4-techniques-of-ML/README.md) | Chris e Jen | -| 05 | Introdução à regressão | [Regressão](2-Regression/README.md) | Comece com Python e Scikit-learn para modelos de regressão | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Jen • Eric Wanjau | -| 06 | Preços de abóboras na América do Norte 🎃 | [Regressão](2-Regression/README.md) | Visualize e limpe dados em preparação para ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Jen • Eric Wanjau | -| 07 | Preços de abóboras na América do Norte 🎃 | [Regressão](2-Regression/README.md) | Construa modelos de regressão linear e polinomial | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Jen e Dmitry • Eric Wanjau | -| 08 | Preços de abóboras na América do Norte 🎃 | [Regressão](2-Regression/README.md) | Construa um modelo de regressão logística | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Jen • Eric Wanjau | -| 09 | Um App Web 🔌 | [App Web](3-Web-App/README.md) | Construa um app web para usar seu modelo treinado | [Python](3-Web-App/1-Web-App/README.md) | Jen | -| 10 | Introdução à classificação | [Classificação](4-Classification/README.md) | Limpe, prepare e visualize seus dados; introdução à classificação | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Jen e Cassie • Eric Wanjau | -| 11 | Culinárias deliciosas asiáticas e indianas 🍜 | [Classificação](4-Classification/README.md) | Introdução a classificadores | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Jen e Cassie • Eric Wanjau | -| 12 | Culinárias deliciosas asiáticas e indianas 🍜 | [Classificação](4-Classification/README.md) | Mais classificadores | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Jen e Cassie • Eric Wanjau | -| 13 | Culinárias deliciosas asiáticas e indianas 🍜 | [Classificação](4-Classification/README.md) | Construa um app web recomendador usando seu modelo | [Python](4-Classification/4-Applied/README.md) | Jen | -| 14 | Introdução ao clustering | [Clustering](5-Clustering/README.md) | Limpe, prepare e visualize seus dados; introdução ao clustering | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Jen • Eric Wanjau | -| 15 | Explorando gostos musicais nigerianos 🎧 | [Clustering](5-Clustering/README.md) | Explore o método de agrupamento K-Means | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Jen • Eric Wanjau | -| 16 | Introdução ao processamento de linguagem natural ☕️ | [Processamento de linguagem natural](6-NLP/README.md) | Aprenda o básico sobre PLN construindo um bot simples | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Stephen | -| 17 | Tarefas comuns de PLN ☕️ | [Processamento de linguagem natural](6-NLP/README.md) | Aprofunde seu conhecimento em PLN entendendo tarefas comuns necessárias ao lidar com estruturas linguísticas | [Python](6-NLP/2-Tasks/README.md) | Stephen | -| 18 | Tradução e análise de sentimento ♥️ | [Processamento de linguagem natural](6-NLP/README.md) | Tradução e análise de sentimento com Jane Austen | [Python](6-NLP/3-Translation-Sentiment/README.md) | Stephen | -| 19 | Hotéis românticos da Europa ♥️ | [Processamento de linguagem natural](6-NLP/README.md) | Análise de sentimento com avaliações de hotéis 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Stephen | -| 20 | Hotéis românticos da Europa ♥️ | [Processamento de linguagem natural](6-NLP/README.md) | Análise de sentimento com avaliações de hotéis 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Stephen | -| 21 | Introdução à previsão de séries temporais | [Séries temporais](7-TimeSeries/README.md) | Introdução à previsão de séries temporais | [Python](7-TimeSeries/1-Introduction/README.md) | Francesca | -| 22 | ⚡️ Consumo mundial de energia ⚡️ - previsão com ARIMA | [Séries temporais](7-TimeSeries/README.md) | Previsão de séries temporais com ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Francesca | -| 23 | ⚡️ Consumo mundial de energia ⚡️ - previsão com SVR | [Séries temporais](7-TimeSeries/README.md) | Previsão de séries temporais com Support Vector Regressor | [Python](7-TimeSeries/3-SVR/README.md) | Anirban | -| 24 | Introdução ao aprendizado por reforço | [Aprendizado por reforço](8-Reinforcement/README.md) | Introdução ao aprendizado por reforço com Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Dmitry | -| 25 | Ajude Peter a evitar o lobo! 🐺 | [Aprendizado por reforço](8-Reinforcement/README.md) | Aprendizado por reforço com Gym | [Python](8-Reinforcement/2-Gym/README.md) | Dmitry | -| Pós-escrito | Cenários e aplicações reais de ML | [ML na prática](9-Real-World/README.md) | Aplicações reais interessantes e reveladoras de ML clássico | [Aula](9-Real-World/1-Applications/README.md) | Equipe | -| Pós-escrito | Depuração de modelos em ML usando painel RAI | [ML na prática](9-Real-World/README.md) | Depuração de modelos em Machine Learning usando componentes do painel Responsible AI | [Aula](9-Real-World/2-Debugging-ML-Models/README.md) | Ruth Yakubu | - -> [encontre todos os recursos adicionais para este curso em nossa coleção Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) - -## Acesso offline - -Você pode executar esta documentação offline usando [Docsify](https://docsify.js.org/#/). Faça um fork deste repositório, [instale o Docsify](https://docsify.js.org/#/quickstart) em sua máquina local e então, na pasta raiz deste repositório, digite `docsify serve`. O site será servido na porta 3000 no seu localhost: `localhost:3000`. - -## PDFs - -Encontre um pdf do currículo com links [aqui](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). - - -## 🎒 Outros Cursos - -Nossa equipe produz outros cursos! Confira: - - -### LangChain -[![LangChain4j para Iniciantes](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) -[![LangChain.js para Iniciantes](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) - ---- - -### Azure / Edge / MCP / Agentes -[![AZD para Iniciantes](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) -[![Edge AI para Iniciantes](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) -[![MCP para Iniciantes](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst) -[![Agentes de IA para Iniciantes](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) - ---- - -### Série de IA Generativa -[![IA Generativa para Iniciantes](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) -[![IA Generativa (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) -[![IA Generativa (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) -[![IA Generativa (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) - ---- - -### Aprendizado Principal -[![ML para Iniciantes](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) -[![Ciência de Dados para Iniciantes](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) -[![IA para Iniciantes](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) -[![Cibersegurança para Iniciantes](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) -[![Desenvolvimento Web para Iniciantes](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) -[![IoT para Iniciantes](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) -[![Desenvolvimento XR para Iniciantes](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) - ---- - -### Série Copilot -[![Copilot para Programação em Par com IA](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) -[![Copilot para C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) -[![Aventura Copilot](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) - - -## Obtendo Ajuda - -Se você ficar travado ou tiver alguma dúvida sobre como criar apps de IA, junte-se a outros estudantes e desenvolvedores experientes nas discussões sobre MCP. É uma comunidade acolhedora onde perguntas são bem-vindas e o conhecimento é compartilhado livremente. - -[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) - -Se você tiver feedback sobre o produto ou encontrar erros durante o desenvolvimento, visite: - -[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) - ---- - - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos pela precisão, por favor, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. - \ No newline at end of file diff --git a/translations/br/SECURITY.md b/translations/br/SECURITY.md deleted file mode 100644 index 7e68aac43..000000000 --- a/translations/br/SECURITY.md +++ /dev/null @@ -1,51 +0,0 @@ - -## Segurança - -A Microsoft leva a segurança de seus produtos e serviços de software muito a sério, incluindo todos os repositórios de código-fonte gerenciados por meio de nossas organizações no GitHub, que incluem [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin) e [nossas organizações no GitHub](https://opensource.microsoft.com/). - -Se você acredita ter encontrado uma vulnerabilidade de segurança em qualquer repositório pertencente à Microsoft que atenda à [definição de vulnerabilidade de segurança da Microsoft](https://docs.microsoft.com/previous-versions/tn-archive/cc751383(v=technet.10)?WT.mc_id=academic-77952-leestott), por favor, reporte-a conforme descrito abaixo. - -## Relatando Problemas de Segurança - -**Por favor, não reporte vulnerabilidades de segurança por meio de issues públicas no GitHub.** - -Em vez disso, reporte-as ao Microsoft Security Response Center (MSRC) em [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report). - -Se preferir enviar sem fazer login, envie um e-mail para [secure@microsoft.com](mailto:secure@microsoft.com). Se possível, criptografe sua mensagem com nossa chave PGP; faça o download dela na [página de Chave PGP do Microsoft Security Response Center](https://www.microsoft.com/en-us/msrc/pgp-key-msrc). - -Você deve receber uma resposta dentro de 24 horas. Se, por algum motivo, não receber, entre em contato novamente por e-mail para garantir que sua mensagem original foi recebida. Informações adicionais podem ser encontradas em [microsoft.com/msrc](https://www.microsoft.com/msrc). - -Por favor, inclua as informações solicitadas abaixo (o máximo que puder fornecer) para nos ajudar a entender melhor a natureza e o escopo do possível problema: - - * Tipo de problema (ex.: buffer overflow, SQL injection, cross-site scripting, etc.) - * Caminhos completos dos arquivos de código-fonte relacionados à manifestação do problema - * A localização do código-fonte afetado (tag/branch/commit ou URL direto) - * Qualquer configuração especial necessária para reproduzir o problema - * Instruções passo a passo para reproduzir o problema - * Código de prova de conceito ou exploit (se possível) - * Impacto do problema, incluindo como um atacante poderia explorar o problema - -Essas informações nos ajudarão a priorizar seu relatório mais rapidamente. - -Se você estiver reportando para um programa de recompensa por bugs, relatórios mais completos podem contribuir para um prêmio maior. Por favor, visite nossa página do [Programa de Recompensa por Bugs da Microsoft](https://microsoft.com/msrc/bounty) para mais detalhes sobre nossos programas ativos. - -## Idiomas Preferidos - -Preferimos que todas as comunicações sejam feitas em inglês. - -## Política - -A Microsoft segue o princípio de [Divulgação Coordenada de Vulnerabilidades](https://www.microsoft.com/en-us/msrc/cvd). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/SUPPORT.md b/translations/br/SUPPORT.md deleted file mode 100644 index fcbc06943..000000000 --- a/translations/br/SUPPORT.md +++ /dev/null @@ -1,29 +0,0 @@ - -# Suporte -## Como registrar problemas e obter ajuda - -Antes de registrar um problema, verifique nosso [Guia de Solução de Problemas](TROUBLESHOOTING.md) para encontrar soluções para problemas comuns relacionados à instalação, configuração e execução das lições. - -Este projeto utiliza o GitHub Issues para rastrear bugs e solicitações de recursos. Por favor, pesquise os problemas existentes antes de registrar novos para evitar duplicações. Para novos problemas, registre seu bug ou solicitação de recurso como um novo Issue. - -Para obter ajuda e esclarecer dúvidas sobre o uso deste projeto, você também pode: -- Verificar o [Guia de Solução de Problemas](TROUBLESHOOTING.md) -- Visitar nosso [canal de Discussões no Discord #ml-for-beginners](https://aka.ms/foundry/discord) -- Registrar um problema - -## Política de Suporte da Microsoft - -O suporte para este repositório está limitado aos recursos listados acima. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/TROUBLESHOOTING.md b/translations/br/TROUBLESHOOTING.md deleted file mode 100644 index bff035818..000000000 --- a/translations/br/TROUBLESHOOTING.md +++ /dev/null @@ -1,610 +0,0 @@ - -# Guia de Solução de Problemas - -Este guia ajuda você a resolver problemas comuns ao trabalhar com o currículo de Machine Learning para Iniciantes. Se não encontrar uma solução aqui, consulte nossas [Discussões no Discord](https://aka.ms/foundry/discord) ou [abra uma issue](https://github.com/microsoft/ML-For-Beginners/issues). - -## Índice - -- [Problemas de Instalação](../..) -- [Problemas com Jupyter Notebook](../..) -- [Problemas com Pacotes Python](../..) -- [Problemas com o Ambiente R](../..) -- [Problemas com o Aplicativo de Quiz](../..) -- [Problemas com Dados e Caminhos de Arquivos](../..) -- [Mensagens de Erro Comuns](../..) -- [Problemas de Desempenho](../..) -- [Ambiente e Configuração](../..) - ---- - -## Problemas de Instalação - -### Instalação do Python - -**Problema**: `python: command not found` - -**Solução**: -1. Instale o Python 3.8 ou superior em [python.org](https://www.python.org/downloads/) -2. Verifique a instalação: `python --version` ou `python3 --version` -3. No macOS/Linux, pode ser necessário usar `python3` em vez de `python` - -**Problema**: Múltiplas versões do Python causando conflitos - -**Solução**: -```bash -# Use virtual environments to isolate projects -python -m venv ml-env - -# Activate virtual environment -# On Windows: -ml-env\Scripts\activate -# On macOS/Linux: -source ml-env/bin/activate -``` - -### Instalação do Jupyter - -**Problema**: `jupyter: command not found` - -**Solução**: -```bash -# Install Jupyter -pip install jupyter - -# Or with pip3 -pip3 install jupyter - -# Verify installation -jupyter --version -``` - -**Problema**: O Jupyter não abre no navegador - -**Solução**: -```bash -# Try specifying the browser -jupyter notebook --browser=chrome - -# Or copy the URL with token from terminal and paste in browser manually -# Look for: http://localhost:8888/?token=... -``` - -### Instalação do R - -**Problema**: Pacotes R não instalam - -**Solução**: -```r -# Ensure you have the latest R version -# Install packages with dependencies -install.packages(c("tidyverse", "tidymodels", "caret"), dependencies = TRUE) - -# If compilation fails, try installing binary versions -install.packages("package-name", type = "binary") -``` - -**Problema**: IRkernel não está disponível no Jupyter - -**Solução**: -```r -# In R console -install.packages('IRkernel') -IRkernel::installspec(user = TRUE) -``` - ---- - -## Problemas com Jupyter Notebook - -### Problemas com o Kernel - -**Problema**: Kernel continua morrendo ou reiniciando - -**Solução**: -1. Reinicie o kernel: `Kernel → Restart` -2. Limpe a saída e reinicie: `Kernel → Restart & Clear Output` -3. Verifique problemas de memória (veja [Problemas de Desempenho](../..)) -4. Tente executar as células individualmente para identificar o código problemático - -**Problema**: Kernel Python errado selecionado - -**Solução**: -1. Verifique o kernel atual: `Kernel → Change Kernel` -2. Selecione a versão correta do Python -3. Se o kernel estiver ausente, crie-o: -```bash -python -m ipykernel install --user --name=ml-env -``` - -**Problema**: Kernel não inicia - -**Solução**: -```bash -# Reinstall ipykernel -pip uninstall ipykernel -pip install ipykernel - -# Register the kernel again -python -m ipykernel install --user -``` - -### Problemas com Células do Notebook - -**Problema**: Células estão executando, mas não mostram saída - -**Solução**: -1. Verifique se a célula ainda está em execução (procure o indicador `[*]`) -2. Reinicie o kernel e execute todas as células: `Kernel → Restart & Run All` -3. Verifique o console do navegador para erros de JavaScript (F12) - -**Problema**: Não é possível executar células - sem resposta ao clicar em "Run" - -**Solução**: -1. Verifique se o servidor Jupyter ainda está em execução no terminal -2. Atualize a página do navegador -3. Feche e reabra o notebook -4. Reinicie o servidor Jupyter - ---- - -## Problemas com Pacotes Python - -### Erros de Importação - -**Problema**: `ModuleNotFoundError: No module named 'sklearn'` - -**Solução**: -```bash -pip install scikit-learn - -# Common ML packages for this course -pip install scikit-learn pandas numpy matplotlib seaborn -``` - -**Problema**: `ImportError: cannot import name 'X' from 'sklearn'` - -**Solução**: -```bash -# Update scikit-learn to latest version -pip install --upgrade scikit-learn - -# Check version -python -c "import sklearn; print(sklearn.__version__)" -``` - -### Conflitos de Versão - -**Problema**: Erros de incompatibilidade de versão de pacotes - -**Solução**: -```bash -# Create a new virtual environment -python -m venv fresh-env -source fresh-env/bin/activate # or fresh-env\Scripts\activate on Windows - -# Install packages fresh -pip install jupyter scikit-learn pandas numpy matplotlib seaborn - -# If specific version needed -pip install scikit-learn==1.3.0 -``` - -**Problema**: `pip install` falha com erros de permissão - -**Solução**: -```bash -# Install for current user only -pip install --user package-name - -# Or use virtual environment (recommended) -python -m venv venv -source venv/bin/activate -pip install package-name -``` - -### Problemas ao Carregar Dados - -**Problema**: `FileNotFoundError` ao carregar arquivos CSV - -**Solução**: -```python -import os -# Check current working directory -print(os.getcwd()) - -# Use relative paths from notebook location -df = pd.read_csv('../../data/filename.csv') - -# Or use absolute paths -df = pd.read_csv('/full/path/to/data/filename.csv') -``` - ---- - -## Problemas com o Ambiente R - -### Instalação de Pacotes - -**Problema**: Instalação de pacotes falha com erros de compilação - -**Solução**: -```r -# Install binary version (Windows/macOS) -install.packages("package-name", type = "binary") - -# Update R to latest version if packages require it -# Check R version -R.version.string - -# Install system dependencies (Linux) -# For Ubuntu/Debian, in terminal: -# sudo apt-get install r-base-dev -``` - -**Problema**: `tidyverse` não instala - -**Solução**: -```r -# Install dependencies first -install.packages(c("rlang", "vctrs", "pillar")) - -# Then install tidyverse -install.packages("tidyverse") - -# Or install components individually -install.packages(c("dplyr", "ggplot2", "tidyr", "readr")) -``` - -### Problemas com RMarkdown - -**Problema**: RMarkdown não renderiza - -**Solução**: -```r -# Install/update rmarkdown -install.packages("rmarkdown") - -# Install pandoc if needed -install.packages("pandoc") - -# For PDF output, install tinytex -install.packages("tinytex") -tinytex::install_tinytex() -``` - ---- - -## Problemas com o Aplicativo de Quiz - -### Construção e Instalação - -**Problema**: `npm install` falha - -**Solução**: -```bash -# Clear npm cache -npm cache clean --force - -# Remove node_modules and package-lock.json -rm -rf node_modules package-lock.json - -# Reinstall -npm install - -# If still fails, try with legacy peer deps -npm install --legacy-peer-deps -``` - -**Problema**: Porta 8080 já está em uso - -**Solução**: -```bash -# Use different port -npm run serve -- --port 8081 - -# Or find and kill process using port 8080 -# On Linux/macOS: -lsof -ti:8080 | xargs kill -9 - -# On Windows: -netstat -ano | findstr :8080 -taskkill /PID /F -``` - -### Erros de Construção - -**Problema**: `npm run build` falha - -**Solução**: -```bash -# Check Node.js version (should be 14+) -node --version - -# Update Node.js if needed -# Then clean install -rm -rf node_modules package-lock.json -npm install -npm run build -``` - -**Problema**: Erros de lint impedindo a construção - -**Solução**: -```bash -# Fix auto-fixable issues -npm run lint -- --fix - -# Or temporarily disable linting in build -# (not recommended for production) -``` - ---- - -## Problemas com Dados e Caminhos de Arquivos - -### Problemas com Caminhos - -**Problema**: Arquivos de dados não encontrados ao executar notebooks - -**Solução**: -1. **Sempre execute notebooks a partir do diretório onde estão localizados** - ```bash - cd /path/to/lesson/folder - jupyter notebook - ``` - -2. **Verifique os caminhos relativos no código** - ```python - # Correct path from notebook location - df = pd.read_csv('../data/filename.csv') - - # Not from your terminal location - ``` - -3. **Use caminhos absolutos, se necessário** - ```python - import os - base_path = os.path.dirname(os.path.abspath(__file__)) - data_path = os.path.join(base_path, 'data', 'filename.csv') - ``` - -### Arquivos de Dados Ausentes - -**Problema**: Arquivos de conjunto de dados estão ausentes - -**Solução**: -1. Verifique se os dados deveriam estar no repositório - a maioria dos conjuntos de dados está incluída -2. Algumas lições podem exigir o download de dados - consulte o README da lição -3. Certifique-se de ter puxado as alterações mais recentes: - ```bash - git pull origin main - ``` - ---- - -## Mensagens de Erro Comuns - -### Erros de Memória - -**Erro**: `MemoryError` ou kernel morre ao processar dados - -**Solução**: -```python -# Load data in chunks -for chunk in pd.read_csv('large_file.csv', chunksize=10000): - process(chunk) - -# Or read only needed columns -df = pd.read_csv('file.csv', usecols=['col1', 'col2']) - -# Free memory when done -del large_dataframe -import gc -gc.collect() -``` - -### Avisos de Convergência - -**Aviso**: `ConvergenceWarning: Maximum number of iterations reached` - -**Solução**: -```python -from sklearn.linear_model import LogisticRegression - -# Increase max iterations -model = LogisticRegression(max_iter=1000) - -# Or scale your features first -from sklearn.preprocessing import StandardScaler -scaler = StandardScaler() -X_scaled = scaler.fit_transform(X) -``` - -### Problemas com Gráficos - -**Problema**: Gráficos não aparecem no Jupyter - -**Solução**: -```python -# Enable inline plotting -%matplotlib inline - -# Import pyplot -import matplotlib.pyplot as plt - -# Show plot explicitly -plt.plot(data) -plt.show() -``` - -**Problema**: Gráficos do Seaborn parecem diferentes ou geram erros - -**Solução**: -```python -import warnings -warnings.filterwarnings('ignore', category=UserWarning) - -# Update to compatible version -# pip install --upgrade seaborn matplotlib -``` - -### Erros de Unicode/Codificação - -**Problema**: `UnicodeDecodeError` ao ler arquivos - -**Solução**: -```python -# Specify encoding explicitly -df = pd.read_csv('file.csv', encoding='utf-8') - -# Or try different encoding -df = pd.read_csv('file.csv', encoding='latin-1') - -# For errors='ignore' to skip problematic characters -df = pd.read_csv('file.csv', encoding='utf-8', errors='ignore') -``` - ---- - -## Problemas de Desempenho - -### Execução Lenta de Notebooks - -**Problema**: Notebooks estão muito lentos para executar - -**Solução**: -1. **Reinicie o kernel para liberar memória**: `Kernel → Restart` -2. **Feche notebooks não utilizados** para liberar recursos -3. **Use amostras menores de dados para testes**: - ```python - # Work with subset during development - df_sample = df.sample(n=1000) - ``` -4. **Faça o perfil do seu código** para identificar gargalos: - ```python - %time operation() # Time single operation - %timeit operation() # Time with multiple runs - ``` - -### Uso Alto de Memória - -**Problema**: Sistema ficando sem memória - -**Solução**: -```python -# Check memory usage -df.info(memory_usage='deep') - -# Optimize data types -df['column'] = df['column'].astype('int32') # Instead of int64 - -# Drop unnecessary columns -df = df[['col1', 'col2']] # Keep only needed columns - -# Process in batches -for batch in np.array_split(df, 10): - process(batch) -``` - ---- - -## Ambiente e Configuração - -### Problemas com Ambiente Virtual - -**Problema**: Ambiente virtual não ativa - -**Solução**: -```bash -# Windows -python -m venv venv -venv\Scripts\activate.bat - -# macOS/Linux -python3 -m venv venv -source venv/bin/activate - -# Check if activated (should show venv name in prompt) -which python # Should point to venv python -``` - -**Problema**: Pacotes instalados, mas não encontrados no notebook - -**Solução**: -```bash -# Ensure notebook uses the correct kernel -# Install ipykernel in your venv -pip install ipykernel -python -m ipykernel install --user --name=ml-env --display-name="Python (ml-env)" - -# In Jupyter: Kernel → Change Kernel → Python (ml-env) -``` - -### Problemas com Git - -**Problema**: Não é possível puxar as alterações mais recentes - conflitos de merge - -**Solução**: -```bash -# Stash your changes -git stash - -# Pull latest -git pull origin main - -# Reapply your changes -git stash pop - -# If conflicts, resolve manually or: -git checkout --theirs path/to/file # Take remote version -git checkout --ours path/to/file # Keep your version -``` - -### Integração com VS Code - -**Problema**: Notebooks Jupyter não abrem no VS Code - -**Solução**: -1. Instale a extensão Python no VS Code -2. Instale a extensão Jupyter no VS Code -3. Selecione o interpretador Python correto: `Ctrl+Shift+P` → "Python: Select Interpreter" -4. Reinicie o VS Code - ---- - -## Recursos Adicionais - -- **Discussões no Discord**: [Faça perguntas e compartilhe soluções no canal #ml-for-beginners](https://aka.ms/foundry/discord) -- **Microsoft Learn**: [Módulos de ML para Iniciantes](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -- **Tutoriais em Vídeo**: [Playlist no YouTube](https://aka.ms/ml-beginners-videos) -- **Rastreador de Issues**: [Reporte bugs](https://github.com/microsoft/ML-For-Beginners/issues) - ---- - -## Ainda com Problemas? - -Se você tentou as soluções acima e ainda está enfrentando problemas: - -1. **Pesquise issues existentes**: [GitHub Issues](https://github.com/microsoft/ML-For-Beginners/issues) -2. **Verifique discussões no Discord**: [Discussões no Discord](https://aka.ms/foundry/discord) -3. **Abra uma nova issue**: Inclua: - - Seu sistema operacional e versão - - Versão do Python/R - - Mensagem de erro (traceback completo) - - Passos para reproduzir o problema - - O que você já tentou - -Estamos aqui para ajudar! 🚀 - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/docs/_sidebar.md b/translations/br/docs/_sidebar.md deleted file mode 100644 index d3cf2b208..000000000 --- a/translations/br/docs/_sidebar.md +++ /dev/null @@ -1,57 +0,0 @@ - -- Introdução - - [Introdução ao Aprendizado de Máquina](../1-Introduction/1-intro-to-ML/README.md) - - [História do Aprendizado de Máquina](../1-Introduction/2-history-of-ML/README.md) - - [Aprendizado de Máquina e Justiça](../1-Introduction/3-fairness/README.md) - - [Técnicas de Aprendizado de Máquina](../1-Introduction/4-techniques-of-ML/README.md) - -- Regressão - - [Ferramentas do Ofício](../2-Regression/1-Tools/README.md) - - [Dados](../2-Regression/2-Data/README.md) - - [Regressão Linear](../2-Regression/3-Linear/README.md) - - [Regressão Logística](../2-Regression/4-Logistic/README.md) - -- Construir um Aplicativo Web - - [Aplicativo Web](../3-Web-App/1-Web-App/README.md) - -- Classificação - - [Introdução à Classificação](../4-Classification/1-Introduction/README.md) - - [Classificadores 1](../4-Classification/2-Classifiers-1/README.md) - - [Classificadores 2](../4-Classification/3-Classifiers-2/README.md) - - [Aprendizado de Máquina Aplicado](../4-Classification/4-Applied/README.md) - -- Agrupamento - - [Visualize seus Dados](../5-Clustering/1-Visualize/README.md) - - [K-Means](../5-Clustering/2-K-Means/README.md) - -- PLN - - [Introdução ao Processamento de Linguagem Natural](../6-NLP/1-Introduction-to-NLP/README.md) - - [Tarefas de PLN](../6-NLP/2-Tasks/README.md) - - [Tradução e Sentimento](../6-NLP/3-Translation-Sentiment/README.md) - - [Avaliações de Hotéis 1](../6-NLP/4-Hotel-Reviews-1/README.md) - - [Avaliações de Hotéis 2](../6-NLP/5-Hotel-Reviews-2/README.md) - -- Previsão de Séries Temporais - - [Introdução à Previsão de Séries Temporais](../7-TimeSeries/1-Introduction/README.md) - - [ARIMA](../7-TimeSeries/2-ARIMA/README.md) - - [SVR](../7-TimeSeries/3-SVR/README.md) - -- Aprendizado por Reforço - - [Q-Learning](../8-Reinforcement/1-QLearning/README.md) - - [Gym](../8-Reinforcement/2-Gym/README.md) - -- Aprendizado de Máquina no Mundo Real - - [Aplicações](../9-Real-World/1-Applications/README.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/for-teachers.md b/translations/br/for-teachers.md deleted file mode 100644 index 6bca3dca7..000000000 --- a/translations/br/for-teachers.md +++ /dev/null @@ -1,37 +0,0 @@ - -## Para Educadores - -Gostaria de usar este currículo em sua sala de aula? Fique à vontade! - -Na verdade, você pode utilizá-lo diretamente no GitHub, usando o GitHub Classroom. - -Para isso, faça um fork deste repositório. Você precisará criar um repositório para cada aula, então será necessário extrair cada pasta em um repositório separado. Dessa forma, [GitHub Classroom](https://classroom.github.com/classrooms) poderá identificar cada aula individualmente. - -Estas [instruções completas](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) vão te ajudar a configurar sua sala de aula. - -## Usando o repositório como está - -Se você preferir usar este repositório no formato atual, sem utilizar o GitHub Classroom, isso também é possível. Você precisará comunicar aos seus alunos qual aula trabalhar juntos. - -Em um formato online (Zoom, Teams ou outro), você pode criar salas de grupo para os quizzes e orientar os alunos para ajudá-los a se prepararem para aprender. Depois, convide os alunos para os quizzes e peça que enviem suas respostas como 'issues' em um horário determinado. Você pode fazer o mesmo com as tarefas, caso queira que os alunos trabalhem colaborativamente de forma aberta. - -Se preferir um formato mais privado, peça aos seus alunos para fazerem fork do currículo, aula por aula, para seus próprios repositórios privados no GitHub e concederem acesso a você. Assim, eles podem completar quizzes e tarefas de forma privada e enviá-los para você via issues no repositório da sua sala de aula. - -Existem várias maneiras de fazer isso funcionar em um formato de sala de aula online. Por favor, nos informe o que funciona melhor para você! - -## Por favor, compartilhe suas opiniões! - -Queremos que este currículo funcione para você e seus alunos. Por favor, nos envie [feedback](https://forms.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR2humCsRZhxNuI79cm6n0hRUQzRVVU9VVlU5UlFLWTRLWlkyQUxORTg5WS4u). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/quiz-app/README.md b/translations/br/quiz-app/README.md deleted file mode 100644 index 85f932282..000000000 --- a/translations/br/quiz-app/README.md +++ /dev/null @@ -1,127 +0,0 @@ - -# Questionários - -Esses questionários são os quizzes pré e pós-aula para o currículo de ML em https://aka.ms/ml-beginners - -## Configuração do projeto - -``` -npm install -``` - -### Compila e recarrega automaticamente para desenvolvimento - -``` -npm run serve -``` - -### Compila e minimiza para produção - -``` -npm run build -``` - -### Verifica e corrige arquivos - -``` -npm run lint -``` - -### Personalizar configuração - -Veja [Referência de Configuração](https://cli.vuejs.org/config/). - -Créditos: Agradecimentos à versão original deste aplicativo de questionário: https://github.com/arpan45/simple-quiz-vue - -## Implantando no Azure - -Aqui está um guia passo a passo para ajudá-lo a começar: - -1. Faça um fork do repositório no GitHub -Certifique-se de que o código do seu aplicativo web estático esteja no seu repositório do GitHub. Faça um fork deste repositório. - -2. Crie um Azure Static Web App -- Crie uma [conta no Azure](http://azure.microsoft.com) -- Acesse o [portal do Azure](https://portal.azure.com) -- Clique em “Criar um recurso” e procure por “Static Web App”. -- Clique em “Criar”. - -3. Configure o Static Web App -- Básico: - - Assinatura: Selecione sua assinatura do Azure. - - Grupo de Recursos: Crie um novo grupo de recursos ou use um existente. - - Nome: Forneça um nome para seu aplicativo web estático. - - Região: Escolha a região mais próxima dos seus usuários. - -- #### Detalhes de Implantação: - - Fonte: Selecione “GitHub”. - - Conta do GitHub: Autorize o Azure a acessar sua conta do GitHub. - - Organização: Selecione sua organização no GitHub. - - Repositório: Escolha o repositório que contém seu aplicativo web estático. - - Branch: Selecione o branch do qual deseja implantar. - -- #### Detalhes de Build: - - Presets de Build: Escolha o framework com o qual seu aplicativo foi construído (por exemplo, React, Angular, Vue, etc.). - - Localização do App: Especifique a pasta que contém o código do seu aplicativo (por exemplo, / se estiver na raiz). - - Localização da API: Se você tiver uma API, especifique sua localização (opcional). - - Localização de Saída: Especifique a pasta onde a saída do build é gerada (por exemplo, build ou dist). - -4. Revisar e Criar -Revise suas configurações e clique em “Criar”. O Azure configurará os recursos necessários e criará um workflow do GitHub Actions no seu repositório. - -5. Workflow do GitHub Actions -O Azure criará automaticamente um arquivo de workflow do GitHub Actions no seu repositório (.github/workflows/azure-static-web-apps-.yml). Esse workflow cuidará do processo de build e implantação. - -6. Monitorar a Implantação -Acesse a aba “Actions” no seu repositório do GitHub. -Você verá um workflow em execução. Esse workflow irá construir e implantar seu aplicativo web estático no Azure. -Assim que o workflow for concluído, seu aplicativo estará ativo no URL fornecido pelo Azure. - -### Exemplo de Arquivo de Workflow - -Aqui está um exemplo de como pode ser o arquivo de workflow do GitHub Actions: -name: Azure Static Web Apps CI/CD -``` -on: - push: - branches: - - main - pull_request: - types: [opened, synchronize, reopened, closed] - branches: - - main - -jobs: - build_and_deploy_job: - runs-on: ubuntu-latest - name: Build and Deploy Job - steps: - - uses: actions/checkout@v2 - - name: Build And Deploy - id: builddeploy - uses: Azure/static-web-apps-deploy@v1 - with: - azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }} - repo_token: ${{ secrets.GITHUB_TOKEN }} - action: "upload" - app_location: "/quiz-app" # App source code path - api_location: ""API source code path optional - output_location: "dist" #Built app content directory - optional -``` - -### Recursos Adicionais -- [Documentação do Azure Static Web Apps](https://learn.microsoft.com/azure/static-web-apps/getting-started) -- [Documentação do GitHub Actions](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/sketchnotes/LICENSE.md b/translations/br/sketchnotes/LICENSE.md deleted file mode 100644 index 9f454d21d..000000000 --- a/translations/br/sketchnotes/LICENSE.md +++ /dev/null @@ -1,114 +0,0 @@ - -Direitos, então o banco de dados em que Você incluiu os conteúdos deve ser licenciado sob os mesmos termos desta Licença Pública; - - c. Você não pode oferecer ou impor quaisquer termos ou condições adicionais ou diferentes, ou aplicar Medidas Tecnológicas Eficazes ao banco de dados licenciado ou seus conteúdos que restrinjam o exercício dos Direitos Licenciados por qualquer destinatário do banco de dados licenciado. - - -Seção 5 -- Isenção de Garantias e Limitação de Responsabilidade. - - a. Salvo conforme expressamente estabelecido nesta Licença Pública, na medida máxima permitida pela lei aplicável, o Licenciador oferece o Material Licenciado "como está" e "conforme disponível", sem garantias ou condições de qualquer tipo, seja expressa, implícita, estatutária ou de outra forma, incluindo, sem limitação, garantias ou condições de título, comercialização, adequação a um propósito específico, não violação, ou ausência de defeitos latentes ou outros defeitos, precisão, ou a presença ou ausência de erros, sejam ou não detectáveis. - - b. Na medida máxima permitida pela lei aplicável, em nenhum caso o Licenciador será responsável por Você por qualquer teoria jurídica (incluindo, sem limitação, negligência) ou de outra forma por quaisquer perdas, custos, despesas ou danos resultantes direta ou indiretamente do uso do Material Licenciado, mesmo que o Licenciador tenha sido avisado da possibilidade de tais perdas, custos, despesas ou danos. - - -Seção 6 -- Termo e Rescisão. - - a. Este termo da Licença Pública começa quando Você aceita os Direitos Licenciados e permanece em vigor enquanto os Direitos Autorais e Direitos Similares aplicáveis ao Material Licenciado não expirarem. Se Você não cumprir as condições desta Licença Pública, Seus direitos sob esta Licença Pública terminam automaticamente. - - b. Quando Seu direito sob esta Licença Pública terminar automaticamente, todas as seguintes disposições permanecem em vigor: - - 1. Qualquer licença perpétua concedida por Você sob esta Licença Pública permanecerá em vigor; - - 2. Qualquer disposição desta Licença Pública necessária para interpretar a licença perpétua permanecerá em vigor. - - c. Não obstante o exposto, o Licenciador pode oferecer Você uma permissão individual para restabelecer os Direitos Licenciados sob esta Licença Pública. - - d. Esta Seção 6 não afeta quaisquer direitos que o Licenciador possa ter para buscar recursos por violações desta Licença Pública. - - -Seção 7 -- Outras Condições e Informações. - - a. Cada vez que Você compartilha o Material Licenciado ou Material Adaptado, o Licenciador oferece ao destinatário uma licença para o Material Licenciado sob os mesmos termos e condições desta Licença Pública. - - b. Se qualquer disposição desta Licença Pública for considerada inválida ou inexequível, isso não afetará a validade ou exequibilidade das disposições restantes. - - c. Nenhum termo ou condição adicional ou diferente pode ser imposto por Você ou por qualquer pessoa ao Material Licenciado ou ao Material Adaptado além dos termos desta Licença Pública. - - d. Esta Licença Pública não é uma renúncia de quaisquer direitos sob a lei aplicável. - - -Creative Commons Corporation não é parte desta Licença Pública e não oferece qualquer garantia em relação ao Material Licenciado. Creative Commons não será responsável perante Você ou qualquer outra parte por quaisquer danos, incluindo, sem limitação, quaisquer danos gerais, especiais, incidentais ou consequenciais decorrentes desta Licença Pública ou do uso do Material Licenciado. Não obstante as duas frases anteriores, se Creative Commons tiver expressamente identificado-se como o Licenciador aqui, terá todos os direitos e obrigações do Licenciador. Exceto conforme expressamente permitido sob esta Licença Pública, nenhuma parte pode usar a marca "Creative Commons" ou qualquer outra marca ou logotipo de Creative Commons sem permissão prévia por escrito de Creative Commons. Para evitar dúvidas, esta restrição de marca não constitui parte desta Licença Pública. -Direitos, então o banco de dados no qual você possui Direitos de Banco de Dados Sui Generis (mas não seus conteúdos individuais) é Material Adaptado, - -incluindo para os propósitos da Seção 3(b); e -c. Você deve cumprir as condições da Seção 3(a) se compartilhar todo ou uma parte substancial dos conteúdos do banco de dados. - -Para evitar dúvidas, esta Seção 4 complementa e não substitui suas obrigações sob esta Licença Pública quando os Direitos Licenciados incluem outros Direitos Autorais e Direitos Similares. - ---- - -Seção 5 -- Isenção de Garantias e Limitação de Responsabilidade. - -a. SALVO DISPOSIÇÃO EM CONTRÁRIO ASSUMIDA SEPARADAMENTE PELO LICENCIADOR, NA MEDIDA DO POSSÍVEL, O LICENCIADOR OFERECE O MATERIAL LICENCIADO "COMO ESTÁ" E "CONFORME DISPONÍVEL", E NÃO FAZ REPRESENTAÇÕES OU GARANTIAS DE QUALQUER TIPO RELACIONADAS AO MATERIAL LICENCIADO, SEJA EXPRESSA, IMPLÍCITA, LEGAL OU OUTRA. ISSO INCLUI, SEM LIMITAÇÃO, GARANTIAS DE TÍTULO, COMERCIALIZAÇÃO, ADEQUAÇÃO A UM PROPÓSITO ESPECÍFICO, NÃO VIOLAÇÃO, AUSÊNCIA DE DEFEITOS LATENTES OU OUTROS, PRECISÃO, OU A PRESENÇA OU AUSÊNCIA DE ERROS, SEJAM OU NÃO CONHECIDOS OU DETECTÁVEIS. ONDE ISENÇÕES DE GARANTIAS NÃO SÃO PERMITIDAS TOTAL OU PARCIALMENTE, ESTA ISENÇÃO PODE NÃO SE APLICAR A VOCÊ. - -b. NA MEDIDA DO POSSÍVEL, EM NENHUMA CIRCUNSTÂNCIA O LICENCIADOR SERÁ RESPONSÁVEL PERANTE VOCÊ SOB QUALQUER TEORIA LEGAL (INCLUINDO, SEM LIMITAÇÃO, NEGLIGÊNCIA) OU DE OUTRA FORMA POR QUAISQUER PERDAS DIRETAS, ESPECIAIS, INDIRETAS, INCIDENTAIS, CONSEQUENCIAIS, PUNITIVAS, EXEMPLARES OU OUTROS DANOS, CUSTOS, DESPESAS OU PREJUÍZOS DECORRENTES DESTA LICENÇA PÚBLICA OU DO USO DO MATERIAL LICENCIADO, MESMO QUE O LICENCIADOR TENHA SIDO INFORMADO DA POSSIBILIDADE DE TAIS PERDAS, CUSTOS, DESPESAS OU DANOS. ONDE UMA LIMITAÇÃO DE RESPONSABILIDADE NÃO É PERMITIDA TOTAL OU PARCIALMENTE, ESTA LIMITAÇÃO PODE NÃO SE APLICAR A VOCÊ. - -c. A isenção de garantias e a limitação de responsabilidade fornecidas acima devem ser interpretadas de maneira que, na medida do possível, mais se aproximem de uma isenção absoluta e renúncia de toda responsabilidade. - ---- - -Seção 6 -- Vigência e Rescisão. - -a. Esta Licença Pública se aplica durante o período dos Direitos Autorais e Direitos Similares licenciados aqui. No entanto, se você não cumprir esta Licença Pública, seus direitos sob esta Licença Pública serão automaticamente rescindidos. - -b. Quando seu direito de usar o Material Licenciado tiver sido rescindido sob a Seção 6(a), ele será restabelecido: - -1. automaticamente na data em que a violação for corrigida, desde que seja corrigida dentro de 30 dias após sua descoberta da violação; ou -2. mediante restabelecimento expresso pelo Licenciador. - -Para evitar dúvidas, esta Seção 6(b) não afeta qualquer direito que o Licenciador possa ter de buscar reparações por suas violações desta Licença Pública. - -c. Para evitar dúvidas, o Licenciador também pode oferecer o Material Licenciado sob termos ou condições separadas ou parar de distribuir o Material Licenciado a qualquer momento; no entanto, isso não encerrará esta Licença Pública. - -d. As Seções 1, 5, 6, 7 e 8 sobrevivem à rescisão desta Licença Pública. - ---- - -Seção 7 -- Outros Termos e Condições. - -a. O Licenciador não será vinculado por quaisquer termos ou condições adicionais ou diferentes comunicados por você, a menos que expressamente acordado. - -b. Quaisquer arranjos, entendimentos ou acordos relacionados ao Material Licenciado não declarados aqui são separados e independentes dos termos e condições desta Licença Pública. - ---- - -Seção 8 -- Interpretação. - -a. Para evitar dúvidas, esta Licença Pública não reduz, limita, restringe ou impõe condições sobre qualquer uso do Material Licenciado que possa ser legalmente feito sem permissão sob esta Licença Pública. - -b. Na medida do possível, se qualquer disposição desta Licença Pública for considerada inexequível, ela será automaticamente reformada na extensão mínima necessária para torná-la exequível. Se a disposição não puder ser reformada, ela será separada desta Licença Pública sem afetar a exequibilidade dos termos e condições restantes. - -c. Nenhum termo ou condição desta Licença Pública será renunciado e nenhum descumprimento será consentido, a menos que expressamente acordado pelo Licenciador. - -d. Nada nesta Licença Pública constitui ou pode ser interpretado como uma limitação ou renúncia de quaisquer privilégios e imunidades que se aplicam ao Licenciador ou a você, incluindo em relação aos processos legais de qualquer jurisdição ou autoridade. - ---- - -======================================================================= - -Creative Commons não é parte de suas licenças públicas. Não obstante, a Creative Commons pode optar por aplicar uma de suas licenças públicas ao material que publica e, nesses casos, será considerada o "Licenciador". O texto das licenças públicas da Creative Commons é dedicado ao domínio público sob a Dedicação ao Domínio Público CC0. Exceto para o propósito limitado de indicar que o material é compartilhado sob uma licença pública da Creative Commons ou conforme permitido pelas políticas da Creative Commons publicadas em creativecommons.org/policies, a Creative Commons não autoriza o uso da marca "Creative Commons" ou qualquer outra marca ou logotipo da Creative Commons sem seu consentimento prévio por escrito, incluindo, sem limitação, em conexão com quaisquer modificações não autorizadas de suas licenças públicas ou quaisquer outros arranjos, entendimentos ou acordos relacionados ao uso do material licenciado. Para evitar dúvidas, este parágrafo não faz parte das licenças públicas. - -A Creative Commons pode ser contatada em creativecommons.org. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/br/sketchnotes/README.md b/translations/br/sketchnotes/README.md deleted file mode 100644 index 0888bf5f4..000000000 --- a/translations/br/sketchnotes/README.md +++ /dev/null @@ -1,21 +0,0 @@ - -Todas as sketchnotes do currículo podem ser baixadas aqui. - -🖨 Para impressão em alta resolução, as versões TIFF estão disponíveis neste [repositório](https://github.com/girliemac/a-picture-is-worth-a-1000-words/tree/main/ml/tiff). - -🎨 Criado por: [Tomomi Imura](https://github.com/girliemac) (Twitter: [@girlie_mac](https://twitter.com/girlie_mac)) - -[![CC BY-SA 4.0](https://img.shields.io/badge/License-CC%20BY--SA%204.0-lightgrey.svg)](https://creativecommons.org/licenses/by-sa/4.0/) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pa/1-Introduction/1-intro-to-ML/README.md b/translations/pa/1-Introduction/1-intro-to-ML/README.md index d523240ca..98abeb7d5 100644 --- a/translations/pa/1-Introduction/1-intro-to-ML/README.md +++ b/translations/pa/1-Introduction/1-intro-to-ML/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਪਰਚੇ ## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ml/) diff --git a/translations/pa/1-Introduction/1-intro-to-ML/assignment.md b/translations/pa/1-Introduction/1-intro-to-ML/assignment.md index b89ab92a3..50976eb92 100644 --- a/translations/pa/1-Introduction/1-intro-to-ML/assignment.md +++ b/translations/pa/1-Introduction/1-intro-to-ML/assignment.md @@ -1,12 +1,3 @@ - # ਸ਼ੁਰੂਆਤ ਕਰੋ ਅਤੇ ਚਲਾਉਣ ਲਈ ਤਿਆਰ ਹੋਵੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/1-Introduction/2-history-of-ML/README.md b/translations/pa/1-Introduction/2-history-of-ML/README.md index a17993d16..6beedcfc0 100644 --- a/translations/pa/1-Introduction/2-history-of-ML/README.md +++ b/translations/pa/1-Introduction/2-history-of-ML/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਇਤਿਹਾਸ ![ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਇਤਿਹਾਸ ਦਾ ਸਾਰ](../../../../sketchnotes/ml-history.png) diff --git a/translations/pa/1-Introduction/2-history-of-ML/assignment.md b/translations/pa/1-Introduction/2-history-of-ML/assignment.md index 574442d7c..a9235cbde 100644 --- a/translations/pa/1-Introduction/2-history-of-ML/assignment.md +++ b/translations/pa/1-Introduction/2-history-of-ML/assignment.md @@ -1,12 +1,3 @@ - # ਟਾਈਮਲਾਈਨ ਬਣਾਓ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/1-Introduction/3-fairness/README.md b/translations/pa/1-Introduction/3-fairness/README.md index 976c641ff..59f44954e 100644 --- a/translations/pa/1-Introduction/3-fairness/README.md +++ b/translations/pa/1-Introduction/3-fairness/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਹੱਲਾਂ ਨੂੰ ਜ਼ਿੰਮੇਵਾਰ AI ਨਾਲ ਬਣਾਉਣਾ ![ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਜ਼ਿੰਮੇਵਾਰ AI ਦਾ ਸੰਖੇਪ](../../../../sketchnotes/ml-fairness.png) diff --git a/translations/pa/1-Introduction/3-fairness/assignment.md b/translations/pa/1-Introduction/3-fairness/assignment.md index 4377a5f1f..261e536f7 100644 --- a/translations/pa/1-Introduction/3-fairness/assignment.md +++ b/translations/pa/1-Introduction/3-fairness/assignment.md @@ -1,12 +1,3 @@ - # ਰਿਸਪਾਂਸਿਬਲ ਏਆਈ ਟੂਲਬਾਕਸ ਦੀ ਪੜਚੋਲ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/1-Introduction/4-techniques-of-ML/README.md b/translations/pa/1-Introduction/4-techniques-of-ML/README.md index 0b90511e6..b25e417f3 100644 --- a/translations/pa/1-Introduction/4-techniques-of-ML/README.md +++ b/translations/pa/1-Introduction/4-techniques-of-ML/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਤਕਨੀਕਾਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਬਣਾਉਣ, ਵਰਤਣ ਅਤੇ ਰੱਖ-ਰਖਾਵ ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਅਤੇ ਉਹ ਡਾਟਾ ਜੋ ਇਹ ਮਾਡਲ ਵਰਤਦੇ ਹਨ, ਕਈ ਹੋਰ ਵਿਕਾਸ ਕਾਰਜਪ੍ਰਣਾਲੀਆਂ ਤੋਂ ਬਹੁਤ ਵੱਖਰੀ ਹੈ। ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਪਸ਼ਟ ਕਰਾਂਗੇ ਅਤੇ ਮੁੱਖ ਤਕਨੀਕਾਂ ਦੀ ਰੂਪਰੇਖਾ ਪੇਸ਼ ਕਰਾਂਗੇ ਜੋ ਤੁਹਾਨੂੰ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ। ਤੁਸੀਂ: diff --git a/translations/pa/1-Introduction/4-techniques-of-ML/assignment.md b/translations/pa/1-Introduction/4-techniques-of-ML/assignment.md index 3a0adfb60..f743bb3c7 100644 --- a/translations/pa/1-Introduction/4-techniques-of-ML/assignment.md +++ b/translations/pa/1-Introduction/4-techniques-of-ML/assignment.md @@ -1,12 +1,3 @@ - # ਡਾਟਾ ਸਾਇੰਟਿਸਟ ਨਾਲ ਇੰਟਰਵਿਊ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/1-Introduction/README.md b/translations/pa/1-Introduction/README.md index 7832865b7..f02b696d3 100644 --- a/translations/pa/1-Introduction/README.md +++ b/translations/pa/1-Introduction/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ ਇਸ ਪਾਠਕ੍ਰਮ ਦੇ ਇਸ ਭਾਗ ਵਿੱਚ, ਤੁਹਾਨੂੰ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਮੂਲ ਧਾਰਨਾਵਾਂ, ਇਹ ਕੀ ਹੈ, ਇਸ ਦਾ ਇਤਿਹਾਸ ਅਤੇ ਉਹ ਤਕਨੀਕਾਂ ਜਿਨ੍ਹਾਂ ਨੂੰ ਖੋਜਕਰਤਾ ਇਸ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਵਰਤਦੇ ਹਨ, ਨਾਲ ਜਾਣੂ ਕਰਵਾਇਆ ਜਾਵੇਗਾ। ਆਓ, ਇਸ ਨਵੇਂ ML ਦੀ ਦੁਨੀਆ ਨੂੰ ਇਕੱਠੇ ਖੋਜੀਏ! diff --git a/translations/pa/2-Regression/1-Tools/README.md b/translations/pa/2-Regression/1-Tools/README.md index 2f555594d..89fc9d16e 100644 --- a/translations/pa/2-Regression/1-Tools/README.md +++ b/translations/pa/2-Regression/1-Tools/README.md @@ -1,12 +1,3 @@ - # ਪਾਇਥਨ ਅਤੇ Scikit-learn ਨਾਲ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲਾਂ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰੋ ![ਰਿਗ੍ਰੈਸ਼ਨ ਦਾ ਇੱਕ ਸਕੈਚਨੋਟ ਵਿੱਚ ਸਾਰ](../../../../sketchnotes/ml-regression.png) diff --git a/translations/pa/2-Regression/1-Tools/assignment.md b/translations/pa/2-Regression/1-Tools/assignment.md index 77f3c8431..3821e3ca1 100644 --- a/translations/pa/2-Regression/1-Tools/assignment.md +++ b/translations/pa/2-Regression/1-Tools/assignment.md @@ -1,12 +1,3 @@ - # ਸਕਾਈਟ-ਲਰਨ ਨਾਲ ਰਿਗ੍ਰੈਸ਼ਨ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/2-Regression/1-Tools/solution/Julia/README.md b/translations/pa/2-Regression/1-Tools/solution/Julia/README.md index ae4c45302..651a197b7 100644 --- a/translations/pa/2-Regression/1-Tools/solution/Julia/README.md +++ b/translations/pa/2-Regression/1-Tools/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/2-Regression/2-Data/README.md b/translations/pa/2-Regression/2-Data/README.md index f67af588c..d2d0ab403 100644 --- a/translations/pa/2-Regression/2-Data/README.md +++ b/translations/pa/2-Regression/2-Data/README.md @@ -1,12 +1,3 @@ - # ਸਕਾਈਟ-ਲਰਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਉਣਾ: ਡਾਟਾ ਤਿਆਰ ਕਰਨਾ ਅਤੇ ਵਿਜੁਅਲਾਈਜ਼ ਕਰਨਾ ![ਡਾਟਾ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਇਨਫੋਗ੍ਰਾਫਿਕ](../../../../2-Regression/2-Data/images/data-visualization.png) diff --git a/translations/pa/2-Regression/2-Data/assignment.md b/translations/pa/2-Regression/2-Data/assignment.md index dc8d07fa5..8358b4dcb 100644 --- a/translations/pa/2-Regression/2-Data/assignment.md +++ b/translations/pa/2-Regression/2-Data/assignment.md @@ -1,12 +1,3 @@ - # ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਦੀ ਖੋਜ ਡਾਟਾ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਲਈ ਕਈ ਵੱਖ-ਵੱਖ ਲਾਇਬ੍ਰੇਰੀਆਂ ਉਪਲਬਧ ਹਨ। ਇਸ ਪਾਠ ਵਿੱਚ ਮੱਤਰਾ ਡਾਟਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ matplotlib ਅਤੇ seaborn ਨਾਲ ਕੁਝ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨ ਬਣਾਓ। ਕਿਹੜੀਆਂ ਲਾਇਬ੍ਰੇਰੀਆਂ ਨਾਲ ਕੰਮ ਕਰਨਾ ਆਸਾਨ ਹੈ? diff --git a/translations/pa/2-Regression/2-Data/solution/Julia/README.md b/translations/pa/2-Regression/2-Data/solution/Julia/README.md index 271682cec..41c233e66 100644 --- a/translations/pa/2-Regression/2-Data/solution/Julia/README.md +++ b/translations/pa/2-Regression/2-Data/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/2-Regression/3-Linear/README.md b/translations/pa/2-Regression/3-Linear/README.md index dcb56e9e9..af47deabb 100644 --- a/translations/pa/2-Regression/3-Linear/README.md +++ b/translations/pa/2-Regression/3-Linear/README.md @@ -1,12 +1,3 @@ - # ਸਕਾਈਟ-ਲਰਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਓ: ਰਿਗ੍ਰੈਸ਼ਨ ਦੇ ਚਾਰ ਤਰੀਕੇ ![ਲਿਨੀਅਰ ਵਿਰੁੱਧ ਪੋਲੀਨੋਮਿਅਲ ਰਿਗ੍ਰੈਸ਼ਨ ਇਨਫੋਗ੍ਰਾਫਿਕ](../../../../2-Regression/3-Linear/images/linear-polynomial.png) @@ -117,11 +108,11 @@ day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt. ਪਿਛਲੇ ਪਾਠ ਤੋਂ ਤੁਸੀਂ ਸ਼ਾਇਦ ਦੇਖਿਆ ਹੈ ਕਿ ਵੱਖ-ਵੱਖ ਮਹੀਨਿਆਂ ਲਈ ਔਸਤ ਕੀਮਤ ਇਸ ਤਰ੍ਹਾਂ ਲੱਗਦੀ ਹੈ: -ਮਹੀਨੇ ਦੁਆਰਾ ਔਸਤ ਕੀਮਤ +ਮਹੀਨੇ ਦੁਆਰਾ ਔਸਤ ਕੀਮਤ ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਕੁਝ ਸੰਬੰਧਤਾ ਹੋ ਸਕਦੀ ਹੈ, ਅਤੇ ਅਸੀਂ `Month` ਅਤੇ `Price` ਦੇ ਵਿਚਕਾਰ ਜਾਂ `DayOfYear` ਅਤੇ `Price` ਦੇ ਵਿਚਕਾਰ ਸੰਬੰਧਤਾ ਦੀ ਭਵਿੱਖਵਾਣੀ ਕਰਨ ਲਈ ਲਿਨੀਅਰ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਟ੍ਰੇਨ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹਾਂ। ਹੇਠਾਂ ਦਿੱਤਾ ਸਕੈਟਰਪਲੌਟ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਦੂਜਾ ਸੰਬੰਧ ਕਿਵੇਂ ਲੱਗਦਾ ਹੈ: -Price vs. Day of Year ਦਾ ਸਕੈਟਰਪਲੌਟ +Price vs. Day of Year ਦਾ ਸਕੈਟਰਪਲੌਟ ਆਓ `corr` ਫੰਕਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਦੇਖੀਏ ਕਿ ਕੀ ਕੋਈ ਸੰਬੰਧਤਾ ਹੈ: @@ -146,7 +137,7 @@ plt.scatter(X_test,y_test) plt.plot(X_test,pred) ``` -Linear regression +Linear regression ## ਪੋਲੀਨੋਮਿਅਲ ਰਿਗ੍ਰੈਸ਼ਨ @@ -175,7 +166,7 @@ pipeline.fit(X_train,y_train) ਪਾਈਪਲਾਈਨ ਨੂੰ ਉਸੇ ਤਰੀਕੇ ਨਾਲ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਜਿਵੇਂ ਅਸਲ `LinearRegression` ਆਬਜੈਕਟ, ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਪਾਈਪਲਾਈਨ ਨੂੰ `fit` ਕਰ ਸਕਦੇ ਹਾਂ ਅਤੇ ਫਿਰ `predict` ਵਰਤ ਕੇ ਪੇਸ਼ਕਰੀ ਦੇ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਾਂ। ਇੱਥੇ ਟੈਸਟ ਡਾਟਾ ਅਤੇ ਅਨੁਮਾਨਿਤ ਵਕਰ ਦਿਖਾਉਣ ਵਾਲਾ ਗ੍ਰਾਫ ਹੈ: -Polynomial regression +Polynomial regression ਪੋਲੀਨੋਮਿਅਲ ਰਿਗ੍ਰੈਸ਼ਨ ਵਰਤ ਕੇ, ਅਸੀਂ ਥੋੜ੍ਹਾ ਘੱਟ MSE ਅਤੇ ਉੱਚਾ determination ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਾਂ, ਪਰ ਬਹੁਤ ਵੱਡਾ ਫਰਕ ਨਹੀਂ। ਸਾਨੂੰ ਹੋਰ ਫੀਚਰਾਂ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਲੈਣਾ ਪਵੇਗਾ! @@ -193,7 +184,7 @@ pipeline.fit(X_train,y_train) ਇੱਥੇ ਤੁਸੀਂ ਵੇਖ ਸਕਦੇ ਹੋ ਕਿ ਕਿਸਮ ਦੇ ਆਧਾਰ 'ਤੇ ਔਸਤ ਕੀਮਤ ਕਿਵੇਂ ਨਿਰਭਰ ਕਰਦੀ ਹੈ: -Average price by variety +Average price by variety ਕਿਸਮ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਲੈਣ ਲਈ, ਸਾਨੂੰ ਪਹਿਲਾਂ ਇਸਨੂੰ ਸੰਖਿਆਤਮਕ ਰੂਪ ਵਿੱਚ ਰੂਪਾਂਤਰਿਤ ਕਰਨਾ ਪਵੇਗਾ, ਜਾਂ **encode** ਕਰਨਾ ਪਵੇਗਾ। ਇਸਨੂੰ ਕਰਨ ਦੇ ਕਈ ਤਰੀਕੇ ਹਨ: diff --git a/translations/pa/2-Regression/3-Linear/assignment.md b/translations/pa/2-Regression/3-Linear/assignment.md index 840f7eeb4..fa62afb7f 100644 --- a/translations/pa/2-Regression/3-Linear/assignment.md +++ b/translations/pa/2-Regression/3-Linear/assignment.md @@ -1,12 +1,3 @@ - # ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਓ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/2-Regression/3-Linear/solution/Julia/README.md b/translations/pa/2-Regression/3-Linear/solution/Julia/README.md index 4c26d1323..918181355 100644 --- a/translations/pa/2-Regression/3-Linear/solution/Julia/README.md +++ b/translations/pa/2-Regression/3-Linear/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/2-Regression/4-Logistic/README.md b/translations/pa/2-Regression/4-Logistic/README.md index b64903b06..7fe4fcae3 100644 --- a/translations/pa/2-Regression/4-Logistic/README.md +++ b/translations/pa/2-Regression/4-Logistic/README.md @@ -1,12 +1,3 @@ - # ਲਾਜਿਸਟਿਕ ਰਿਗ੍ਰੈਸ਼ਨ ਨਾਲ ਸ਼੍ਰੇਣੀਆਂ ਦੀ ਪੇਸ਼ਗੂਈ ![ਲਾਜਿਸਟਿਕ ਵਿਰੁੱਧ ਰੇਖੀ ਰਿਗ੍ਰੈਸ਼ਨ ਇਨਫੋਗ੍ਰਾਫਿਕ](../../../../2-Regression/4-Logistic/images/linear-vs-logistic.png) diff --git a/translations/pa/2-Regression/4-Logistic/assignment.md b/translations/pa/2-Regression/4-Logistic/assignment.md index eb76d8751..27336f728 100644 --- a/translations/pa/2-Regression/4-Logistic/assignment.md +++ b/translations/pa/2-Regression/4-Logistic/assignment.md @@ -1,12 +1,3 @@ - # ਕੁਝ ਰਿਗ੍ਰੈਸ਼ਨ ਮੁੜ ਕੋਸ਼ਿਸ਼ ਕਰਨਾ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/2-Regression/4-Logistic/solution/Julia/README.md b/translations/pa/2-Regression/4-Logistic/solution/Julia/README.md index bc8acde39..1d06c80d0 100644 --- a/translations/pa/2-Regression/4-Logistic/solution/Julia/README.md +++ b/translations/pa/2-Regression/4-Logistic/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/2-Regression/README.md b/translations/pa/2-Regression/README.md index fba9e7f8f..f3efe2082 100644 --- a/translations/pa/2-Regression/README.md +++ b/translations/pa/2-Regression/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ## ਖੇਤਰੀ ਵਿਸ਼ਾ: ਉੱਤਰੀ ਅਮਰੀਕਾ ਵਿੱਚ ਕੱਦੂਆਂ ਦੀਆਂ ਕੀਮਤਾਂ ਲਈ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ 🎃 diff --git a/translations/pa/3-Web-App/1-Web-App/README.md b/translations/pa/3-Web-App/1-Web-App/README.md index e9411f60e..a13767d8c 100644 --- a/translations/pa/3-Web-App/1-Web-App/README.md +++ b/translations/pa/3-Web-App/1-Web-App/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਵਰਤਣ ਲਈ ਵੈੱਬ ਐਪ ਬਣਾਓ ਇਸ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਇੱਕ ਡਾਟਾ ਸੈੱਟ 'ਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰੋਗੇ ਜੋ ਬਹੁਤ ਹੀ ਦਿਲਚਸਪ ਹੈ: _ਪਿਛਲੇ ਸਦੀ ਦੇ ਦੌਰਾਨ ਦੇਖੇ ਗਏ UFO_, ਜੋ ਕਿ NUFORC ਦੇ ਡਾਟਾਬੇਸ ਤੋਂ ਲਿਆ ਗਿਆ ਹੈ। diff --git a/translations/pa/3-Web-App/1-Web-App/assignment.md b/translations/pa/3-Web-App/1-Web-App/assignment.md index 0cb6c11d4..15515cbb0 100644 --- a/translations/pa/3-Web-App/1-Web-App/assignment.md +++ b/translations/pa/3-Web-App/1-Web-App/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ਵੱਖਰਾ ਮਾਡਲ ਅਜ਼ਮਾਓ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/3-Web-App/README.md b/translations/pa/3-Web-App/README.md index e40a9f438..f12fd17ee 100644 --- a/translations/pa/3-Web-App/README.md +++ b/translations/pa/3-Web-App/README.md @@ -1,12 +1,3 @@ - # ਆਪਣਾ ML ਮਾਡਲ ਵਰਤਣ ਲਈ ਇੱਕ ਵੈੱਬ ਐਪ ਬਣਾਓ ਇਸ ਪਾਠਕ੍ਰਮ ਦੇ ਇਸ ਹਿੱਸੇ ਵਿੱਚ, ਤੁਹਾਨੂੰ ਇੱਕ ਲਾਗੂ ਕੀਤੀ ਗਈ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿਸ਼ੇ ਨਾਲ ਜਾਣੂ ਕਰਵਾਇਆ ਜਾਵੇਗਾ: ਆਪਣੇ Scikit-learn ਮਾਡਲ ਨੂੰ ਇੱਕ ਫਾਈਲ ਵਜੋਂ ਕਿਵੇਂ ਸੇਵ ਕਰਨਾ ਹੈ ਜੋ ਵੈੱਬ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਅਨੁਮਾਨ ਲਗਾਉਣ ਲਈ ਵਰਤੀ ਜਾ ਸਕਦੀ ਹੈ। ਜਦੋਂ ਮਾਡਲ ਸੇਵ ਹੋ ਜਾਂਦਾ ਹੈ, ਤੁਸੀਂ ਸਿੱਖੋਗੇ ਕਿ ਇਸਨੂੰ Flask ਵਿੱਚ ਬਣਾਈ ਗਈ ਵੈੱਬ ਐਪ ਵਿੱਚ ਕਿਵੇਂ ਵਰਤਣਾ ਹੈ। ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਤੁਸੀਂ ਇੱਕ ਮਾਡਲ ਬਣਾਓਗੇ ਜੋ UFO ਦੇ ਨਜ਼ਾਰਿਆਂ ਬਾਰੇ ਕੁਝ ਡਾਟਾ ਵਰਤਦਾ ਹੈ! ਫਿਰ, ਤੁਸੀਂ ਇੱਕ ਵੈੱਬ ਐਪ ਬਣਾਓਗੇ ਜੋ ਤੁਹਾਨੂੰ ਸਕਿੰਟਾਂ ਦੀ ਗਿਣਤੀ, ਲੈਟੀਟਿਊਡ ਅਤੇ ਲੌਂਗਿਟਿਊਡ ਦੀ ਮੁੱਲ ਦਾਖਲ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇਵੇਗਾ ਤਾਂ ਜੋ ਇਹ ਅਨੁਮਾਨ ਲਗਾਇਆ ਜਾ ਸਕੇ ਕਿ ਕਿਸ ਦੇਸ਼ ਨੇ UFO ਦੇਖਣ ਦੀ ਰਿਪੋਰਟ ਕੀਤੀ। diff --git a/translations/pa/4-Classification/1-Introduction/README.md b/translations/pa/4-Classification/1-Introduction/README.md index aa231eb24..075373d8e 100644 --- a/translations/pa/4-Classification/1-Introduction/README.md +++ b/translations/pa/4-Classification/1-Introduction/README.md @@ -1,12 +1,3 @@ - # ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਦਾ ਪਰਚੇਅ ਇਨ੍ਹਾਂ ਚਾਰ ਪਾਠਾਂ ਵਿੱਚ, ਤੁਸੀਂ ਕਲਾਸਿਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਇੱਕ ਮੂਲ ਧਿਆਨ - _ਕਲਾਸੀਫਿਕੇਸ਼ਨ_ - ਦੀ ਖੋਜ ਕਰੋਗੇ। ਅਸੀਂ ਏਸ਼ੀਆ ਅਤੇ ਭਾਰਤ ਦੇ ਸਾਰੇ ਸ਼ਾਨਦਾਰ ਖਾਣਿਆਂ ਬਾਰੇ ਡੇਟਾਸੈਟ ਨਾਲ ਵੱਖ-ਵੱਖ ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਐਲਗੋਰਿਥਮ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦਾ ਤਰੀਕਾ ਸਿੱਖਾਂਗੇ। ਉਮੀਦ ਹੈ ਕਿ ਤੁਸੀਂ ਭੁੱਖੇ ਹੋ! diff --git a/translations/pa/4-Classification/1-Introduction/assignment.md b/translations/pa/4-Classification/1-Introduction/assignment.md index 866e6cb7c..97d9561db 100644 --- a/translations/pa/4-Classification/1-Introduction/assignment.md +++ b/translations/pa/4-Classification/1-Introduction/assignment.md @@ -1,12 +1,3 @@ - # ਵਰਗੀਕਰਨ ਦੇ ਤਰੀਕੇ ਖੋਜੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/4-Classification/1-Introduction/solution/Julia/README.md b/translations/pa/4-Classification/1-Introduction/solution/Julia/README.md index 6638954b8..c7df6cad5 100644 --- a/translations/pa/4-Classification/1-Introduction/solution/Julia/README.md +++ b/translations/pa/4-Classification/1-Introduction/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/4-Classification/2-Classifiers-1/README.md b/translations/pa/4-Classification/2-Classifiers-1/README.md index b2a3a816d..8b2e01f87 100644 --- a/translations/pa/4-Classification/2-Classifiers-1/README.md +++ b/translations/pa/4-Classification/2-Classifiers-1/README.md @@ -1,12 +1,3 @@ - # ਖਾਣੇ ਦੇ ਵਰਗ 1 ਇਸ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ ਸੇਵ ਕੀਤੇ ਡਾਟਾਸੈਟ ਨੂੰ ਵਰਤੋਂਗੇ, ਜੋ ਖਾਣੇ ਬਾਰੇ ਸੰਤੁਲਿਤ ਅਤੇ ਸਾਫ ਡਾਟਾ ਨਾਲ ਭਰਿਆ ਹੋਇਆ ਹੈ। diff --git a/translations/pa/4-Classification/2-Classifiers-1/assignment.md b/translations/pa/4-Classification/2-Classifiers-1/assignment.md index b1b7af190..477aa381a 100644 --- a/translations/pa/4-Classification/2-Classifiers-1/assignment.md +++ b/translations/pa/4-Classification/2-Classifiers-1/assignment.md @@ -1,12 +1,3 @@ - # ਸਾਲਵਰਾਂ ਦਾ ਅਧਿਐਨ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/4-Classification/2-Classifiers-1/solution/Julia/README.md b/translations/pa/4-Classification/2-Classifiers-1/solution/Julia/README.md index 43d23ecab..2ede6bcab 100644 --- a/translations/pa/4-Classification/2-Classifiers-1/solution/Julia/README.md +++ b/translations/pa/4-Classification/2-Classifiers-1/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/4-Classification/3-Classifiers-2/README.md b/translations/pa/4-Classification/3-Classifiers-2/README.md index acc6de5b4..256bfcb6d 100644 --- a/translations/pa/4-Classification/3-Classifiers-2/README.md +++ b/translations/pa/4-Classification/3-Classifiers-2/README.md @@ -1,12 +1,3 @@ - # ਖਾਣੇ ਦੇ ਵਰਗੀਕਰਨ 2 ਇਸ ਦੂਜੇ ਵਰਗੀਕਰਨ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਗਿਣਤੀ ਡਾਟਾ ਨੂੰ ਵਰਗੀਕਰਣ ਦੇ ਹੋਰ ਤਰੀਕੇ ਖੋਜੋਗੇ। ਤੁਸੀਂ ਇਹ ਵੀ ਸਿੱਖੋਗੇ ਕਿ ਇੱਕ ਵਰਗੀਕਰਣਕਰਤਾ ਦੀ ਚੋਣ ਕਰਨ ਦੇ ਨਤੀਜੇ ਕੀ ਹੋ ਸਕਦੇ ਹਨ। diff --git a/translations/pa/4-Classification/3-Classifiers-2/assignment.md b/translations/pa/4-Classification/3-Classifiers-2/assignment.md index 3024094bd..2adcb0e95 100644 --- a/translations/pa/4-Classification/3-Classifiers-2/assignment.md +++ b/translations/pa/4-Classification/3-Classifiers-2/assignment.md @@ -1,12 +1,3 @@ - # ਪੈਰਾਮੀਟਰ ਪਲੇ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/4-Classification/3-Classifiers-2/solution/Julia/README.md b/translations/pa/4-Classification/3-Classifiers-2/solution/Julia/README.md index 714ac1937..aec86c1c7 100644 --- a/translations/pa/4-Classification/3-Classifiers-2/solution/Julia/README.md +++ b/translations/pa/4-Classification/3-Classifiers-2/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/4-Classification/4-Applied/README.md b/translations/pa/4-Classification/4-Applied/README.md index 947903a8e..11f03a92e 100644 --- a/translations/pa/4-Classification/4-Applied/README.md +++ b/translations/pa/4-Classification/4-Applied/README.md @@ -1,12 +1,3 @@ - # ਖਾਣੇ ਦੀ ਸਿਫਾਰਸ਼ ਕਰਨ ਵਾਲਾ ਵੈੱਬ ਐਪ ਬਣਾਓ ਇਸ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਪਿਛਲੇ ਪਾਠਾਂ ਵਿੱਚ ਸਿੱਖੀਆਂ ਕੁਝ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਵਰਗੀਕਰਨ ਮਾਡਲ ਬਣਾਉਗੇ ਅਤੇ ਇਸ ਸਿਰੀਜ਼ ਵਿੱਚ ਵਰਤੇ ਗਏ ਸੁਆਦਿਸ਼ਟ ਖਾਣੇ ਦੇ ਡਾਟਾਸੈਟ ਨਾਲ ਕੰਮ ਕਰੋਗੇ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਤੁਸੀਂ ਇੱਕ ਛੋਟਾ ਵੈੱਬ ਐਪ ਬਣਾਉਗੇ ਜੋ ਸੇਵ ਕੀਤੇ ਮਾਡਲ ਨੂੰ ਵਰਤਦਾ ਹੈ, Onnx ਦੇ ਵੈੱਬ ਰਨਟਾਈਮ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ। diff --git a/translations/pa/4-Classification/4-Applied/assignment.md b/translations/pa/4-Classification/4-Applied/assignment.md index f55b697db..d9ef0f324 100644 --- a/translations/pa/4-Classification/4-Applied/assignment.md +++ b/translations/pa/4-Classification/4-Applied/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ਰਿਕਮੈਂਡਰ ਬਣਾਓ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/4-Classification/README.md b/translations/pa/4-Classification/README.md index 1d3938166..8a5cd6c82 100644 --- a/translations/pa/4-Classification/README.md +++ b/translations/pa/4-Classification/README.md @@ -1,12 +1,3 @@ - # ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਨਾਲ ਸ਼ੁਰੂਆਤ ## ਖੇਤਰੀ ਵਿਸ਼ਾ: ਸੁਆਦਿਸ਼ਟ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਖਾਣੇ 🍜 diff --git a/translations/pa/5-Clustering/1-Visualize/README.md b/translations/pa/5-Clustering/1-Visualize/README.md index 56a6fb061..cfc406ca2 100644 --- a/translations/pa/5-Clustering/1-Visualize/README.md +++ b/translations/pa/5-Clustering/1-Visualize/README.md @@ -1,12 +1,3 @@ - # ਕਲੱਸਟਰਿੰਗ ਦਾ ਪਰਚੇ ਕਲੱਸਟਰਿੰਗ ਇੱਕ ਕਿਸਮ ਦਾ [ਅਨਸੁਪਰਵਾਈਜ਼ਡ ਲਰਨਿੰਗ](https://wikipedia.org/wiki/Unsupervised_learning) ਹੈ ਜੋ ਮੰਨਦਾ ਹੈ ਕਿ ਡੇਟਾਸੈੱਟ ਬਿਨਾਂ ਲੇਬਲ ਵਾਲਾ ਹੈ ਜਾਂ ਇਸਦੇ ਇਨਪੁਟਸ ਨੂੰ ਪਹਿਲਾਂ ਤੋਂ ਪਰਿਭਾਸ਼ਿਤ ਆਉਟਪੁਟਸ ਨਾਲ ਨਹੀਂ ਜੋੜਿਆ ਗਿਆ। ਇਹ ਵੱਖ-ਵੱਖ ਐਲਗੋਰਿਥਮਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਬਿਨਾਂ ਲੇਬਲ ਵਾਲੇ ਡੇਟਾ ਨੂੰ ਵੱਖ-ਵੱਖ ਸਮੂਹਾਂ ਵਿੱਚ ਵੰਡ ਸਕੇ, ਡੇਟਾ ਵਿੱਚ ਪੈਟਰਨ ਦੇ ਆਧਾਰ 'ਤੇ। diff --git a/translations/pa/5-Clustering/1-Visualize/assignment.md b/translations/pa/5-Clustering/1-Visualize/assignment.md index 684c62854..3e658a65a 100644 --- a/translations/pa/5-Clustering/1-Visualize/assignment.md +++ b/translations/pa/5-Clustering/1-Visualize/assignment.md @@ -1,12 +1,3 @@ - # ਕਲੱਸਟਰਿੰਗ ਲਈ ਹੋਰ ਵਿਜੁਅਲਾਈਜ਼ੇਸ਼ਨਜ਼ ਦੀ ਖੋਜ ਕਰੋ ## ਨਿਰਦੇਸ਼ diff --git a/translations/pa/5-Clustering/1-Visualize/solution/Julia/README.md b/translations/pa/5-Clustering/1-Visualize/solution/Julia/README.md index 0c10ba713..1d06c80d0 100644 --- a/translations/pa/5-Clustering/1-Visualize/solution/Julia/README.md +++ b/translations/pa/5-Clustering/1-Visualize/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/5-Clustering/2-K-Means/README.md b/translations/pa/5-Clustering/2-K-Means/README.md index 892b8abbb..9ef0bf6ba 100644 --- a/translations/pa/5-Clustering/2-K-Means/README.md +++ b/translations/pa/5-Clustering/2-K-Means/README.md @@ -1,12 +1,3 @@ - # ਕੇ-ਮੀਨਜ਼ ਕਲੱਸਟਰਿੰਗ ## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ml/) diff --git a/translations/pa/5-Clustering/2-K-Means/assignment.md b/translations/pa/5-Clustering/2-K-Means/assignment.md index 955447930..2c2a23c75 100644 --- a/translations/pa/5-Clustering/2-K-Means/assignment.md +++ b/translations/pa/5-Clustering/2-K-Means/assignment.md @@ -1,12 +1,3 @@ - # ਵੱਖ-ਵੱਖ ਕਲੱਸਟਰਿੰਗ ਵਿਧੀਆਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/5-Clustering/2-K-Means/solution/Julia/README.md b/translations/pa/5-Clustering/2-K-Means/solution/Julia/README.md index 630bf0573..adf0cb069 100644 --- a/translations/pa/5-Clustering/2-K-Means/solution/Julia/README.md +++ b/translations/pa/5-Clustering/2-K-Means/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/5-Clustering/README.md b/translations/pa/5-Clustering/README.md index d19ac5b38..64225a086 100644 --- a/translations/pa/5-Clustering/README.md +++ b/translations/pa/5-Clustering/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਕਲੱਸਟਰਿੰਗ ਮਾਡਲ ਕਲੱਸਟਰਿੰਗ ਇੱਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਕੰਮ ਹੈ ਜਿਸ ਵਿੱਚ ਇਹ ਉਹਨਾਂ ਚੀਜ਼ਾਂ ਨੂੰ ਲੱਭਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ ਜੋ ਇੱਕ ਦੂਜੇ ਨਾਲ ਮਿਲਦੀਆਂ ਹਨ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਕਲੱਸਟਰਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਸਮੂਹਬੱਧ ਕਰਦਾ ਹੈ। ਕਲੱਸਟਰਿੰਗ ਨੂੰ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਹੋਰ ਪਹੁੰਚਾਂ ਤੋਂ ਵੱਖਰਾ ਬਣਾਉਣ ਵਾਲੀ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇਹ ਸਾਰਾ ਕੰਮ ਆਟੋਮੈਟਿਕ ਤੌਰ 'ਤੇ ਹੁੰਦਾ ਹੈ। ਅਸਲ ਵਿੱਚ, ਇਹ ਕਹਿਣਾ ਸਹੀ ਹੋਵੇਗਾ ਕਿ ਇਹ ਸੁਪਰਵਾਈਜ਼ਡ ਲਰਨਿੰਗ ਦੇ ਉਲਟ ਹੈ। diff --git a/translations/pa/6-NLP/1-Introduction-to-NLP/README.md b/translations/pa/6-NLP/1-Introduction-to-NLP/README.md index 6882d8105..7e72c1333 100644 --- a/translations/pa/6-NLP/1-Introduction-to-NLP/README.md +++ b/translations/pa/6-NLP/1-Introduction-to-NLP/README.md @@ -1,12 +1,3 @@ - # ਨੈਚਰਲ ਲੈਂਗਵੇਜ ਪ੍ਰੋਸੈਸਿੰਗ ਦਾ ਪਰਚੇ ਇਸ ਪਾਠ ਵਿੱਚ *ਨੈਚਰਲ ਲੈਂਗਵੇਜ ਪ੍ਰੋਸੈਸਿੰਗ*, ਜੋ ਕਿ *ਕੰਪਿਊਟੇਸ਼ਨਲ ਲਿੰਗਵਿਸਟਿਕਸ* ਦਾ ਇੱਕ ਉਪ-ਖੇਤਰ ਹੈ, ਦੀ ਸੰਖੇਪ ਇਤਿਹਾਸ ਅਤੇ ਮਹੱਤਵਪੂਰਨ ਧਾਰਨਾਵਾਂ ਨੂੰ ਕਵਰ ਕੀਤਾ ਗਿਆ ਹੈ। diff --git a/translations/pa/6-NLP/1-Introduction-to-NLP/assignment.md b/translations/pa/6-NLP/1-Introduction-to-NLP/assignment.md index 3b4592ce0..fd96f7927 100644 --- a/translations/pa/6-NLP/1-Introduction-to-NLP/assignment.md +++ b/translations/pa/6-NLP/1-Introduction-to-NLP/assignment.md @@ -1,12 +1,3 @@ - # ਬੋਟ ਦੀ ਖੋਜ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/6-NLP/2-Tasks/README.md b/translations/pa/6-NLP/2-Tasks/README.md index a6f230b09..0612dacbd 100644 --- a/translations/pa/6-NLP/2-Tasks/README.md +++ b/translations/pa/6-NLP/2-Tasks/README.md @@ -1,12 +1,3 @@ - # ਆਮ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰਕਿਰਿਆ ਕਾਰਜ ਅਤੇ ਤਕਨੀਕਾਂ ਜਿਆਦਾਤਰ *ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰਕਿਰਿਆ* ਕਾਰਜਾਂ ਲਈ, ਪ੍ਰਕਿਰਿਆ ਕੀਤੇ ਜਾਣ ਵਾਲੇ ਪਾਠ ਨੂੰ ਤੋੜਨਾ, ਜਾਂਚਣਾ ਅਤੇ ਨਤੀਜਿਆਂ ਨੂੰ ਨਿਯਮਾਂ ਅਤੇ ਡੇਟਾ ਸੈੱਟਾਂ ਨਾਲ ਸਟੋਰ ਜਾਂ ਰਿਫਰੈਂਸ ਕਰਨਾ ਲਾਜ਼ਮੀ ਹੁੰਦਾ ਹੈ। ਇਹ ਕਾਰਜ ਪ੍ਰੋਗਰਾਮਰ ਨੂੰ ਪਾਠ ਵਿੱਚ ਸ਼ਬਦਾਂ ਅਤੇ ਸ਼ਬਦਾਵਲੀਆਂ ਦੀ _ਮਹੱਤਵ_, _ਇਰਾਦਾ_, ਜਾਂ ਸਿਰਫ਼ _ਆਵ੍ਰਿਤੀ_ ਨੂੰ ਸਮਝਣ ਦੀ ਯੋਗਤਾ ਦਿੰਦੇ ਹਨ। diff --git a/translations/pa/6-NLP/2-Tasks/assignment.md b/translations/pa/6-NLP/2-Tasks/assignment.md index 5099a0d36..60ab68958 100644 --- a/translations/pa/6-NLP/2-Tasks/assignment.md +++ b/translations/pa/6-NLP/2-Tasks/assignment.md @@ -1,12 +1,3 @@ - # ਬੋਟ ਨੂੰ ਵਾਪਸ ਗੱਲ ਕਰਵਾਓ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/6-NLP/3-Translation-Sentiment/README.md b/translations/pa/6-NLP/3-Translation-Sentiment/README.md index 6cfe921e9..5c8e6e0e3 100644 --- a/translations/pa/6-NLP/3-Translation-Sentiment/README.md +++ b/translations/pa/6-NLP/3-Translation-Sentiment/README.md @@ -1,12 +1,3 @@ - # ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨਾਲ ਅਨੁਵਾਦ ਅਤੇ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ ਪਿਛਲੇ ਪਾਠਾਂ ਵਿੱਚ ਤੁਸੀਂ ਸਿੱਖਿਆ ਕਿ ਕਿਵੇਂ `TextBlob` ਵਰਤ ਕੇ ਇੱਕ ਬੁਨਿਆਦੀ ਬੋਟ ਬਣਾਈ ਜਾ ਸਕਦੀ ਹੈ। ਇਹ ਲਾਇਬ੍ਰੇਰੀ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨੂੰ ਪਿੱਛੇ-ਪਿੱਛੇ ਵਰਤਦੀ ਹੈ ਤਾਂ ਜੋ ਨਾਉਨ ਫਰੇਜ਼ ਨਿਕਾਲਣ ਵਰਗੇ ਬੁਨਿਆਦੀ NLP ਕੰਮ ਕੀਤੇ ਜਾ ਸਕਣ। ਗਣਨਾਤਮਕ ਭਾਸ਼ਾਵਿਜ਼ਾਨ ਵਿੱਚ ਇੱਕ ਹੋਰ ਮਹੱਤਵਪੂਰਨ ਚੁਣੌਤੀ ਹੈ ਇੱਕ ਭਾਸ਼ਾ ਤੋਂ ਦੂਜੀ ਭਾਸ਼ਾ ਵਿੱਚ ਵਾਕਾਂਸ਼ ਦਾ ਸਹੀ _ਅਨੁਵਾਦ_। diff --git a/translations/pa/6-NLP/3-Translation-Sentiment/assignment.md b/translations/pa/6-NLP/3-Translation-Sentiment/assignment.md index d5eeba0a0..8e57dd645 100644 --- a/translations/pa/6-NLP/3-Translation-Sentiment/assignment.md +++ b/translations/pa/6-NLP/3-Translation-Sentiment/assignment.md @@ -1,12 +1,3 @@ - # ਕਾਵਿ ਲਾਇਸੰਸ ## ਨਿਰਦੇਸ਼ diff --git a/translations/pa/6-NLP/3-Translation-Sentiment/solution/Julia/README.md b/translations/pa/6-NLP/3-Translation-Sentiment/solution/Julia/README.md index dc08d5b61..1ed6958de 100644 --- a/translations/pa/6-NLP/3-Translation-Sentiment/solution/Julia/README.md +++ b/translations/pa/6-NLP/3-Translation-Sentiment/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/6-NLP/3-Translation-Sentiment/solution/R/README.md b/translations/pa/6-NLP/3-Translation-Sentiment/solution/R/README.md index 3d53ddd96..47a53d165 100644 --- a/translations/pa/6-NLP/3-Translation-Sentiment/solution/R/README.md +++ b/translations/pa/6-NLP/3-Translation-Sentiment/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/6-NLP/4-Hotel-Reviews-1/README.md b/translations/pa/6-NLP/4-Hotel-Reviews-1/README.md index 47a60e749..73ad1200b 100644 --- a/translations/pa/6-NLP/4-Hotel-Reviews-1/README.md +++ b/translations/pa/6-NLP/4-Hotel-Reviews-1/README.md @@ -1,12 +1,3 @@ - # ਹੋਟਲ ਰਿਵਿਊਜ਼ ਨਾਲ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ - ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਇਸ ਭਾਗ ਵਿੱਚ ਤੁਸੀਂ ਪਿਛਲੇ ਪਾਠਾਂ ਵਿੱਚ ਸਿੱਖੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਵੱਡੇ ਡਾਟਾਸੈਟ ਦਾ ਖੋਜਾਤਮਕ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋਗੇ। ਜਦੋਂ ਤੁਹਾਨੂੰ ਵੱਖ-ਵੱਖ ਕਾਲਮਾਂ ਦੀ ਉਪਯੋਗਤਾ ਦੀ ਚੰਗੀ ਸਮਝ ਹੋ ਜਾਵੇਗੀ, ਤਾਂ ਤੁਸੀਂ ਸਿੱਖੋਗੇ: diff --git a/translations/pa/6-NLP/4-Hotel-Reviews-1/assignment.md b/translations/pa/6-NLP/4-Hotel-Reviews-1/assignment.md index 025182641..1815103a3 100644 --- a/translations/pa/6-NLP/4-Hotel-Reviews-1/assignment.md +++ b/translations/pa/6-NLP/4-Hotel-Reviews-1/assignment.md @@ -1,12 +1,3 @@ - # ਐਨਐਲਟੀਕੇ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md b/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md index 5d4245c03..a92ef7c39 100644 --- a/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md +++ b/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/R/README.md b/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/R/README.md index 22bff75f4..1ed6958de 100644 --- a/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/R/README.md +++ b/translations/pa/6-NLP/4-Hotel-Reviews-1/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/6-NLP/5-Hotel-Reviews-2/README.md b/translations/pa/6-NLP/5-Hotel-Reviews-2/README.md index 7cdb56d3f..7af0d461b 100644 --- a/translations/pa/6-NLP/5-Hotel-Reviews-2/README.md +++ b/translations/pa/6-NLP/5-Hotel-Reviews-2/README.md @@ -1,12 +1,3 @@ - # ਹੋਟਲ ਰਿਵਿਊਜ਼ ਨਾਲ ਭਾਵਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ਹੁਣ ਜਦੋਂ ਤੁਸੀਂ ਡਾਟਾਸੈਟ ਨੂੰ ਵਿਸਤਾਰ ਵਿੱਚ ਖੰਗਾਲ ਲਿਆ ਹੈ, ਤਾਂ ਕਾਲਮਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨ ਅਤੇ ਹੋਟਲਾਂ ਬਾਰੇ ਨਵੇਂ ਅੰਤਰਦ੍ਰਿਸ਼ਟੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਡਾਟਾਸੈਟ 'ਤੇ NLP ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦਾ ਸਮਾਂ ਹੈ। diff --git a/translations/pa/6-NLP/5-Hotel-Reviews-2/assignment.md b/translations/pa/6-NLP/5-Hotel-Reviews-2/assignment.md index 3c2a3a741..ff75844d9 100644 --- a/translations/pa/6-NLP/5-Hotel-Reviews-2/assignment.md +++ b/translations/pa/6-NLP/5-Hotel-Reviews-2/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ਵੱਖਰਾ ਡਾਟਾਸੈੱਟ ਅਜ਼ਮਾਓ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md b/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md index 5c7fa28d6..d103590f6 100644 --- a/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md +++ b/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/R/README.md b/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/R/README.md index f88275d93..ae4807b19 100644 --- a/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/R/README.md +++ b/translations/pa/6-NLP/5-Hotel-Reviews-2/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/6-NLP/README.md b/translations/pa/6-NLP/README.md index 3d6141e44..ce8765bd5 100644 --- a/translations/pa/6-NLP/README.md +++ b/translations/pa/6-NLP/README.md @@ -1,12 +1,3 @@ - # ਨੈਚਰਲ ਲੈਂਗਵੇਜ ਪ੍ਰੋਸੈਸਿੰਗ ਨਾਲ ਸ਼ੁਰੂਆਤ ਨੈਚਰਲ ਲੈਂਗਵੇਜ ਪ੍ਰੋਸੈਸਿੰਗ (NLP) ਇੱਕ ਕੰਪਿਊਟਰ ਪ੍ਰੋਗਰਾਮ ਦੀ ਯੋਗਤਾ ਹੈ ਜੋ ਮਨੁੱਖੀ ਭਾਸ਼ਾ ਨੂੰ ਸਮਝ ਸਕੇ ਜਿਵੇਂ ਕਿ ਇਹ ਬੋਲੀ ਜਾਂ ਲਿਖੀ ਜਾਂਦੀ ਹੈ - ਜਿਸਨੂੰ ਨੈਚਰਲ ਲੈਂਗਵੇਜ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਕ੍ਰਿਤ੍ਰਿਮ ਬੁੱਧੀ (AI) ਦਾ ਇੱਕ ਹਿੱਸਾ ਹੈ। NLP ਪਿਛਲੇ 50 ਸਾਲਾਂ ਤੋਂ ਵੱਧ ਸਮੇਂ ਤੋਂ ਮੌਜੂਦ ਹੈ ਅਤੇ ਇਸ ਦੀਆਂ ਜੜ੍ਹਾਂ ਭਾਸ਼ਾਵਿਗਿਆਨ ਦੇ ਖੇਤਰ ਵਿੱਚ ਹਨ। ਪੂਰਾ ਖੇਤਰ ਮਸ਼ੀਨਾਂ ਨੂੰ ਮਨੁੱਖੀ ਭਾਸ਼ਾ ਨੂੰ ਸਮਝਣ ਅਤੇ ਪ੍ਰੋਸੈਸ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਨਿਰਦੇਸ਼ਿਤ ਹੈ। ਇਸਦਾ ਇਸਤਮਾਲ ਫਿਰ ਸਪੈਲ ਚੈੱਕ ਜਾਂ ਮਸ਼ੀਨ ਅਨੁਵਾਦ ਵਰਗੇ ਕੰਮ ਕਰਨ ਲਈ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇਸਦਾ ਕਈ ਖੇਤਰਾਂ ਵਿੱਚ ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਵਰਤੋਂ ਹੁੰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਮੈਡੀਕਲ ਰਿਸਰਚ, ਸਰਚ ਇੰਜਨ ਅਤੇ ਬਿਜ਼ਨਸ ਇੰਟੈਲੀਜੈਂਸ। diff --git a/translations/pa/6-NLP/data/README.md b/translations/pa/6-NLP/data/README.md index bfa70db0f..4c305270f 100644 --- a/translations/pa/6-NLP/data/README.md +++ b/translations/pa/6-NLP/data/README.md @@ -1,12 +1,3 @@ - ਹੋਟਲ ਸਮੀਖਿਆ ਡਾਟਾ ਇਸ ਫੋਲਡਰ ਵਿੱਚ ਡਾਊਨਲੋਡ ਕਰੋ। --- diff --git a/translations/pa/7-TimeSeries/1-Introduction/README.md b/translations/pa/7-TimeSeries/1-Introduction/README.md index 324a8b098..6c0cde14d 100644 --- a/translations/pa/7-TimeSeries/1-Introduction/README.md +++ b/translations/pa/7-TimeSeries/1-Introduction/README.md @@ -1,12 +1,3 @@ - # ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ ਦਾ ਪਰਚੇ ![ਟਾਈਮ ਸੀਰੀਜ਼ ਦਾ ਸਾਰ](../../../../sketchnotes/ml-timeseries.png) diff --git a/translations/pa/7-TimeSeries/1-Introduction/assignment.md b/translations/pa/7-TimeSeries/1-Introduction/assignment.md index fcb42b048..e35468a14 100644 --- a/translations/pa/7-TimeSeries/1-Introduction/assignment.md +++ b/translations/pa/7-TimeSeries/1-Introduction/assignment.md @@ -1,12 +1,3 @@ - # ਕੁਝ ਹੋਰ ਸਮਾਂ ਸਿਰੀਜ਼ ਨੂੰ ਵਿਜੁਅਲਾਈਜ਼ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/7-TimeSeries/1-Introduction/solution/Julia/README.md b/translations/pa/7-TimeSeries/1-Introduction/solution/Julia/README.md index af870c1b3..d103590f6 100644 --- a/translations/pa/7-TimeSeries/1-Introduction/solution/Julia/README.md +++ b/translations/pa/7-TimeSeries/1-Introduction/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/7-TimeSeries/1-Introduction/solution/R/README.md b/translations/pa/7-TimeSeries/1-Introduction/solution/R/README.md index ba775af69..eb1d6b296 100644 --- a/translations/pa/7-TimeSeries/1-Introduction/solution/R/README.md +++ b/translations/pa/7-TimeSeries/1-Introduction/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/7-TimeSeries/2-ARIMA/README.md b/translations/pa/7-TimeSeries/2-ARIMA/README.md index dffcee2c7..84c869f5d 100644 --- a/translations/pa/7-TimeSeries/2-ARIMA/README.md +++ b/translations/pa/7-TimeSeries/2-ARIMA/README.md @@ -1,12 +1,3 @@ - # ARIMA ਨਾਲ ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ ਬਾਰੇ ਕੁਝ ਸਿੱਖਿਆ ਅਤੇ ਇੱਕ ਡਾਟਾਸੈੱਟ ਲੋਡ ਕੀਤਾ ਜੋ ਇੱਕ ਸਮੇਂ ਦੀ ਮਿਆਦ ਦੌਰਾਨ ਬਿਜਲੀ ਦੇ ਲੋਡ ਵਿੱਚ ਉਤਾਰ-ਚੜ੍ਹਾਵ ਦਿਖਾਉਂਦਾ ਹੈ। diff --git a/translations/pa/7-TimeSeries/2-ARIMA/assignment.md b/translations/pa/7-TimeSeries/2-ARIMA/assignment.md index 7b229b73b..36b42e992 100644 --- a/translations/pa/7-TimeSeries/2-ARIMA/assignment.md +++ b/translations/pa/7-TimeSeries/2-ARIMA/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ਨਵਾਂ ARIMA ਮਾਡਲ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/7-TimeSeries/2-ARIMA/solution/Julia/README.md b/translations/pa/7-TimeSeries/2-ARIMA/solution/Julia/README.md index 222288765..c47521299 100644 --- a/translations/pa/7-TimeSeries/2-ARIMA/solution/Julia/README.md +++ b/translations/pa/7-TimeSeries/2-ARIMA/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/7-TimeSeries/2-ARIMA/solution/R/README.md b/translations/pa/7-TimeSeries/2-ARIMA/solution/R/README.md index 19af04257..0ab8ad6c7 100644 --- a/translations/pa/7-TimeSeries/2-ARIMA/solution/R/README.md +++ b/translations/pa/7-TimeSeries/2-ARIMA/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/7-TimeSeries/3-SVR/README.md b/translations/pa/7-TimeSeries/3-SVR/README.md index 1571abcf4..931e4c0f2 100644 --- a/translations/pa/7-TimeSeries/3-SVR/README.md +++ b/translations/pa/7-TimeSeries/3-SVR/README.md @@ -1,12 +1,3 @@ - # ਸਮੇਂ ਦੀ ਲੜੀ ਦੀ ਭਵਿੱਖਵਾਣੀ Support Vector Regressor ਨਾਲ ਪਿਛਲੇ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ARIMA ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਮੇਂ ਦੀ ਲੜੀ ਦੀ ਭਵਿੱਖਵਾਣੀ ਕਰਨ ਦਾ ਤਰੀਕਾ ਸਿੱਖਿਆ। ਹੁਣ ਤੁਸੀਂ Support Vector Regressor ਮਾਡਲ ਦੇਖੋਗੇ, ਜੋ ਕਿ ਇੱਕ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਹੈ ਜੋ ਲਗਾਤਾਰ ਡਾਟਾ ਦੀ ਭਵਿੱਖਵਾਣੀ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। diff --git a/translations/pa/7-TimeSeries/3-SVR/assignment.md b/translations/pa/7-TimeSeries/3-SVR/assignment.md index 7aa3a4320..c25213b7d 100644 --- a/translations/pa/7-TimeSeries/3-SVR/assignment.md +++ b/translations/pa/7-TimeSeries/3-SVR/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ਨਵਾਂ SVR ਮਾਡਲ ## ਹਦਾਇਤਾਂ [^1] diff --git a/translations/pa/7-TimeSeries/README.md b/translations/pa/7-TimeSeries/README.md index 49efde674..e3429d986 100644 --- a/translations/pa/7-TimeSeries/README.md +++ b/translations/pa/7-TimeSeries/README.md @@ -1,12 +1,3 @@ - # ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ ਦਾ ਪਰਚੇ ਟਾਈਮ ਸੀਰੀਜ਼ ਫੋਰਕਾਸਟਿੰਗ ਕੀ ਹੈ? ਇਹ ਪਿਛਲੇ ਰੁਝਾਨਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਕੇ ਭਵਿੱਖ ਦੇ ਘਟਨਾਵਾਂ ਦੀ ਭਵਿੱਖਵਾਣੀ ਕਰਨ ਬਾਰੇ ਹੈ। diff --git a/translations/pa/8-Reinforcement/1-QLearning/README.md b/translations/pa/8-Reinforcement/1-QLearning/README.md index 999a60682..ac0630c8e 100644 --- a/translations/pa/8-Reinforcement/1-QLearning/README.md +++ b/translations/pa/8-Reinforcement/1-QLearning/README.md @@ -1,12 +1,3 @@ - # ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਅਤੇ ਕਿਊ-ਲਰਨਿੰਗ ਦਾ ਪਰਚੇ ![ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਰੀਇਨਫੋਰਸਮੈਂਟ ਦਾ ਸਾਰ](../../../../sketchnotes/ml-reinforcement.png) diff --git a/translations/pa/8-Reinforcement/1-QLearning/assignment.md b/translations/pa/8-Reinforcement/1-QLearning/assignment.md index 582e1cef5..5f556dc65 100644 --- a/translations/pa/8-Reinforcement/1-QLearning/assignment.md +++ b/translations/pa/8-Reinforcement/1-QLearning/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ਹੋਰ ਹਕੀਕਤੀ ਦੁਨੀਆ ਸਾਡੇ ਹਾਲਾਤ ਵਿੱਚ, ਪੀਟਰ ਲਗਭਗ ਬਿਨਾਂ ਥੱਕੇ ਜਾਂ ਭੁੱਖੇ ਹੋਏ ਇधर-ਉਧਰ ਚਲ ਸਕਦਾ ਸੀ। ਇੱਕ ਹੋਰ ਹਕੀਕਤੀ ਦੁਨੀਆ ਵਿੱਚ, ਉਸਨੂੰ ਵਾਰ-ਵਾਰ ਬੈਠ ਕੇ ਆਰਾਮ ਕਰਨਾ ਪੈਂਦਾ ਹੈ ਅਤੇ ਖਾਣਾ ਵੀ ਖਾਣਾ ਪੈਂਦਾ ਹੈ। ਆਓ ਆਪਣੀ ਦੁਨੀਆ ਨੂੰ ਹੋਰ ਹਕੀਕਤੀ ਬਣਾਈਏ, ਹੇਠਾਂ ਦਿੱਤੇ ਨਿਯਮਾਂ ਲਾਗੂ ਕਰਕੇ: diff --git a/translations/pa/8-Reinforcement/1-QLearning/solution/Julia/README.md b/translations/pa/8-Reinforcement/1-QLearning/solution/Julia/README.md index 3d44678cf..1ed6958de 100644 --- a/translations/pa/8-Reinforcement/1-QLearning/solution/Julia/README.md +++ b/translations/pa/8-Reinforcement/1-QLearning/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/8-Reinforcement/1-QLearning/solution/R/README.md b/translations/pa/8-Reinforcement/1-QLearning/solution/R/README.md index 1100c56d5..9ba3482c8 100644 --- a/translations/pa/8-Reinforcement/1-QLearning/solution/R/README.md +++ b/translations/pa/8-Reinforcement/1-QLearning/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/8-Reinforcement/2-Gym/README.md b/translations/pa/8-Reinforcement/2-Gym/README.md index 8d747f241..3d6258284 100644 --- a/translations/pa/8-Reinforcement/2-Gym/README.md +++ b/translations/pa/8-Reinforcement/2-Gym/README.md @@ -1,12 +1,3 @@ - ## ਪੂਰਵ ਸ਼ਰਤਾਂ ਇਸ ਪਾਠ ਵਿੱਚ, ਅਸੀਂ **OpenAI Gym** ਨਾਂ ਦੀ ਲਾਇਬ੍ਰੇਰੀ ਦੀ ਵਰਤੋਂ ਕਰਾਂਗੇ ਜੋ ਵੱਖ-ਵੱਖ **ਵਾਤਾਵਰਣਾਂ** ਦੀ ਨਕਲ ਕਰਦੀ ਹੈ। ਤੁਸੀਂ ਇਸ ਪਾਠ ਦਾ ਕੋਡ ਆਪਣੇ ਸਥਾਨਕ ਸਿਸਟਮ 'ਤੇ ਚਲਾ ਸਕਦੇ ਹੋ (ਜਿਵੇਂ ਕਿ Visual Studio Code ਤੋਂ), ਜਿਸ ਵਿੱਚ ਸਿਮੂਲੇਸ਼ਨ ਇੱਕ ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲੇਗਾ। ਜਦੋਂ ਤੁਸੀਂ ਕੋਡ ਆਨਲਾਈਨ ਚਲਾਉਂਦੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਕੁਝ ਤਬਦੀਲੀਆਂ ਕਰਨ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ [ਇੱਥੇ](https://towardsdatascience.com/rendering-openai-gym-envs-on-binder-and-google-colab-536f99391cc7) ਵਰਣਨ ਕੀਤਾ ਗਿਆ ਹੈ। diff --git a/translations/pa/8-Reinforcement/2-Gym/assignment.md b/translations/pa/8-Reinforcement/2-Gym/assignment.md index 52e915c18..179f554ce 100644 --- a/translations/pa/8-Reinforcement/2-Gym/assignment.md +++ b/translations/pa/8-Reinforcement/2-Gym/assignment.md @@ -1,12 +1,3 @@ - # ਮਾਊਂਟੇਨ ਕਾਰ ਨੂੰ ਟ੍ਰੇਨ ਕਰੋ [OpenAI Gym](http://gym.openai.com) ਇਸ ਤਰ੍ਹਾਂ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਹੈ ਕਿ ਸਾਰੇ ਇਨਵਾਇਰਮੈਂਟ ਇੱਕੋ API ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ - ਜਿਵੇਂ ਕਿ ਇੱਕੋ ਮੈਥਡ `reset`, `step` ਅਤੇ `render`, ਅਤੇ **ਐਕਸ਼ਨ ਸਪੇਸ** ਅਤੇ **ਅਬਜ਼ਰਵੇਸ਼ਨ ਸਪੇਸ** ਦੇ ਇੱਕੋ ਅਬਸਟਰੈਕਸ਼ਨ। ਇਸ ਲਈ ਇਹ ਸੰਭਵ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਇੱਕੋ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਐਲਗੋਰਿਥਮ ਨੂੰ ਘੱਟ ਕੋਡ ਬਦਲਾਅ ਨਾਲ ਵੱਖ-ਵੱਖ ਇਨਵਾਇਰਮੈਂਟ ਲਈ ਅਡਾਪਟ ਕੀਤਾ ਜਾ ਸਕੇ। diff --git a/translations/pa/8-Reinforcement/2-Gym/solution/Julia/README.md b/translations/pa/8-Reinforcement/2-Gym/solution/Julia/README.md index 366325068..1ed6958de 100644 --- a/translations/pa/8-Reinforcement/2-Gym/solution/Julia/README.md +++ b/translations/pa/8-Reinforcement/2-Gym/solution/Julia/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/8-Reinforcement/2-Gym/solution/R/README.md b/translations/pa/8-Reinforcement/2-Gym/solution/R/README.md index 523e546c6..e1d583281 100644 --- a/translations/pa/8-Reinforcement/2-Gym/solution/R/README.md +++ b/translations/pa/8-Reinforcement/2-Gym/solution/R/README.md @@ -1,12 +1,3 @@ - --- diff --git a/translations/pa/8-Reinforcement/README.md b/translations/pa/8-Reinforcement/README.md index 0d21e4850..b0070ec68 100644 --- a/translations/pa/8-Reinforcement/README.md +++ b/translations/pa/8-Reinforcement/README.md @@ -1,12 +1,3 @@ - # ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ, ਜਾਂ RL, ਨੂੰ ਸੁਪਰਵਾਈਜ਼ਡ ਲਰਨਿੰਗ ਅਤੇ ਅਨਸੁਪਰਵਾਈਜ਼ਡ ਲਰਨਿੰਗ ਦੇ ਨਾਲ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਮੁੱਖ ਪੈਰਾਡਾਈਮਾਂ ਵਿੱਚੋਂ ਇੱਕ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ। RL ਫੈਸਲਿਆਂ ਬਾਰੇ ਹੈ: ਸਹੀ ਫੈਸਲੇ ਲੈਣਾ ਜਾਂ ਘੱਟੋ-ਘੱਟ ਉਹਨਾਂ ਤੋਂ ਸਿੱਖਣਾ। diff --git a/translations/pa/9-Real-World/1-Applications/README.md b/translations/pa/9-Real-World/1-Applications/README.md index 5c86234f3..4b98077ac 100644 --- a/translations/pa/9-Real-World/1-Applications/README.md +++ b/translations/pa/9-Real-World/1-Applications/README.md @@ -1,12 +1,3 @@ - # ਪੋਸਟਸਕ੍ਰਿਪਟ: ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ![ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਸੰਖੇਪ](../../../../sketchnotes/ml-realworld.png) diff --git a/translations/pa/9-Real-World/1-Applications/assignment.md b/translations/pa/9-Real-World/1-Applications/assignment.md index 291e6ad1d..ae5d205ea 100644 --- a/translations/pa/9-Real-World/1-Applications/assignment.md +++ b/translations/pa/9-Real-World/1-Applications/assignment.md @@ -1,12 +1,3 @@ - # ਇੱਕ ML ਸਕੈਵੈਂਜਰ ਹੰਟ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/9-Real-World/2-Debugging-ML-Models/README.md b/translations/pa/9-Real-World/2-Debugging-ML-Models/README.md index e802d5383..cfa2645a1 100644 --- a/translations/pa/9-Real-World/2-Debugging-ML-Models/README.md +++ b/translations/pa/9-Real-World/2-Debugging-ML-Models/README.md @@ -1,12 +1,3 @@ - # ਪੋਸਟਸਕ੍ਰਿਪਟ: ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਮਾਡਲ ਡੀਬੱਗਿੰਗ ਲਈ ਜ਼ਿੰਮੇਵਾਰ AI ਡੈਸ਼ਬੋਰਡ ਕੰਪੋਨੈਂਟਸ ਦੀ ਵਰਤੋਂ ## [ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ml/) diff --git a/translations/pa/9-Real-World/2-Debugging-ML-Models/assignment.md b/translations/pa/9-Real-World/2-Debugging-ML-Models/assignment.md index bc9c5d943..0f4c2b48c 100644 --- a/translations/pa/9-Real-World/2-Debugging-ML-Models/assignment.md +++ b/translations/pa/9-Real-World/2-Debugging-ML-Models/assignment.md @@ -1,12 +1,3 @@ - # ਰਿਸਪਾਂਸਿਬਲ ਏਆਈ (RAI) ਡੈਸ਼ਬੋਰਡ ਦੀ ਪੜਚੋਲ ਕਰੋ ## ਹਦਾਇਤਾਂ diff --git a/translations/pa/9-Real-World/README.md b/translations/pa/9-Real-World/README.md index 620ad89e6..cb738e5ca 100644 --- a/translations/pa/9-Real-World/README.md +++ b/translations/pa/9-Real-World/README.md @@ -1,12 +1,3 @@ - # ਪੋਸਟਸਕ੍ਰਿਪਟ: ਕਲਾਸਿਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਲਾਗੂ ਹੋਣ ਵਾਲੇ ਉਪਯੋਗ ਇਸ ਪਾਠਕ੍ਰਮ ਦੇ ਇਸ ਹਿੱਸੇ ਵਿੱਚ, ਤੁਹਾਨੂੰ ਕਲਾਸਿਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਕੁਝ ਅਸਲ ਦੁਨੀਆ ਵਿੱਚ ਲਾਗੂ ਹੋਣ ਵਾਲੇ ਉਦਾਹਰਣਾਂ ਨਾਲ ਜਾਣੂ ਕਰਵਾਇਆ ਜਾਵੇਗਾ। ਅਸੀਂ ਇੰਟਰਨੈਟ 'ਤੇ ਖੋਜ ਕੀਤੀ ਹੈ ਤਾਂ ਜੋ ਵਾਈਟਪੇਪਰ ਅਤੇ ਲੇਖ ਲੱਭੇ ਜਾ ਸਕਣ ਜੋ ਇਨ੍ਹਾਂ ਰਣਨੀਤੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ, ਜਿੱਥੇ ਤਕ ਸੰਭਵ ਹੋਵੇ, ਨਿਊਰਲ ਨੈਟਵਰਕ, ਡੀਪ ਲਰਨਿੰਗ ਅਤੇ AI ਤੋਂ ਬਚਦੇ ਹੋਏ। ਸਿੱਖੋ ਕਿ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨੂੰ ਵਪਾਰਕ ਪ੍ਰਣਾਲੀਆਂ, ਪਰਿਆਵਰਣਕ ਉਪਯੋਗ, ਵਿੱਤ, ਕਲਾ ਅਤੇ ਸਭਿਆਚਾਰ, ਅਤੇ ਹੋਰ ਕਈ ਖੇਤਰਾਂ ਵਿੱਚ ਕਿਵੇਂ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। diff --git a/translations/pa/AGENTS.md b/translations/pa/AGENTS.md index 5a58d5a86..0f2077992 100644 --- a/translations/pa/AGENTS.md +++ b/translations/pa/AGENTS.md @@ -1,12 +1,3 @@ - # AGENTS.md ## ਪ੍ਰੋਜੈਕਟ ਝਲਕ diff --git a/translations/pa/CODE_OF_CONDUCT.md b/translations/pa/CODE_OF_CONDUCT.md index 4d0fbf532..7e2d682f8 100644 --- a/translations/pa/CODE_OF_CONDUCT.md +++ b/translations/pa/CODE_OF_CONDUCT.md @@ -1,12 +1,3 @@ - # ਮਾਈਕਰੋਸਾਫਟ ਓਪਨ ਸੋਰਸ ਕੋਡ ਆਫ ਕੰਡਕਟ ਇਸ ਪ੍ਰੋਜੈਕਟ ਨੇ [ਮਾਈਕਰੋਸਾਫਟ ਓਪਨ ਸੋਰਸ ਕੋਡ ਆਫ ਕੰਡਕਟ](https://opensource.microsoft.com/codeofconduct/) ਨੂੰ ਅਪਨਾਇਆ ਹੈ। diff --git a/translations/pa/CONTRIBUTING.md b/translations/pa/CONTRIBUTING.md index c2bf074c5..c5c923d84 100644 --- a/translations/pa/CONTRIBUTING.md +++ b/translations/pa/CONTRIBUTING.md @@ -1,12 +1,3 @@ - # ਯੋਗਦਾਨ ਦੇਣਾ ਇਹ ਪ੍ਰੋਜੈਕਟ ਯੋਗਦਾਨ ਅਤੇ ਸੁਝਾਵਾਂ ਦਾ ਸਵਾਗਤ ਕਰਦਾ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਯੋਗਦਾਨ ਲਈ ਤੁਹਾਨੂੰ ਇੱਕ Contributor License Agreement (CLA) ਨਾਲ ਸਹਿਮਤ ਹੋਣਾ ਪਵੇਗਾ, ਜਿਸ ਵਿੱਚ ਇਹ ਘੋਸ਼ਿਤ ਕੀਤਾ ਜਾਵੇਗਾ ਕਿ ਤੁਹਾਡੇ ਕੋਲ ਆਪਣੇ ਯੋਗਦਾਨ ਦੇ ਅਧਿਕਾਰ ਹਨ ਅਤੇ ਤੁਸੀਂ ਸਾਨੂੰ ਇਸਨੂੰ ਵਰਤਣ ਦੇ ਅਧਿਕਾਰ ਦਿੰਦੇ ਹੋ। ਵਿਸਥਾਰ ਲਈ, https://cla.microsoft.com 'ਤੇ ਜਾਓ। diff --git a/translations/pa/README.md b/translations/pa/README.md index 1e2ca5436..d6e4bd180 100644 --- a/translations/pa/README.md +++ b/translations/pa/README.md @@ -1,12 +1,3 @@ - [![GitHub license](https://img.shields.io/github/license/microsoft/ML-For-Beginners.svg)](https://github.com/microsoft/ML-For-Beginners/blob/master/LICENSE) [![GitHub contributors](https://img.shields.io/github/contributors/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/graphs/contributors/) [![GitHub issues](https://img.shields.io/github/issues/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/issues/) @@ -19,78 +10,78 @@ CO_OP_TRANSLATOR_METADATA: ### 🌐 ਬਹੁ-ਭਾਸ਼ਾ ਸਮਰਥਨ -#### GitHub ਐਕਸ਼ਨ ਰਾਹੀਂ ਮਿਲਦਾ ਹੈ (ਆਟੋਮੇਟਿਕ ਅਤੇ ਹਮੇਸ਼ਾਂ ਅਪਡੇਟ ਰਹਿੰਦਾ) +#### GitHub ਐਕਸ਼ਨ ਰਾਹੀਂ ਸਮਰਥਿਤ (ਆਟੋਮੇਟਿਕ ਅਤੇ ਸਦਾ ਅਪ-ਟੂ-ਡੇਟ) -[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh/README.md) | [Chinese (Traditional, Hong Kong)](../hk/README.md) | [Chinese (Traditional, Macau)](../mo/README.md) | [Chinese (Traditional, Taiwan)](../tw/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../br/README.md) | [Portuguese (Portugal)](../pt/README.md) | [Punjabi (Gurmukhi)](./README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md) +[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh-CN/README.md) | [Chinese (Traditional, Hong Kong)](../zh-HK/README.md) | [Chinese (Traditional, Macau)](../zh-MO/README.md) | [Chinese (Traditional, Taiwan)](../zh-TW/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../pt-BR/README.md) | [Portuguese (Portugal)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](./README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md) -> **ਕੀ ਤੁਸੀਂ ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਕਲੋਨ ਕਰਨਾ ਪਸੰਦ ਕਰੋਗੇ?** +> **ਕੀ ਤੁਹਾਨੂੰ ਇੱਥੋਂ ਲੋਕਲ ਕਲੋਨ ਕਰਨਾ ਹੈ?** -> ਇਸ ਰਿਪੋਜ਼ਿਟਰੀ ਵਿੱਚ 50+ ਭਾਸ਼ਾ ਅਨੁਵਾਦ ਹਨ ਜੋ ਡਾਊਨਲੋਡ ਸਾਈਜ਼ ਨੂੰ ਕਾਫ਼ੀ ਵਧਾਉਂਦੇ ਹਨ। ਅਨੁਵਾਦਾਂ ਦੇ ਬਿਨਾ ਕਲੋਨ ਕਰਨ ਲਈ sparse checkout ਵਰਤੋ: +> ਇਸ ਰਿਪੋਜ਼ਿਟਰੀ ਵਿੱਚ 50+ ਭਾਸ਼ਾਵਾਂ ਦੇ ਅਨੁਵਾਦ ਸ਼ਾਮਿਲ ਹਨ ਜੋ ਡਾਊਨਲੋਡ ਆਕਾਰ ਵਧਾਉਂਦੇ ਹਨ। ਅਨੁਵਾਦਾਂ ਦੇ ਬਿਨਾਂ ਕਲੋਨ ਕਰਨ ਲਈ sparse checkout ਦੀ ਵਰਤੋਂ ਕਰੋ: > ```bash > git clone --filter=blob:none --sparse https://github.com/microsoft/ML-For-Beginners.git > cd ML-For-Beginners > git sparse-checkout set --no-cone '/*' '!translations' '!translated_images' > ``` -> ਇਹ ਤੁਹਾਨੂੰ ਕੋਰਸ ਨੂੰ ਬਹੁਤ ਤੇਜ਼ ਡਾਊਨਲੋਡ ਨਾਲ ਖ਼ਤਮ ਕਰਨ ਲਈ ਸਭ ਕੁਝ ਦਿੰਦਾ ਹੈ। +> ਇਹ ਤੁਹਾਨੂੰ ਪਾਠਕ੍ਰਮ ਪੂਰਾ ਕਰਨ ਲਈ ਲੋੜੀਦਾ ਸਾਰਾ ਕੁਝ ਬੜੀ ਤੇਜ਼ੀ ਨਾਲ ਡਾਊਨਲੋਡ ਕਰਦਾ ਹੈ। -#### ਸਾਡੀ ਕਮੇਊਨਿਟੀ ਨਾਲ ਜੁੜੋ +#### ਸਾਡੇ ਸਮੁਦਾਇ ਵਿਚ ਸ਼ਾਮਲ ਹੋਵੋ [![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) -ਅਸੀਂ ਇੱਕ Discord ਲਰਨ ਵਿਥ AI ਸੀਰੀਜ਼ ਚਲਾ ਰਹੇ ਹਾਂ, ਹੋਰ ਜਾਣੋ ਅਤੇ ਸਾਡੇ ਨਾਲ ਸ਼ਾਮਿਲ ਹੋਵੋ [ਲਰਨ ਵਿਥ AI ਸੀਰੀਜ਼](https://aka.ms/learnwithai/discord) 18 - 30 ਸਤੰਬਰ, 2025 ਤੋਂ। ਤੁਸੀਂ GitHub Copilot ਦੇ ਸਾਇੰਸ ਲਈ ਯੁਜ ਕਰਨਾ ਸਿੱਖੋਗੇ। +ਸਾਡੇ ਕੋਲ ਇੱਕ Discord 'Learn with AI' ਸੀਰੀਜ਼ ਚੱਲ ਰਹੀ ਹੈ, ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ ਅਤੇ ਸਾਡੀ ਸੇਰਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਵੋ [Learn with AI Series](https://aka.ms/learnwithai/discord) 18 - 30 ਸਤੰਬਰ, 2025 ਤੋਂ। ਤੁਹਾਨੂੰ GitHub Copilot ਦੀ ਵਰਤੋਂ ਲਈ ਡਾਟਾ ਸਾਇੰਸ ਵਿੱਚ ਟਿੱਪਸ ਅਤੇ ਟ੍ਰਿਕਸ ਮਿਲਣਗੇ। -![Learn with AI series](../../../../translated_images/pa/3.9b58fd8d6c373c20.webp) +![Learn with AI series](../../translated_images/pa/3.9b58fd8d6c373c20.webp) -# ਸ਼ੁਰੂਆਤੀਆਂ ਲਈ ਮਸ਼ੀਨ ਲਰਨਿੰਗ - ਇੱਕ ਪਾਠਕ੍ਰਮ +# ਸ਼ੁਰੂਆਤੀ ਲਈ ਮਸ਼ੀਨ ਲਰਨਿੰਗ - ਇੱਕ ਕੋਰਸ ਕਰਿਕੁਲਮ -> 🌍 ਦੁਨੀਆ ਦੇ ਸੱਭਿਅਤਾਂ ਰਾਹੀਂ ਸੈਰ ਦੌਰਾ ਜਦੋਂ ਅਸੀਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀ ਖੋਜ ਕਰਦੇ ਹਾਂ 🌍 +> 🌍 ਦੁਨੀਆ ਦੇ ਵੱਖ-ਵੱਖ ਸੱਭਿਆਚਾਰਾਂ ਰਾਹੀਂ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀ ਖੋਜ ਕਰਦੇ ਹੋਏ ਦੁਨੀਆ ਭਰ ਦਾ ਸਫਰ ਕਰੋ 🌍 -ਮਾਈਕ੍ਰੋਸੌਫਟ ਦੇ ਕਲਾਉਡ ਅਡਵੋਕੇਟਸ ਖੁਸ਼ ਹਨ ਕਿ ਉਹ 12 ਹਫ਼ਤਿਆਂ, 26 ਪਾਠਾਂ ਦਾ ਇਕ ਪਾਠਕ੍ਰਮ ਦਿੰਦੇ ਹਨ ਜੋ ਸਿਰਫ਼ **ਮਸ਼ੀਨ ਲਰਨਿੰਗ** ਬਾਰੇ ਹੈ। ਇਸ ਪਾਠਕ੍ਰਮ ਵਿੱਚ, ਤੁਸੀਂ ਕੁਝ ਸਮੇਂ "ਕ्लਾਸਿਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ" ਵਜੋਂ ਜਾਣਿਆ ਜਾਂਦਾ ਤਰੀਕਾ ਸਿੱਖੋਗੇ ਜੋ ਅਧਿਕ ਤਰਜੀਹ ਦੇ ਨਾਲ Scikit-learn ਲਾਈਬ੍ਰੇਰੀ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਅਤੇ ਡੀਪ ਲਰਨਿੰਗ ਤੋਂ ਬਚਦਾ ਹੈ, ਜੋ ਸਾਡੇ [AI for Beginners' curriculum](https://aka.ms/ai4beginners) ਵਿੱਚ ਕਵਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਪਾਠਕ੍ਰਮ ਸਾਡੇ ['ਡਾਟਾ ਸਾਇੰਸ ਲਈ ਸ਼ੁਰੂਆਤੀ' ਕੁਰਿਕੁਲਮ](https://aka.ms/ds4beginners) ਦੇ ਨਾਲ ਜੋੜੋ। +ਮਾਈਕ੍ਰੋਸੌਫਟ ਦੇ ਕਲਾਉਡ ਐਡਵੋਕੇਟਸ ਖੁਸ਼ ਹਨ ਕਿ ਉਹ 12 ਹਫ਼ਤੇ, 26 ਪਾਠਾਂ ਤੇ مشتمل ਇੱਕ ਕਰਿਕੁਲਮ ਪ੍ਰਦਾਨ ਕਰ ਰਹੇ ਹਨ ਜੋ **ਮਸ਼ੀਨ ਲਰਨਿੰਗ** ਬਾਰੇ ਹੈ। ਇਸ ਕਰਿਕੁਲਮ ਵਿੱਚ, ਤੁਸੀਂ ਵੇਖੋਗੇ ਕਿ ਕੁਝ ਕਹਿੰਦੇ ਹਨ ਕਲਾਸਿਕ ਮਸ਼ੀਨ ਲਰਨਿੰਗ, ਜੋ ਮੁੱਖ ਤੌਰ 'ਤੇ Scikit-learn ਲਾਇਬ੍ਰੇਰੀ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਅਤੇ ਡੀਪ ਲਰਨਿੰਗ ਤੋਂ ਬਚਿਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਸਾਡੇ [AI for Beginners' ਕਰਿਕੁਲਮ](https://aka.ms/ai4beginners) ਵਿੱਚ ਕਵਰ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਹ ਪਾਠ [Data Science for Beginners' ਕਰਿਕੁਲਮ](https://aka.ms/ds4beginners) ਨਾਲ ਵੀ ਜੋੜੋ। -ਸਾਡੇ ਨਾਲ ਦੁਨੀਆ ਦੇ ਵੱਖ-ਵੱਖ ਖੇਤਰਾਂ ਤੋਂ ਡਾਟਾ 'ਤੇ ਇਸ ਕਲਾਸਿਕ ਤਕਨੀਕਾਂ ਨੂੰ ਲਾਗੂ ਕਰਦੇ ਹੋਏ ਸੈਰ ਕਰੋ। ਹਰ ਪਾਠ ਵਿੱਚ ਪਹਿਲਾਂ ਅਤੇ ਬਾਅਦ ਦੀ ਕਵਿਜ਼, ਲਿਖਤੀ ਹੁਕਮ, ਹੱਲ, ਅਸਾਈਨਮੈਂਟ ਅਤੇ ਹੋਰ ਸ਼ਾਮਲ ਹਨ। ਸਾਡੀ ਪ੍ਰੋਜੈਕਟ-ਆਧਾਰਿਤ ਪੈਡਾਗੋਜੀ ਤੁਹਾਨੂੰ ਨਿਹਚਿਤ ਤਰੀਕੇ ਨਾਲ ਬਿਲਡ ਕਰਦੇ ਹੋਏ ਸਿੱਖਣ ਦਿੰਦੀ ਹੈ, ਜੋ ਨਵੀਆਂ ਕੌਸ਼ਲਾਂ ਲਈ ਪ੍ਰਮਾਣਿਤ ਤਰੀਕਾ ਹੈ। +ਸਾਡੇ ਨਾਲ ਦੁਨੀਆ ਭਰ ਦਾ ਸਫਰ ਕਰੋ ਜਿੱਥੇ ਅਸੀਂ ਕਲਾਸਿਕ ਤਕਨੀਕਾਂ ਨੂੰ ਵਿਸ਼ਵ ਭਰ ਦੇ ਡੇਟਾ 'ਤੇ ਲਾਗੂ ਕਰਦੇ ਹਾਂ। ਹਰ ਪਾਠ ਵਿੱਚ ਪ੍ਰੀ ਅਤੇ ਪੋਸਟ-ਪਾਠ ਕੁਇਜ਼, ਲਿਖਤੀ ਹਿੱਦਾਇਤਾਂ, ਹੱਲ, ਅਸਾਈਨਮੈਂਟ ਆਦਿੱ ਗਿੱਠੇ ਹਨ। ਸਾਡੀ ਪ੍ਰੋਜੈਕਟ ਆਧਾਰਤ ਪਾਠ ਸਿੱਖਣ ਦਾ ਤਰੀਕਾ ਹੈ ਜੋ ਕੰਮ ਕਰਦੇ ਹੋਏ ਸਿੱਖਣ ਨੂੰ ਸਰਗਰਮ ਰਖਦਾ ਹੈ, ਇਕ ਪ੍ਰਮਾਣਤ ਤਰੀਕਾ। -**✍️ ਸਾਡੇ ਲੇਖਕਾਂ ਦਾ ਦਿਲੋਂ ਧੰਨਵਾਦ** ਜੇਨ ਲੂਪਰ, ਸਟੀਫਨ ਹਾਵੇਲ, ਫ੍ਰਾਂਸੇਸਕਾ ਲਾਜ਼ੇਰੀ, ਟੋਮੋਮੀ ਇਮੁਰਾ, ਕੈਸੀ ਬਰੇਵਿਊ, ਡਿਮਿਟਰੀ ਸੋਸ਼ਨਿਕੋਵ, ਕ੍ਰਿਸ ਨੋਰਿੰਗ, ਅਨੀਰਬਨ ਮੁਖਰਜੀ, ਓਰਨੈਲਾ ਅਲਟੂਨਯਨ, ਰੁਥ ਯਾਕੁਬੁ ਅਤੇ ਏਮੀ ਬੋਇਡ +**✍️ ਸਾਡੇ ਲੇਖਕਾਂ ਨੂੰ ਭਾਰੀ ਸ਼ੁਕਰਗੁਜ਼ਾਰੀ** ਜ਼ੇਨ ਲੂਪਰ, ਸਟੀਫ਼ਨ ਹਾਓਵਲ, ਫ੍ਰਾਂਸੇਸਕਾ ਲਾਜ਼ੇਰੀ, ਟੋਮੋਮੀ ਇਮੁਰਾ, ਕੈਸੀ ਬ੍ਰੇਵਿਊ, ਡਿਮਿਟਰੀ ਸੋਸ਼ਨਿਕੋਵ, ਕ੍ਰਿਸ ਨੋਰਿੰਗ, ਅਨੀਰਬਾਨ ਮੁਖਰਜੀ, ਓਰਨੈਲਾ ਅਲਟੂਨਯਨ, ਰੂਥ ਯਾਕੂਬੂ ਅਤੇ ਐਮੀ ਬੋਇਡ -**🎨 ਸਾਡੇ ਇਲਸਟਰਏਟਰਾਂ ਦਾ ਵੀ ਧੰਨਵਾਦ** ਟੋਮੋਮੀ ਇਮੁਰਾ, ਦਾਸਾਨੀ ਮਾਡਿਪੱਲੀ, ਅਤੇ ਜੇਨ ਲੂਪਰ +**🎨 ਸਾਡੇ ਇਲਾਸਟਰਟਰਾਂ ਨੂੰ ਵੀ ਧੰਨਵਾਦ** ਟੋਮੋਮੀ ਇਮੁਰਾ, ਦਾਸਾਨੀ ਮਾਡਿਪੱਲੀ ਅਤੇ ਜੇਨ ਲੂਪਰ -**🙏 ਖਾਸ ਧੰਨਵਾਦ 🙏 ਸਾਡੇ Microsoft Student Ambassador ਲੇਖਕਾਂ, ਸਮੀਖਿਆਕਾਰਾਂ ਅਤੇ ਸਮੱਗਰੀ ਦਾਤਾਵਾਂ ਲਈ**, ਖਾਸ ਕਰਕੇ ਰਿਸ਼ਿਤ ਦਾਗਲੀ, ਮੁਹੰਮਦ ਸਾਕਿਬ ਖਾਨ ਇਨਾਨ, ਰੋਹਨ ਰਾਜ, ਅਲੇਕਜ਼ੈਂਡਰੂ ਪੇਟਰੇਸਕੂ, ਅਭਿਸ਼ੇਕ ਜੈਸਵਾਲ, ਨਵਰੀਨ ਤਬੱਸੁਮ, ਇਓਅਨ ਸਮੁਇਲਾ, ਅਤੇ ਸਨਿਗਧਾ ਅਗਰਵਾਲ +**🙏 ਖਾਸ ਧੰਨਵਾਦ 🙏 ਸਾਡੇ ਮਾਈਕ੍ਰੋਸੌਫਟ ਸਟੂਡੈਂਟ ਅੈਂਬੈਸਡਰ ਲੇਖਕਾਂ, ਸਮੀਖਿਆਕਾਰਾਂ ਅਤੇ ਸਮੱਗਰੀ ਯੋਗਦਾਨਕਾਰਾਂ ਨੂੰ**, ਖਾਸ ਕਰਕੇ ਰਿਸ਼ਿਤ ਡਾਗਲੀ, ਮੁਹੰਮਦ ਸਾਕਿਬ ਖਾਨ ਇਨਾਨ, ਰੋਹਨ ਰਾਜ, ਅਲੇਕਜ਼ਾਂਦਰੂ ਪੇਟਰੈਸਕੂ, ਅਭਿਸ਼ੇਕ ਜੈਸਵਾਲ, ਨਾਵਰੀਨ ਤਬਾਸ਼ਮ, ਇਓਅਨ ਸਾਮੁਇਲਾ, ਅਤੇ ਸਨਿਗਧਾ ਅਗਰਵਾਲ -**🤩 ਸਾਡੇ R ਪਾਠਾਂ ਲਈ Microsoft Student Ambassadors ਏਰਿਕ ਵਾਂਜਾਉ, ਜਸਲੀਨ ਸੋਂਧੀ, ਅਤੇ ਵਿਦੁਸ਼ੀ ਗੁਪਤਾ ਨੂੰ ਵਾਧੂ ਧੰਨਵਾਦ!** +**🤩 ਵਾਧੂ ਸ਼ੁਕਰਗੁਜ਼ਾਰੀ ਮਾਈਕ੍ਰੋਸੌਫਟ ਸਟੂਡੈਂਟ ਅੈਂਬੈਸਡਰਜ਼ ਐਰਿਕ ਵਾਂਜਾਊ, ਜਸਲੀਨ ਸੋੰਢੀ ਅਤੇ ਵੀਦੁਸ਼ੀ ਗੁਪਤਾ ਨੂੰ ਸਾਡੇ R ਪਾਠ ਲਈ!** -# ਸ਼ੁਰੂਆਤ +# ਸ਼ੁਰੂਆਤ ਕਰਨਾ -ਇਨ੍ਹਾਂ ਕਦਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰੋ: -1. **ਰਿਪੋਜ਼ਿਟਰੀ ਫੋਰਕ ਕਰੋ**: ਇਸ ਪੰਨੇ ਦੇ ਸੱਜੇ-ਉੱਪਰ "Fork" ਬਟਨ 'ਤੇ ਕਲਿੱਕ ਕਰੋ। -2. **ਰਿਪੋਜ਼ਿਟਰੀ ਕਲੋਨ ਕਰੋ**: `git clone https://github.com/microsoft/ML-For-Beginners.git` +ਇਹ ਕਦਮ ਫਾਲੋ ਕਰੋ: +1. **ਰਿਪੋਜ਼ਿਟਰੀ ਨੂੰ ਫੋਰਕ ਕਰੋ**: ਇਸ ਪੰਨੇ ਦੇ ਉਪਰ-ਸੱਜੇ ਕੋਨੇ ਵਿੱਚ "Fork" ਬਟਨ 'ਤੇ ਕਲਿੱਕ ਕਰੋ। +2. **ਰਿਪੋਜ਼ਿਟਰੀ ਕਲੋਨ ਕਰੋ**: `git clone https://github.com/microsoft/ML-For-Beginners.git` -> [ਇਸ ਕੋਰਸ ਲਈ ਸਾਰੇ ਅਤਿਰਿਕਤ ਸਰੋਤ ਸਾਡੇ Microsoft Learn ਕਲੇਕਸ਼ਨ ਵਿੱਚ ਮਿਲਦੇ ਹਨ](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) +> [ਇਸ ਕੋਰਸ ਦੀਆਂ ਸਾਰੀਆਂ ਵਾਧੂ ਸੰਸਾਧਨਾਂ ਲਈ ਸਾਡੇ Microsoft Learn ਕलेकਸ਼ਨ ਵਿਚ ਖੋਜੋ](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -> 🔧 **ਮਦਦ ਚਾਹੀਦੀ ਹੈ?** ਸਾਡਾ [ਮੁਸ਼ਕਿਲਾਂ ਹੱਲ ਕਰਨ ਦੀ ਗਾਈਡ](TROUBLESHOOTING.md) ਚੈੱਕ ਕਰੋ ਜਿੱਥੇ ਸਥਾਪਨਾ, ਸੈਟਅੱਪ, ਅਤੇ ਪਾਠ ਚਲਾਉਣ ਦੇ ਆਮ ਮੁੱਦਿਆਂ ਦੇ ਹੱਲ ਹਨ। +> 🔧 **ਸਹਾਇਤਾ ਚਾਹੀਦੀ ਹੈ?** ਸਾਡੇ [Troubleshooting Guide](TROUBLESHOOTING.md) ਵਿੱਚ ਇੰਸਟਾਲੇਸ਼ਨ, ਸੈੱਟਅਪ ਅਤੇ ਪਾਠ ਚਲਾਉਣ ਦੇ ਆਮ ਮੁੱਦਿਆਂ ਦੇ ਸਮਾਧਾਨ ਹਨ। -**[ਵਿਦਿਆਰਥੀ](https://aka.ms/student-page)**, ਇਸ ਕੁਰਿਕੁਲਮ ਨੂੰ ਵਰਤਣ ਲਈ, ਸਾਰੇ ਰਿਪੋ ਨੂੰ ਆਪਣੇ GitHub ਖਾਤੇ 'ਤੇ ਫੋਰਕ ਕਰੋ ਅਤੇ ਅਭਿਆਸ ਆਪਣੇ-ਆਪ ਜਾਂ ਗਰੁੱਪ ਨਾਲ ਮੁਕੰਮਲ ਕਰੋ: +**[ਵਿਦਿਆਰਥੀ](https://aka.ms/student-page)**, ਇਸ ਕਰਿਕੁਲਮ ਨੂੰ ਵਰਤਣ ਲਈ, ਪੂਰੇ ਰਿਪੋ ਨੂੰ ਆਪਣੇ GitHub ਖਾਤੇ 'ਤੇ ਫੋਰਕ ਕਰੋ ਅਤੇ ਅਭਿਆਸ ਆਪਣੇ ਅੰਦਰ ਜਾਂ ਗਰੁੱਪ ਨਾਲ ਖਤਮ ਕਰੋ: -- ਪਹਿਲੇ ਕਲਾਸ ਤੋਂ ਪਹਿਲਾਂ ਕਵਿਜ਼ ਲਵੋ। -- ਲੈਕਚਰ ਪੜ੍ਹੋ ਅਤੇ ਗਤੀਵਿਧੀਆਂ ਪੂਰੀਆਂ ਕਰੋ, ਹਰ ਗਿਆਨ ਜਾਂਚ ਤੇ ਰੁਕ ਕੇ ਵਿਚਾਰ ਕਰੋ। -- ਹੱਲ ਦੇ ਕੋਡ ਨੂੰ ਦੌੜਾਉਣ ਦੀ ਬਜਾਏ, ਪਾਠਾਂ ਨੂੰ ਸਮਝ ਕੇ ਪ੍ਰੋਜੈਕਟ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ; ਹਾਲਾਂਕਿ ਇਹ ਕੋਡ ਹਰ ਪ੍ਰੋਜੈਕਟ-ਕੇਂਦਰਿਤ ਪਾਠ ਵਿੱਚ `/solution` ਫੋਲਡਰ ਵਿੱਚ ਉਪਲਬਧ ਹੈ। -- ਲੈਕਚਰ ਦੇ ਬਾਦ ਕਵਿਜ਼ ਦਿਓ। -- ਚੈਲੇਂਜ ਪੂਰਾ ਕਰੋ। +- ਪ੍ਰੀ-ਲੈਕਚਰ ਕੁਇਜ਼ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ। +- ਲੈਕਚਰ ਪੜ੍ਹੋ ਅਤੇ ਸਰਗਰਮੀ ਪੂਰੀ ਕਰੋ, ਹਰ ਗਿਆਨ ਚੈਕ ਤੇ ਰੋਕ ਕੇ ਸੋਚ-ਵਿਚਾਰ ਕਰੋ। +- ਕੋਡ ਸਲੂਸ਼ਨ ਚਲਾਉਣ ਦੀ ਬਜਾਏ ਪਾਠ ਨੂੰ ਸਮਝ ਕੇ ਪ੍ਰੋਜੈਕਟ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ; ਹਾਲਾਂਕਿ ਜਿਹੜਾ ਕੋਡ `/solution` ਫੋਲਡਰ ਵਿੱਚ ਹਰ ਪ੍ਰੋਜੈਕਟ-ਕੇਂਦ੍ਰਿਤ ਪਾਠ ਵਿੱਚ ਹੈ, ਉਹ ਉਪਲਬਧ ਹੈ। +- ਪੋਸਟ-ਲੈਕਚਰ ਕੁਇਜ਼ ਲਵੋ। +- ਚੈਲੰਜ ਪੂਰਾ ਕਰੋ। - ਅਸਾਈਨਮੈਂਟ ਪੂਰਾ ਕਰੋ। -- ਕੋਈ ਲੈਸਨ ਸਮੂਹ ਪੂਰਾ ਕਰਨ ਦੇ ਬਾਦ, [ਚਰਚਾ ਬੋਰਡ](https://github.com/microsoft/ML-For-Beginners/discussions) ਤੇ ਜਾਓ ਅਤੇ ਸੰਬੰਧਤ PAT ਰੁਬਰਿਕ ਭਰ ਕੇ "ਜਾਣਕਾਰੀ ਸਾਂਝੀ ਕਰੋ"। 'PAT' ਮਤਲਬ ਪ੍ਰਗਤੀ ਆਕਲਨ ਟੂਲ ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਆਪਣੀ ਸਿੱਖਿਆ ਵਧਾਉਣ ਲਈ ਭਰਦੇ ਹੋ। ਤੁਸੀਂ ਹੋਰ PATs 'ਤੇ ਵੀ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰ ਸਕਦੇ ਹੋ, ਤਾਂ ਜੋ ਅਸੀਂ ਇੱਕੱਠੇ ਸਿੱਖੀਏ। +- ਪਾਠ ਗਰੁੱਪ ਖਤਮ ਕਰਨ ਤੋਂ ਬਾਅਦ, [Discussion Board](https://github.com/microsoft/ML-For-Beginners/discussions) ਤੇ ਜਾਓ ਅਤੇ موزوں PAT ਰੁਬ੍ਰਿਕ ਭਰ ਕੇ "ਲੌਡ ਸਿੱਖੋ"। 'PAT' ਮਤਲਬ ਪ੍ਰਗਟੀ ਦਰਜ਼ਾ ਟੂਲ ਹੈ ਜੋ ਤੁਹਾਡੇ ਸਿੱਖਣ ਲਈ ਇੱਕ ਰੁਬ੍ਰਿਕ ਹੈ। ਤੁਸੀਂ ਹੋਰ PATs 'ਤੇ ਵੀ ਜਵਾਬ ਦੇ ਸਕਦੇ ਹੋ ਤਾਂ ਜੋ ਅਸੀਂ ਸਾਰਿਆਂ ਨੂੰ ਇਕੱਠੇ ਸਿੱਖਣਾ ਮਿਲੇ। -> ਅਗਲੇ ਅਧ੍ਯਨ ਲਈ, ਅਸੀਂ ਇਹ [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott) ਮਾਡਿਊਲ ਅਤੇ ਸਿੱਖਣ ਵਾਲੀਆਂ ਰਾਹਾਂ ਦੀ ਸਿਫਾਰਿਸ਼ ਕਰਦੇ ਹਾਂ। +> ਅਗਲੇ ਪਾਠ ਲਈ, ਅਸੀਂ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ ਕਿ ਤੁਸੀਂ ਇਹਨਾਂ [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott) ਮਾਡਿਊਲਾਂ ਅਤੇ ਸਿੱਖਣ ਰਸਤੇ ਦੀ ਪਾਲਣਾ ਕਰੋ। -**ਅਧਿਆਪਕਾਂ**, ਅਸੀਂ ਇਹ [ਕੁਝ ਸੁਝਾਅ](for-teachers.md) ਦਿੱਤੇ ਹਨ ਕਿ ਕਿਵੇਂ ਇਹ ਕੁਰਿਕੁਲਮ ਵਰਤਣਾ ਹੈ। +**ਅਧਿਆਪਕ**, ਅਸੀਂ [ਕੁਝ ਸੁਝਾਵ](for-teachers.md) ਦਿੱਤੇ ਹਨ ਕਿ ਕਿਵੇਂ ਇਹ ਕਰਿਕੁਲਮ ਵਰਤਣਾ ਹੈ। --- -## ਵੀਡੀਓ ਵਾਕ-ਥਰੂਜ਼ +## ਵੀਡੀਓ ਵਾਕਥਰੂ -ਕੁੱਝ ਪਾਠ ਛੋਟੀ ਵੀਡੀਓ ਰੂਪ ਵਿੱਚ ਉਪਲਬਧ ਹਨ। ਤੁਸੀਂ ਇਹਨਾਂ ਨੂੰ ਸਿੱਧਾ ਪਾਠਾਂ ਵਿੱਚ ਜਾਂ [ML for Beginners ਪਲੇਲਿਸਟ מਾਈਕ੍ਰੋਸੌਫਟ ਡਿਵੈਲਪਰ YouTube ਚੈਨਲ ਤੇ](https://aka.ms/ml-beginners-videos) ਤੇ ਆਖਲਾ ਇਮੀਜ ਕਲਿੱਕ ਕਰਕੇ ਦੇਖ ਸਕਦੇ ਹੋ। +ਕੁਝ ਪਾਠ ਛੋਟੇ ਵੀਡੀਓ ਰੂਪ ਵਿੱਚ ਉਪਲਬਧ ਹਨ। ਤੁਸੀਂ ਇਹਨਾਂ ਨੂੰ ਪਾਠਾਂ ਵਿੱਚ ਸਿੱਧਾ ਦੇਖ ਸਕਦੇ ਹੋ ਜਾਂ [Microsoft Developer YouTube ਚੈਨਲ 'ਤੇ ML for Beginners ਪਲੇਲਿਸਟ](https://aka.ms/ml-beginners-videos) ’ਤੇ ਚਲਾਉਣ ਲਈ ਹੇਠਾਂ ਦਿੱਤੀ ਤਸਵੀਰ 'ਤੇ ਕਲਿੱਕ ਕਰੋ। -[![ML for beginners banner](../../../../translated_images/pa/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) +[![ML for beginners banner](../../translated_images/pa/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) --- @@ -98,80 +89,80 @@ CO_OP_TRANSLATOR_METADATA: [![Promo video](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) -**ਗਿਫ਼ ਬਾਈ** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) +**ਗਿਫ ਤਿਆਰ ਕੀਤਾ** [ਮੋਹਿਤ ਜੈਸਲ](https://linkedin.com/in/mohitjaisal) -> 🎥 ਉਪਰ ਦਿੱਤੀ ਚਿੱਤਰ ਕਲਿੱਕ ਕਰੋ ਪ੍ਰੋਜੈਕਟ ਤੇ ਇਸਨੂੰ ਬਣਾਉਣ ਵਾਲਿਆਂ ਬਾਰੇ ਵੀਡੀਓ ਲਈ! +> 🎥 ਪ੍ਰੋਜੈਕਟ ਅਤੇ ਬਣਾਉਣ ਵਾਲੇ ਲੋਕਾਂ ਬਾਰੇ ਵੀਡੀਓ ਦੇਖਣ ਲਈ ਉਪਰੋਕਤ ਤਸਵੀਰ ’ਤੇ ਕਲਿੱਕ ਕਰੋ! --- ## ਪੈਡਾਗੋਜੀ -ਇਸ ਪਾਠਕ੍ਰਮ ਨੂੰ ਬਣਾਉਂਦੇ ਹੌਏ ਅਸੀਂ ਦੋ ਪੈਡਾਗੋਜੀਕਲ ਸਿਧਾਂਤ ਚੁਣੇ ਹਨ: ਇਹ ਪੱਕਾ ਕਰਨਾ ਕਿ ਇਹ ਹੱਥਾਂ-ਉੱਤੇ **ਪ੍ਰੋਜੈਕਟ-ਆਧਾਰਿਤ** ਹੈ ਤੇ ਇਸ ਵਿੱਚ ਬਹੁਤ ਵਾਰੀ ਕਵਿਜ਼ ਹੁੰਦੇ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਸ ਪਾਠਕ੍ਰਮ ਦੀ ਇੱਕ ਸਾਂਝੀ **ਥੀਮ** ਵੀ ਹੈ ਜੋ ਇਸਨੂੰ ਇੱਕਜੁਟ ਕਰਦੀ ਹੈ। +ਅਸੀਂ ਇਸ ਕਰਿਕੁਲਮ ਦਾ ਨਿਰਮਾਣ ਕਰਦੇ ਸਮੇਂ ਦੋ ਮੁੱਖ ਅਸੂਲ ਚੁਣੇ ਹਨ: ਇਹ ਹੱਥਾਂ-ਵਿੱਚ-ਹੱਥ ਹੋ ਕੇ **ਪ੍ਰੋਜੈਕਟ-ਅਧਾਰਿਤ** ਹੈ ਅਤੇ ਇਸ ਵਿੱਚ **ਅਕਸਰ ਕੁਇਜ਼** ਸ਼ਾਮਿਲ ਹਨ। ਇਸ ਦੇ ਨਾਲ, ਇਸ ਕਰਿਕੁਲਮ ਵਿੱਚ ਇੱਕ ਸਾਂਝਾ **ਥੀਮ** ਵੀ ਹੈ ਜੋ ਇਸਨੂੰ ਏਕਜੁਟਤਾ ਦਿੰਦਾ ਹੈ। -ਪ੍ਰੋਜੈਕਟਾਂ ਨਾਲ ਸਮੱਗਰੀ ਦੇ ਮੇਲ ਨਾਲ, ਵਿਦਿਆਰਥੀਆਂ ਲਈ ਪ੍ਰਕਿਰਿਆ ਹੋਰ ਮਨੋਹਰ ਬਣਦੀ ਹੈ ਅਤੇ ਸੰਕਲਪਾਂ ਦੀ ਯਾਦ ਦਿਰਘਕਾਲੀ ਹੋ ਜਾਂਦੀ ਹੈ। ਤੱਤਕਾਲੀਨ ਕਲਾਸ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਘੱਟ-ਦਬਾਅ ਵਾਲੀ ਕਵਿਜ਼ ਵਿਦਿਆਰਥੀ ਨੂੰ ਵਿਸ਼ੇ ਸਿੱਖਣ ਲਈ ਤਿਆਰ ਕਰਦੀ ਹੈ, ਜਦੋਂਕਿ ਕਲਾਸ ਦੇ ਬਾਦ ਦੂਜੀ ਕਵਿਜ਼ ਹੋਰ ਧਾਰਨ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਪਾਠਕ੍ਰਮ ਬਹੁਤ ਲਚਕੀਲਾ ਤੇ ਮਜ਼ੇਦਾਰ ਹੈ ਅਤੇ ਤੁਸੀਂ ਇਸਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਜਾਂ ਇਕ ਹਿੱਸਾ ਕਰ ਸਕਦੇ ਹੋ। ਪ੍ਰੋਜੈਕਟ ਛੋਟੇ ਤੋਂ ਸ਼ੁਰੂ ਹੁੰਦੇ ਹਨ ਅਤੇ 12 ਹਫਤਿਆਂ ਦੇ ਸਮਾਪਤੀ ਤੱਕ ਥੋੜ੍ਹੇ-ਥੋੜ੍ਹੇ ਜਟਿਲ ਹੋ ਜਾਂਦੇ ਹਨ। ਇਸ ਪਾਠਕ੍ਰਮ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀ ਹਕੀਕਤੀ ਅਰਜ਼ੀਆਂ 'ਤੇ ਇੱਕ ਪੋਸਟਸਕ੍ਰਿਪਟ ਵੀ ਸ਼ਾਮਲ ਹੈ, ਜਿਸਨੂੰ ਵਾਧੂ ਕ੍ਰੈਡਿਟ ਜਾਂ ਚਰਚਾ ਲਈ ਅਧਾਰ ਵਜੋਂ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ। +ਸਮੱਗਰੀ ਨੂੰ ਪ੍ਰੋਜੈਕਟਾਂ ਨਾਲ ਜੋੜ ਕੇ, ਵਿਦਿਆਰਥੀਆਂ ਲਈ ਪ੍ਰਕਿਰਿਆ ਹੋਰ ਦਿਲਚਸਪ ਬਣਾਈ ਜਾਂਦੀ ਹੈ ਅਤੇ ਧਾਰਨਾ ਨੂੰ ਜ਼ਿਆਦਾ ਸਮਝਿਆ ਜਾਂਦਾ ਹੈ। ਖ਼ਾਸ ਕਰਕੇ, ਇੱਕ ਨਿਮਨ-ਦਾਅਵਾ ਵਾਲਾ ਕੁਇਜ਼ ਕਲਾਸ ਤੋਂ ਪਹਿਲਾਂ ਵਿਦਿਆਰਥੀ ਨੂੰ ਵਿਸ਼ੇ ਸਿੱਖਣ ਲਈ ਮਨ-ਮੱਨ ਕਰਾਉਂਦਾ ਹੈ, ਅਤੇ ਦੂਜਾ ਕੁਇਜ਼ ਕਲਾਸ ਦੇ ਬਾਅਦ ਹੋਰ ਧਾਰਨਾ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦਾ ਹੈ। ਇਸ ਕਰਿਕੁਲਮ ਨੂੰ ਲਚਕੀਲਾ ਅਤੇ ਮਨੋਰੰਜਕ ਬਣਾਇਆ ਗਿਆ ਹੈ ਜੋ ਪੂਰਾ ਜਾਂ ਹਿੱਸੇ ਵਜੋਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਪ੍ਰੋਜੈਕਟ ਛੋਟੇ-ਛੋਟੇ ਅਤੇ 12 ਹਫ਼ਤਿਆਂ ਦੇ ਅੰਤ ਤੱਕ ਬਹੁਤ ਜਟਿਲ ਹੋ ਜਾਂਦੇ ਹਨ। ਇਸ ਕਰਿਕੁਲਮ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਅਸਲ ਦੁਨੀਆ ਦੇ ਅਰਜ਼ੀਆਂ ਤੇ ਇੱਕ ਪੋਸਟਸਕ੍ਰਿਪਟ ਵੀ ਸ਼ਾਮਿਲ ਹੈ, ਜੋ ਵਾਧੂ ਕ੍ਰੈਡਿਟ ਜਾਂ ਚਰਚਾ ਲਈ ਬਨੀਅਾਦ ਦਾ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ। -> ਸਾਡੇ [ਕੋਡ ਆਫ ਕਨਡਕਟ](CODE_OF_CONDUCT.md), [ਯੋਗਦਾਨ](CONTRIBUTING.md), [ਅਨੁਵਾਦ](TRANSLATIONS.md), ਅਤੇ [ਮੁਸ਼ਕਿਲਾਂ ਹੱਲ ਕਰਨ ਦੀ ਗਾਈਡ](TROUBLESHOOTING.md) ਦੇ ਨਿਯਮਾਂ ਨੂੰ ਵੇਖੋ। ਅਸੀਂ ਤੁਹਾਡੇ ਰਚਨਾਤਮਕ ਫੀਡਬੈਕ ਦਾ ਸਵਾਗਤ ਕਰਦੇ ਹਾਂ! +> ਸਾਡਾ [Code of Conduct](CODE_OF_CONDUCT.md), [Contributing](CONTRIBUTING.md), [Translation](TRANSLATIONS.md), ਅਤੇ [Troubleshooting](TROUBLESHOOTING.md) ਮੈਨੂਅਲ ਵੇਖੋ। ਅਸੀਂ ਤੁਹਾਡੇ конструктив ਫੀਡਬੈਕ ਦਾ ਸਵਾਗਤ ਕਰਦੇ ਹਾਂ! -## ਹਰ ਪਾਠ ਵਿੱਚ ਇਹ ਸ਼ਾਮਲ ਹਨ +## ਹਰ ਪਾਠ ਵਿੱਚ ਸ਼ਾਮਿਲ ਹੈ -- ਇੱਛਾ ਅਨੁਸਾਰ ਸਕੈਚਨੋਟ -- ਇੱਛਾ ਅਨੁਸਾਰ ਸਹਾਇਕ ਵੀਡੀਓ -- ਵੀਡੀਓ ਵਾਕ-ਥਰੂ ( ਕੁਝ ਪਾਠਾਂ ਲਈ ) -- [ਪ੍ਰੀ-ਲੈਕਚਰ ਵਾਰਮਅੱਪ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ml/) +- ਵਿਕਲਪੀ ਸਕੇਚਨੋਟ +- ਵਿਕਲਪੀ ਸਹਾਇਕ ਵੀਡੀਓ +- ਵੀਡੀਓ ਵਾਕਥਰੂ (ਕੁਝ ਪਾਠਾਂ ਲਈ) +- [ਪ੍ਰੀ-ਲੈਕਚਰ ਵਰਮਅੱਪ ਕੁਇਜ਼](https://ff-quizzes.netlify.app/en/ml/) - ਲਿਖਤੀ ਪਾਠ -- ਪ੍ਰੋਜੈਕਟ-ਆਧਾਰਤ ਪਾਠਾਂ ਲਈ, ਪ੍ਰੋਜੈਕਟ ਬਣਾਉਣ ਲਈ ਕਦਮ ਦਰ ਕਦਮ ਗਾਈਡ -- ਗਿਆਨ ਜਾਂਚਾਂ -- ਇੱਕ ਚੈਲੇਂਜ -- ਸਹਾਇਕ ਪਾਠ +- ਪ੍ਰੋਜੈਕਟ-ਅਧਾਰਿਤ ਪਾਠਾਂ ਲਈ, ਪਰੋਜੈਕਟ ਬਣਾਉਣ ਦੀ ਵਧੇਰੇ-ਵਧੇਰੇ ਹਦਾਇਤਾਂ +- ਗਿਆਨ ਚੈੱਕ +- ਇੱਕ ਚੈਲੰਜ +- ਸਹਾਇਕ ਪੜ੍ਹਾਈ - ਅਸਾਈਨਮੈਂਟ -- [ਪੋਸਟ-ਲੈਕਚਰ ਕਵਿਜ਼](https://ff-quizzes.netlify.app/en/ml/) - -> **ਭਾਸ਼ਾਵਾਂ ਬਾਰੇ ਇੱਕ ਨੋਟ**: ਇਹ ਪਾਠ ਜ਼ਿਆਦਾਤਰ ਪਾਇਥਨ ਵਿੱਚ ਲਿਖੇ ਗਏ ਹਨ, ਪਰ ਕਈ R ਵਿੱਚ ਵੀ ਉਪਲਬਧ ਹਨ। R ਪਾਠ ਪੂਰਾ ਕਰਨ ਲਈ `/solution` ਫੋਲਡਰ ਵਿੱਚ R ਪਾਠ ਲੱਭੋ। ਇਹਨਾਂ ਵਿੱਚ .rmd ਐਕਸਟੈਂਸ਼ਨ ਹੁੰਦਾ ਹੈ ਜੋ ਇੱਕ **R ਮਾਰਕਡਾਊਨ** ਫਾਇਲ ਨੁਮਾਇੰਦਗੀ ਕਰਦਾ ਹੈ, ਜੋ `ਕੋਡ ਚੰਕਸ` (R ਜਾਂ ਹੋਰ ਭਾਸ਼ਾਵਾਂ ਦੇ) ਅਤੇ `YAML ਹੈਡਰ` (ਜੋ PDF ਵਰਗੇ ਨਤੀਜੇ ਫਾਰਮੈਟ ਕਰਨਾ ਦਿਖਾਉਂਦਾ ਹੈ) ਨੂੰ ਮਾਰਕਡਾਊਨ ਡੌਕਯੂਮੈਂਟ ਵਿੱਚ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ, ਇਹ ਡਾਟਾ ਸਾਇੰਸ ਲਈ ਇੱਕ ਅਦਭੁਤ ਲੇਖਨ ਫਰੇਮਵਰਕ ਹੈ ਕਿਉਂਕਿ ਤੁਸੀਂ ਆਪਣੇ ਕੋਡ, ਉਸਦਾ ਨਤੀਜਾ ਅਤੇ ਆਪਣੇ ਵਿਚਾਰ ਇੱਕਠੇ ਕਰਕੇ ਮਾਰਕਡਾਊਨ ਵਿੱਚ ਲਿਖ ਸਕਦੇ ਹੋ। ਇਨ੍ਹਾਂ R ਮਾਰਕਡਾਊਨ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ PDF, HTML ਜਾਂ ਵਰਡ ਵਰਗੇ ਆઉਟਪੁਟ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਰੇਂਡਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। -> **ਕੁਇਜ਼ਾਂ ਬਾਰੇ ਇੱਕ ਨੋਟ**: ਸਾਰੇ ਕੁਇਜ਼ [Quiz App ਫੋਲਡਰ](../../quiz-app) ਵਿੱਚ ਹਨ, ਜਿੱਥੇ ਕੁੱਲ 52 ਕੁਇਜ਼ ਹਨ ਹਰ ਇੱਕ ਵਿੱਚ ਤਿੰਨ ਸਵਾਲ ਹਨ। ਇਹ ਸਬਕਾਂ ਵਿੱਚ ਲਿੰਕ ਕੀਤੇ ਗਏ ਹਨ ਪਰ ਕੁਇਜ਼ ਐਪ ਨੂੰ ਲੋਕਲ ਤੌਰ ਤੇ ਚਲਾਇਆ ਜਾ ਸਕਦਾ ਹੈ; ਲੋਕਲ ਹੋਸਟ ਕਰਨ ਜਾਂ Azure 'ਤੇ ਡਿਪਲੋ ਕਰਨ ਲਈ `quiz-app` ਫੋਲਡਰ ਵਿੱਚ ਦਿੱਤੇ ਹਦਾਇਤਾਂ ਦਾ ਪਾਲਣ ਕਰੋ। - -| ਸਬਕ ਨੰਬਰ | ਵਿਸ਼ਾ | ਸਬਕ ਗਰੁੱਪਿੰਗ | ਸਿਖਲਾਈ ਉਦੇਸ਼ | ਲਿੰਕ ਕੀਤੇ ਸਬਕ | ਲੇਖਕ | -| :--------: | :---------------------------------------------------------------: | :-----------------------------------------------: | ---------------------------------------------------------------------------------------------------------------------------- | :---------------------------------------------------------------------------------------------------------------------------------: | :-------------------------------------------: | -| 01 | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ | [Introduction](1-Introduction/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਮੂਲ ਭਾਵਨਾਂ ਨੂੰ ਸਿੱਖੋ | [Lesson](1-Introduction/1-intro-to-ML/README.md) | ਮੁਹੰਮਦ | -| 02 | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਇਤਿਹਾਸ | [Introduction](1-Introduction/README.md) | ਇਸ ਖੇਤਰ ਦਾ ਇਤਿਹਾਸ ਸਿੱਖੋ | [Lesson](1-Introduction/2-history-of-ML/README.md) | ਜੇਨ ਅਤੇ ਐਮੀ | -| 03 | ਨਿਆਂ ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ | [Introduction](1-Introduction/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਬਣਾਉਣ ਅਤੇ ਲਾਗੂ ਕਰਦੇ ਸਮੇਂ ਨਿਆਂ ਨਾਲ ਸਬੰਧਤ ਮਹੱਤਵਪੂਰਨ ਦਰਸ਼ਨੀ ਸਵਾਲ ਕੀਹ ਹਨ, ਜੋ ਵਿਦਿਆਰਥੀਆਂ ਨੂੰ ਸੋਚਣੇ ਚਾਹੀਦੇ ਹਨ? | [Lesson](1-Introduction/3-fairness/README.md) | 토모미 | -| 04 | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਤਕਨੀਕਾਂ | [Introduction](1-Introduction/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਖੋਜਕਰਤਾ ਕਿਹੜੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਮਾਡਲ ਬਣਾਉਣ ਲਈ? | [Lesson](1-Introduction/4-techniques-of-ML/README.md) | ਕ੍ਰਿਸ ਅਤੇ ਜੇਨ | -| 05 | ਰਿਗ੍ਰੈਸ਼ਨ ਦਾ ਪਰਿਚਯ | [Regression](2-Regression/README.md) | ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲਾਂ ਲਈ ਪਾਇਥਨ ਅਤੇ ਸਕਿਕਿਟ-ਲਰਨ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰੋ | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | ਜੇਨ • ਐਰਿਕ ਵੰਜਾਉ | -| 06 | ਉੱਤਰੀ ਅਮਰੀਕੀ ਕਦੂਆਂ ਦੀ ਕੀਮਤਾਂ 🎃 | [Regression](2-Regression/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਡੇਟਾ ਨੂੰ ਦ੍ਰਿਸ਼ਟੀਗਤ ਅਤੇ ਸਾਫ਼ ਕਰੋ | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | ਜੇਨ • ਐਰਿਕ ਵੰਜਾਉ | -| 07 | ਉੱਤਰੀ ਅਮਰੀਕੀ ਕਦੂਆਂ ਦੀ ਕੀਮਤਾਂ 🎃 | [Regression](2-Regression/README.md) | ਲੀਨੀਅਰ ਅਤੇ ਪੋਲਿਨੋਮੀਅਲ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਓ | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | ਜੇਨ ਅਤੇ ਦਿਮਿਤਰੀ • ਐਰਿਕ ਵੰਜਾਉ | -| 08 | ਉੱਤਰੀ ਅਮਰੀਕੀ ਕਦੂਆਂ ਦੀ ਕੀਮਤਾਂ 🎃 | [Regression](2-Regression/README.md) | ਲੋਜਿਸਟਿਕ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਓ | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | ਜੇਨ • ਐਰਿਕ ਵੰਜਾਉ | -| 09 | ਵੈੱਬ ਐਪ 🔌 | [Web App](3-Web-App/README.md) | ਆਪਣੇ ਪ੍ਰਸ਼ਿਖਤ ਮਾਡਲ ਲਈ ਵੈੱਬ ਐਪ ਬਣਾਓ | [Python](3-Web-App/1-Web-App/README.md) | ਜੇਨ | -| 10 | ਵਰਗੀਕਰਨ ਦਾ ਪਰਿਚਯ | [Classification](4-Classification/README.md) | ਆਪਣਾ ਡੇਟਾ ਸਾਫ਼ ਕਰੋ, ਤਿਆਰ ਕਰੋ ਅਤੇ ਵਿਜ਼ੂਅਲਾਈਜ਼ ਕਰੋ; ਵਰਗੀਕਰਨ ਦਾ ਪਰਿਚਯ | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | ਜੇਨ ਅਤੇ ਕੈਸੀ • ਐਰਿਕ ਵੰਜਾਉ | -| 11 | ਲਜ਼ੀਜ਼ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਭੋਜਨ 🍜 | [Classification](4-Classification/README.md) | ਵਰਗੀਕਰਤਾ ਦਾ ਪਰਿਚਯ | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | ਜੇਨ ਅਤੇ ਕੈਸੀ • ਐਰਿਕ ਵੰਜਾਉ | -| 12 | ਲਜ਼ੀਜ਼ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਭੋਜਨ 🍜 | [Classification](4-Classification/README.md) | ਹੋਰ ਵਰਗੀਕਰਤਾ | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | ਜੇਨ ਅਤੇ ਕੈਸੀ • ਐਰਿਕ ਵੰਜਾਉ | -| 13 | ਲਜ਼ੀਜ਼ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਭੋਜਨ 🍜 | [Classification](4-Classification/README.md) | ਆਪਣੇ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਰੇਕਮੈਂਡਰ ਵੈੱਬ ਐਪ ਬਣਾਓ | [Python](4-Classification/4-Applied/README.md) | ਜੇਨ | -| 14 | ਕਲੱਸਟਰਿੰਗ ਦਾ ਪਰਿਚਯ | [Clustering](5-Clustering/README.md) | ਆਪਣਾ ਡੇਟਾ ਸਾਫ਼ ਕਰੋ, ਤਿਆਰ ਕਰੋ ਅਤੇ ਵਿਜ਼ੂਅਲਾਈਜ਼ ਕਰੋ; ਕਲੱਸਟਰਿੰਗ ਦਾ ਪਰਿਚਯ | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | ਜੇਨ • ਐਰਿਕ ਵੰਜਾਉ | -| 15 | ਨਾਈਜੀਰੀਆਈ ਸੰਗੀਤਿਕ ਸੁਆਦ ਦੀ ਖੋਜ 🎧 | [Clustering](5-Clustering/README.md) | ਕੇ-ਮੀਨਜ਼ ਕਲੱਸਟਰਿੰਗ ਵਿਧੀ ਦੀ ਖੋਜ ਕਰੋ | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | ਜੇਨ • ਐਰਿਕ ਵੰਜਾਉ | -| 16 | ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰੋਸੈਸਿੰਗ ਦਾ ਪਰਿਚਯ ☕️ | [Natural language processing](6-NLP/README.md) | ਸਾਦਾ ਬੋਟ ਬਣਾਕੇ NLP ਬਾਰੇ ਬੁਨਿਆਦੀ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰੋ | [Python](6-NLP/1-Introduction-to-NLP/README.md) | ਸਟੀਫਨ | -| 17 | ਆਮ NLP ਕਾਰਜ ☕️ | [Natural language processing](6-NLP/README.md) | ਭਾਸ਼ਾ ਦੀਆਂ ਸੰਰਚਨਾਵਾਂ ਨਾਲ ਨਜਿੱਠਣ ਸਮੇਂ ਲੋੜੀਂਦੇ ਆਮ ਕਾਰਜਾਂ ਨੂੰ ਸਮਝਕੇ NLP ਗਿਆਨ ਨੂੰ ਡੂੰਘਾ ਕਰੋ | [Python](6-NLP/2-Tasks/README.md) | ਸਟੀਫਨ | -| 18 | ਅਨੁਵਾਦ ਅਤੇ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ ♥️ | [Natural language processing](6-NLP/README.md) | ਜੇਨ ਆਸਟਿਨ ਨਾਲ ਅਨੁਵਾਦ ਅਤੇ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ | [Python](6-NLP/3-Translation-Sentiment/README.md) | ਸਟੀਫਨ | -| 19 | ਯੂਰਪ ਦੇ ਰੋਮਾਂਟਿਕ ਹੋਟਲ ♥️ | [Natural language processing](6-NLP/README.md) | 1-ਹੋਟਲ ਸਮੀਖਿਆਵਾਂ ਨਾਲ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | ਸਟੀਫਨ | -| 20 | ਯੂਰਪ ਦੇ ਰੋਮਾਂਟਿਕ ਹੋਟਲ ♥️ | [Natural language processing](6-NLP/README.md) | 2-ਹੋਟਲ ਸਮੀਖਿਆਵਾਂ ਨਾਲ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | ਸਟੀਫਨ | -| 21 | ਸਮੇਂ ਦੀ ਲੜੀ ਅਨੁਮਾਨ ਦਾ ਪਰਿਚਯ | [Time series](7-TimeSeries/README.md) | ਸਮੇਂ ਦੀ ਲੜੀ ਅਨੁਮਾਨ ਦਾ ਪਰਿਚਯ | [Python](7-TimeSeries/1-Introduction/README.md) | ਫਰਾਂਸੇਸਕਾ | -| 22 | ⚡️ ਦੁਨੀਆ ਦੀ ਬਿਜਲੀ ਖਪਤ ⚡️ - ARIMA ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਅਨੁਮਾਨ | [Time series](7-TimeSeries/README.md) | ARIMA ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਅਨੁਮਾਨ | [Python](7-TimeSeries/2-ARIMA/README.md) | ਫਰਾਂਸੇਸਕਾ | -| 23 | ⚡️ ਦੁਨੀਆ ਦੀ ਬਿਜਲੀ ਖਪਤ ⚡️ - SVR ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਅਨੁਮਾਨ | [Time series](7-TimeSeries/README.md) | ਸਪੋਰਟ ਵੈਕਟਰ ਰਿਗ੍ਰੈਸ਼ਨਰ ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਅਨੁਮਾਨ | [Python](7-TimeSeries/3-SVR/README.md) | ਅਨੀਰਬਨ | -| 24 | ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ | [Reinforcement learning](8-Reinforcement/README.md) | Q-ਲਰਨਿੰਗ ਨਾਲ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ | [Python](8-Reinforcement/1-QLearning/README.md) | ਦਿਮਿਤਰੀ | -| 25 | ਪੀਟਰ ਨੂੰ ਭੇਡੀ ਤੋਂ ਬਚਾਓ! 🐺 | [Reinforcement learning](8-Reinforcement/README.md) | ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਜਿਮ | [Python](8-Reinforcement/2-Gym/README.md) | ਦਿਮਿਤਰੀ | -| ਪੋਸਟਸਕ੍ਰਿਪਟ | ਅਸਲੀ ਦੁਨੀਆ ਵਿੱਚ ML ਦੀਆਂ ਸਥਿਤੀਆਂ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ | [ML in the Wild](9-Real-World/README.md) | ਕਲਾਸਿਕਲ ML ਦੀਆਂ ਦਿਲਚਸਪ ਅਤੇ ਖੁਲਾਸਾ ਕਰਨ ਵਾਲੀਆਂ ਅਸਲੀ ਦੁਨੀਆ ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ | [Lesson](9-Real-World/1-Applications/README.md) | ਟੀਮ | -| ਪੋਸਟਸਕ੍ਰਿਪਟ | RAI ਡੈਸ਼ਬੋਰਡ ਨਾਲ ML ਵਿੱਚ ਮਾਡਲ ਡੀਬੱਗਿੰਗ | [ML in the Wild](9-Real-World/README.md) | ਜ਼ਿੰਮੇਵਾਰ AI ਡੈਸ਼ਬੋਰਡ ਕੰਪੋਨੈਂਟ ਦੀ ਵਰਤੋਂ ਨਾਲ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਮਾਡਲ ਡੀਬੱਗਿੰਗ | [Lesson](9-Real-World/2-Debugging-ML-Models/README.md) | ਰੁਥ ਯਾਕੁਬੂ | - -> [ਇਸ ਕੋਰਸ ਲਈ ਸਾਰੇ ਵਾਧੂ ਸਰੋਤ ਸਾਡੇ Microsoft Learn ਕਲੇਕਸ਼ਨ ਵਿੱਚ ਲੱਭੋ](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) +- [ਪੋਸਟ-ਲੈਕਚਰ ਕੁਇਜ਼](https://ff-quizzes.netlify.app/en/ml/) + +> **ਭਾਸ਼ਾਵਾਂ ਬਾਰੇ ਇੱਕ ਨੋਟ**: ਇਹ ਪਾਠ ਮੁੱਖਤੌਰ 'ਤੇ Python ਵਿੱਚ ਲਿਖੇ ਗਏ ਹਨ, ਪਰ ਬਹੁਤ ਸਾਰੇ R ਵਿੱਚ ਵੀ ਉਪਲਬਧ ਹਨ। R ਪਾਠ ਪੂਰਾ ਕਰਨ ਲਈ, `/solution` ਫੋਲਡਰ ਵਿੱਚ ਜਾਓ ਅਤੇ R ਪਾਠਾਂ ਨੂੰ ਲੱਭੋ। ਇਹਨਾਂ ਵਿੱਚ .rmd ਐਕਸਟੈਂਸ਼ਨ ਹੁੰਦਾ ਹੈ ਜੋ **R Markdown** ਫਾਇਲ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ `code chunks` (R ਜਾਂ ਹੋਰ ਭਾਸ਼ਾਵਾਂ ਦੇ) ਅਤੇ ਇੱਕ `YAML ਹੈਡਰ` ਰੱਖਦਾ ਹੈ (ਜੋ PDF ਵਰਗੇ ਆਉਟਪੁੱਟਾਂ ਨੂੰ ਫਾਰਮੈਟ ਕਰਦਾ ਹੈ) ਇੱਕ `Markdown ਡੌਕਯੂਮੈਂਟ` ਵਿੱਚ ਮਿਲ ਕੇ। ਇਸ ਤਰ੍ਹਾਂ, ਇਹ ਡਾਟਾ ਸਾਇੰਸ ਲਈ ਇੱਕ ਸਰਵੋਤਮ ਲੇਖਕ ਫਰੇਮਵਰਕ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਤੁਹਾਡੇ ਕੋਡ, ਇਸਦਾ ਨਤੀਜਾ ਅਤੇ ਤੁਹਾਡੇ ਵਿਚਾਰਾਂ ਨੂੰ ਇੱਕਸਾਥ ਕਰਦਾ ਹੈ ਅਤੇ ਤੁਸੀਂ Markdown ਵਿੱਚ ਲਿਖ ਸਕਦੇ ਹੋ। ਇਸ ਤੋਂ ਇਲਾਵਾ, R Markdown ਡੌਕਯੂਮੈਂਟ PDF, HTML ਜਾਂ Word ਵਰਗੇ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ। +> **ਕਵਿਜ਼ਾਂ ਬਾਰੇ ਇੱਕ ਨੋਟ**: ਸਾਰੀਆਂ ਕਵਿਜ਼ਾਂ [Quiz App ਫੋਲਡਰ](../../quiz-app) ਵਿੱਚ ਹਨ, ਹਰ ਇੱਕ ਵਿੱਚ ਤਿੰਨ ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਨਾਲ ਕੁੱਲ 52 ਕਵਿਜ਼ ਹਨ। ਇਹਨਾਂ ਨੂੰ ਪਾਠਾਂ ਵਿੱਚ ਲਿੰਕ ਕੀਤਾ ਗਿਆ ਹੈ ਪਰ ਕਵਿਜ਼ ਐਪ ਲੋਕਲ ਤੌਰ 'ਤੇ ਚਲਾਈ ਜਾ ਸਕਦੀ ਹੈ; ਲੋਕਲ ਤੌਰ 'ਤੇ ਹੋਸਟ ਕਰਨ ਜਾਂ Azure 'ਤੇ ਡਿਪਲੌਇ ਕਰਨ ਲਈ `quiz-app` ਫੋਲਡਰ ਵਿੱਚ ਦਿੱਤੇ ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰੋ। + +| ਪਾਠ ਅੰਕ | ਵਿਸ਼ਾ | ਪਾਠ ਸਮੂਹ | ਸਿੱਖਣ ਦੇ ਉਦੇਸ਼ | ਲਿੰਕ ਕੀਤਾ ਪਾਠ | ਲੇਖਕ | +| :------: | :------------------------------------------------------------: | :-----------------------------------------------: | --------------------------------------------------------------------------------------------------------------------------- | :----------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------------------: | +| 01 | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ | [Introduction](1-Introduction/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਮੁਢਲੀਆਂ ਧਾਰਨਾਵਾਂ ਨੂੰ ਸਿੱਖੋ | [Lesson](1-Introduction/1-intro-to-ML/README.md) | ਮੁਹੰਮਦ | +| 02 | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਇਤਿਹਾਸ | [Introduction](1-Introduction/README.md) | ਇਸ ਖੇਤਰ ਦੇ ਇਤਿਹਾਸ ਨੂੰ ਸਮਝੋ | [Lesson](1-Introduction/2-history-of-ML/README.md) | ਜੈਨ ਅਤੇ ਐਮੀ | +| 03 | ਨਿਆਇਕਤਾ ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ | [Introduction](1-Introduction/README.md) | ਨਿਆਇਕਤਾ ਦੇ ਸੌਂਦਰਵਿਕ ਮੁੱਦੇ ਕੀ ਹਨ ਜੋ ਵਿਦਿਆਰਥੀਆਂ ਨੂੰ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲ ਬਣਾਉਣ ਤੇ ਲਾਗੂ ਕਰਨ ਸਮੇਂ ਧਿਆਨ ਵਿੱਚ ਰੱਖਣੇ ਚਾਹੀਦੇ ਹਨ? | [Lesson](1-Introduction/3-fairness/README.md) | ਟੋਮੋਮੀ | +| 04 | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀਆਂ ਤਕਨੀਕਾਂ | [Introduction](1-Introduction/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਖੋਜਕਰਤਾ ਕਿਹੜੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਬਣਾਉਂਦੇ ਹਨ? | [Lesson](1-Introduction/4-techniques-of-ML/README.md) | ਕ੍ਰਿਸ ਅਤੇ ਜੈਨ | +| 05 | ਰਿਗ੍ਰੈਸ਼ਨ ਦਾ ਪਰਿਚਯ | [Regression](2-Regression/README.md) | ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲਾਂ ਲਈ Python ਅਤੇ Scikit-learn ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰੋ | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | ਜੈਨ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 06 | ਉੱਤਰ ਅਮਰੀਕੀ ਕੱਦੂ ਦੀ ਕੀਮਤਾਂ 🎃 | [Regression](2-Regression/README.md) | ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਲਈ ਡਾਟਾ ਨੂੰ ਵੇਖੋ ਅਤੇ ਸਾਫ਼ ਕਰੋ | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | ਜੈਨ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 07 | ਉੱਤਰ ਅਮਰੀਕੀ ਕੱਦੂ ਦੀ ਕੀਮਤਾਂ 🎃 | [Regression](2-Regression/README.md) | ਰੇਖੀ ਅਤੇ ਬਹੁਪਦ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਓ | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | ਜੈਨ ਅਤੇ ਦਿਮਿਤਰੀ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 08 | ਉੱਤਰ ਅਮਰੀਕੀ ਕੱਦੂ ਦੀ ਕੀਮਤਾਂ 🎃 | [Regression](2-Regression/README.md) | ਇੱਕ ਲੌਜਿਸਟਿਕ ਰਿਗ੍ਰੈਸ਼ਨ ਮਾਡਲ ਬਣਾਓ | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | ਜੈਨ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 09 | ਇੱਕ ਵੈੱਬ ਐਪ 🔌 | [Web App](3-Web-App/README.md) | ਆਪਣਾ ਪ੍ਰਸ਼ਿੱਖਤ ਮਾਡਲ ਵਰਤਣ ਲਈ ਵੈੱਬ ਐਪ ਬਣਾਓ | [Python](3-Web-App/1-Web-App/README.md) | ਜੈਨ | +| 10 | ਵੈਰਗੀਕਰਨ ਦਾ ਪਰਿਚਯ | [Classification](4-Classification/README.md) | ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਸਾਫ਼, ਤਿਆਰ ਕਰੋ ਅਤੇ ਵੇਖੋ; ਵੈਰਗੀਕਰਨ ਦਾ ਪਰਿਚਯ | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | ਜੈਨ ਅਤੇ ਕੈਸੀ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 11 | ਸੁਆਦਿਸ਼ਟ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਖਾਣੇ 🍜 | [Classification](4-Classification/README.md) | ਕਲਾਸੀਫਾਇਰਜ਼ ਦਾ ਪਰਿਚਯ | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | ਜੈਨ ਅਤੇ ਕੈਸੀ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 12 | ਸੁਆਦਿਸ਼ਟ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਖਾਣੇ 🍜 | [Classification](4-Classification/README.md) | ਹੋਰ ਕਲਾਸੀਫਾਇਰਜ਼ | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | ਜੈਨ ਅਤੇ ਕੈਸੀ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 13 | ਸੁਆਦਿਸ਼ਟ ਏਸ਼ੀਆਈ ਅਤੇ ਭਾਰਤੀ ਖਾਣੇ 🍜 | [Classification](4-Classification/README.md) | ਆਪਣੇ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਇੱਕ ਸਿਫਾਰਸ਼ੀ ਵੈੱਬ ਐਪ ਬਣਾਓ | [Python](4-Classification/4-Applied/README.md) | ਜੈਨ | +| 14 | ਗੂੰਦਿਆਂ ਦਾ ਪਰਿਚਯ | [Clustering](5-Clustering/README.md) | ਆਪਣੇ ਡਾਟਾ ਨੂੰ ਸਾਫ਼, ਤਿਆਰ ਕਰੋ ਅਤੇ ਵੇਖੋ; ਗੂੰਦਿਆਂ ਦਾ ਪਰਿਚਯ | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | ਜੈਨ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 15 | ਨਾਈਜੇਰੀਆਈ ਸੰਗੀਤਕ ਰੁਚੀਆਂ ਦੀ ਖੋਜ 🎧 | [Clustering](5-Clustering/README.md) | K-Means ਗੂੰਦਿਆਂ ਦੀ ਵਿਧੀ ਦਾ ਪਤਾ ਲਗਾਓ | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | ਜੈਨ • ਐਰਿਕ ਵਾਂਜਾਊ | +| 16 | ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਪ੍ਰਕਿਰਿਆ ਦਾ ਪਰਿਚਯ ☕️ | [Natural language processing](6-NLP/README.md) | ਇੱਕ ਸਾਦਾ ਬੋਟ ਬਣਾ ਕੇ NLP ਦੀਆਂ ਬੁਨਿਆਦੀਆਂ ਸਿੱਖੋ | [Python](6-NLP/1-Introduction-to-NLP/README.md) | ਸਟੀਫਨ | +| 17 | ਆਮ NLP ਕਾਰਜ ☕️ | [Natural language processing](6-NLP/README.md) | ਭਾਸ਼ਾ ਦੀਆਂ ਰਚਨਾਵਾਂ ਨਾਲ ਨਜਿੱਠਣ ਲਈ ਲੋੜੀਂਦੇ ਆਮ ਕਾਰਜਾਂ ਦੀ ਸਮਝ ਵਧਾਓ | [Python](6-NLP/2-Tasks/README.md) | ਸਟੀਫਨ | +| 18 | ਅਨੁਵਾਦ ਅਤੇ ਭਾਵਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ ♥️ | [Natural language processing](6-NLP/README.md) | ਜੇਨ ਆਸਟਿਨ ਨਾਲ ਅਨੁਵਾਦ ਅਤੇ ਭਾਵਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ | [Python](6-NLP/3-Translation-Sentiment/README.md) | ਸਟੀਫਨ | +| 19 | ਯੂਰਪ ਦੇ ਪ੍ਰੇਮਮਈ ਹੋਟਲ ♥️ | [Natural language processing](6-NLP/README.md) | ਹੋਟਲ ਸਮੀਖਿਆਵਾਂ ਨਾਲ ਭਾਵਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | ਸਟੀਫਨ | +| 20 | ਯੂਰਪ ਦੇ ਪ੍ਰੇਮਮਈ ਹੋਟਲ ♥️ | [Natural language processing](6-NLP/README.md) | ਹੋਟਲ ਸਮੀਖਿਆਵਾਂ ਨਾਲ ਭਾਵਨਾਤਮਕ ਵਿਸ਼ਲੇਸ਼ਣ 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | ਸਟੀਫਨ | +| 21 | ਸਮੇਂ ਦੀ ਲੜੀ ਭਵਿੱਖਵਾਣੀ ਦਾ ਪਰਿਚਯ | [Time series](7-TimeSeries/README.md) | ਸਮੇਂ ਦੀ ਲੜੀ ਭਵਿੱਖਵਾਣੀ ਦਾ ਪਰਿਚਯ | [Python](7-TimeSeries/1-Introduction/README.md) | ਫਰਾਂਸਿਸਕਾ | +| 22 | ⚡️ ਵਿਸ਼ਵ ਬਿਜਲੀ ਖਪਤ ⚡️ - ARIMA ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਭਵਿੱਖਵਾਣੀ | [Time series](7-TimeSeries/README.md) | ARIMA ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਭਵਿੱਖਵਾਣੀ | [Python](7-TimeSeries/2-ARIMA/README.md) | ਫਰਾਂਸਿਸਕਾ | +| 23 | ⚡️ ਵਿਸ਼ਵ ਬਿਜਲੀ ਖਪਤ ⚡️ - SVR ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਭਵਿੱਖਵਾਣੀ | [Time series](7-TimeSeries/README.md) | Support Vector Regressor ਨਾਲ ਸਮੇਂ ਦੀ ਲੜੀ ਭਵਿੱਖਵਾਣੀ | [Python](7-TimeSeries/3-SVR/README.md) | ਅਨੀਰਬਨ | +| 24 | ਰੀਇੰਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ | [Reinforcement learning](8-Reinforcement/README.md) | Q-Learning ਨਾਲ ਰੀਇੰਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦਾ ਪਰਿਚਯ | [Python](8-Reinforcement/1-QLearning/README.md) | ਦਿਮਿਤਰੀ | +| 25 | ਪੀਟਰ ਨੂੰ ਭੇਦੀਆ ਤੋਂ ਬਚਾਓ! 🐺 | [Reinforcement learning](8-Reinforcement/README.md) | ਰੀਇੰਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਜਿਮ | [Python](8-Reinforcement/2-Gym/README.md) | ਦਿਮਿਤਰੀ | +| ਪੋਸਟਸਕ੍ਰਿਪਟ | ਅਸਲੀ ਦੁਨੀਆ ਦੇ ML ਸਹੂਲਤਾਂ ਅਤੇ ਇਸ਼ਤੇਮਾਲ | [ML in the Wild](9-Real-World/README.md) | ਪ੍ਰਾਚੀਨ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੇ ਦਿਲਚਸਪ ਅਤੇ ਖੁਲਾਸਾ ਕਰਦੇ ਅਸਲੀ ਦੁਨੀਆ ਦੇ ਇਸ਼ਤੇਮਾਲ | [Lesson](9-Real-World/1-Applications/README.md) | ਟੀਮ | +| ਪੋਸਟਸਕ੍ਰਿਪਟ | RAI ਡੈਸ਼ਬੋਰਡ ਨਾਲ ML ਮਾਡਲ ਡਿਬੱਗਿੰਗ | [ML in the Wild](9-Real-World/README.md) | ਜ਼ਿੰਮੇਵਾਰ AI ਡੈਸ਼ਬੋਰਡ ਕੰਪੋਨੈਂਟ ਦੀ ਵਰਤੋਂ ਨਾਲ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਮਾਡਲ ਡਿਬੱਗਿੰਗ | [Lesson](9-Real-World/2-Debugging-ML-Models/README.md) | ਰੁਥ ਯਾਕੁਬੂ | + +> [ਇਸ ਕੋਰਸ ਲਈ ਸਾਰੇ ਵਾਧੂ ਸਰੋਤ ਮਾਈਕ੍ਰੋਸੌਫਟ ਲਰਨ ਕਲੈਕਸ਼ਨ ਵਿੱਚ ਲੱਭੋ](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) ## ਅਫਲਾਈਨ ਪਹੁੰਚ -ਤੁਸੀਂ [Docsify](https://docsify.js.org/#/) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਹ ਦਸਤਾਵੇਜ਼ ਅਫਲਾਈਨ ਚਲਾ ਸਕਦੇ ਹੋ। ਇਸ ਰਿਪੋ ਨੂੰ ਫੋਰਕ ਕਰੋ, [Docsify ਇੰਸਟਾਲ ਕਰੋ](https://docsify.js.org/#/quickstart) ਆਪਣੇ ਲੋਕਲ ਮਸ਼ੀਨ 'ਤੇ, ਅਤੇ ਫਿਰ ਇਸ ਰਿਪੋ ਦੇ ਰੂਟ ਫੋਲਡਰ ਵਿੱਚ `docsify serve` ਟਾਈਪ ਕਰੋ। ਵੈਬਸਾਈਟ ਤੁਹਾਡੇ ਲੋਕਲਹੋਸਟ ਦੇ 3000 ਪੋਰਟ 'ਤੇ ਸਰਵ ਕੀਤੀ ਜਾਵੇਗੀ: `localhost:3000`। +ਤੁਸੀਂ ਇਹ ਦਸਤਾਵੇਜ਼ੀਕਰਨ [Docsify](https://docsify.js.org/#/) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਫਲਾਈਨ ਚਲਾ ਸਕਦੇ ਹੋ। ਇਸ ਰੀਪੋ ਨੂੰ ਫੋਰਕ ਕਰੋ, [Docsify ਇੰਸਟਾਲ ਕਰੋ](https://docsify.js.org/#/quickstart) ਆਪਣੇ ਲੋਕਲ ਮਸ਼ੀਨ 'ਤੇ, ਤੇ ਫਿਰ ਇਸ ਰੀਪੋ ਦੇ ਰੂਟ ਫੋਲਡਰ ਵਿੱਚ `docsify serve` ਟਾਈਪ ਕਰੋ। ਵੈੱਬਸਾਈਟ ਤੁਹਾਡੇ ਲੋਕਲਹੋਸਟ `localhost:3000` ਤੇ ਪੋਰਟ 3000 'ਤੇ ਚਲਾਈ ਜਾਵੇਗੀ। -## ਪੀ.ਡੀ.ਐਫ. +## PDF ਫਾਈਲਾਂ -ਪਾਠਕ੍ਰਮ ਦੀ ਪੀਡੀਐਫ਼ ਲਿੰਕਾਂ ਸਮੇਤ [ਇੱਥੇ](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf) ਲੱਭੋ। +ਕਰੀਕੁਲਮ ਦੀ ਇੱਕ PDF ਲੰਕਾਂ ਸਮੇਤ [ਇੱਥੇ](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf) ਲੱਭੋ। -## 🎒 ਹੋਰ ਕੋਰਸ +## 🎒 ਹੋਰ ਕੋਰਸز -ਸਾਡੀ ਟੀਮ ਹੋਰ ਕੋਰਸ ਵੀ ਉਤਪਾਦਤ ਕਰਦੀ ਹੈ! ਚੈੱਕ ਕਰੋ: +ਸਾਡੀ ਟੀਮ ਹੋਰ ਕੋਰਸ ਵੀ ਬਣਾਉਂਦੀ ਹੈ! ਇਹਨਾਂ ਨੂੰ ਦੇਖੋ: ### LangChain @@ -189,43 +180,43 @@ CO_OP_TRANSLATOR_METADATA: --- ### Generative AI Series -[![ਨਵੇਂ ਸਿਖਿਆਰਥੀਆਂ ਲਈ ਬਣਾਉਂਦੇ AI](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਿਆਰਥੀਆਂ ਲਈ ਬਣਾਉਂਦੇ AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਿਆਰਥੀਆਂ ਲਈ ਬਣਾਉਂਦੇ AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਿਆਰਥੀਆਂ ਲਈ ਬਣਾਉਂਦੇ AI (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) +[![Generative AI for Beginners](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) +[![Generative AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) +[![Generative AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) +[![Generative AI (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) --- ### ਮੁੱਖ ਸਿੱਖਿਆ -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ ਮਸ਼ੀਨ ਲਰਨਿੰਗ](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ ਡਾਟਾ ਸਾਇੰਸ](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ AI](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ ਸਾਇਬਰ ਸੁਰੱਖਿਆ](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ ਵੈੱਬ ਵਿਕਾਸ](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ IoT](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) -[![ਨਵੇਂ ਸਿਖਣ ਵਾਲਿਆਂ ਲਈ XR ਵਿਕਾਸ](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) +[![ML for Beginners](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) +[![Data Science for Beginners](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) +[![AI for Beginners](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) +[![Cybersecurity for Beginners](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) +[![Web Dev for Beginners](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) +[![IoT for Beginners](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) +[![XR Development for Beginners](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) --- ### ਕੋਪਾਇਲਟ ਸੀਰੀਜ਼ -[![AI ਜੋੜੀ ਪ੍ਰੋਗ੍ਰਾਮਿੰਗ ਲਈ ਕੋਪਾਇਲਟ](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) -[![C#/.NET ਲਈ ਕੋਪਾਇਲਟ](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) -[![ਕੋਪਾਇਲਟ ਅਡਵੈਂਚਰ](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) +[![Copilot for AI Paired Programming](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) +[![Copilot for C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) +[![Copilot Adventure](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) -## ਮਦਦ ਪ੍ਰਾਪਤ ਕਰਨਾ +## ਸਹਾਇਤਾ ਪ੍ਰਾਪਤ ਕਰਨਾ -ਜੇ ਤੁਸੀਂ ਫਸ ਜਾਂਦੇ ਹੋ ਜਾਂ AI ਐਪ ਬਣਾਉਣ ਬਾਰੇ ਕੋਈ ਵੀ ਸਵਾਲ ਹੈ, ਤਾਂ ਸਿੱਖਣ ਵਾਲਿਆਂ ਅਤੇ ਅਨੁਭਵੀ ਵਿਕਾਸਕਾਰਾਂ ਦੇ ਨਾਲ MCP ਬਾਰੇ ਚਰਚਾ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਵੋ। ਇਹ ਇਕ ਸਹਾਇਕ ਭਾਈਚਾਰਾ ਹੈ ਜਿੱਥੇ ਸਵਾਲਾਂ ਦਾ ਸਵਾਗਤ ਹੈ ਅਤੇ ਗਿਆਨ ਖੁੱਲ੍ਹ ਕੇ ਸਾਂਝਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। +ਜੇ ਤੁਸੀਂ ਅਟਕ ਜਾਂਦੇ ਹੋ ਜਾਂ AI ਐਪਸ ਬਣਾਉਣ ਬਾਰੇ ਕੋਈ ਵੀ ਸਵਾਲ ਹੈ, ਤਾਂ MCP ਬਾਰੇ ਚਰਚਾ ਵਿੱਚ ਸਾਥੀ ਸਿੱਖਣ ਵਾਲਿਆਂ ਅਤੇ ਤਜਰਬੇਕਾਰ ਡਿਵੈਲਪਰਾਂ ਨਾਲ ਸ਼ਾਮਲ ਹੋਵੋ। ਇਹ ਇੱਕ ਸਮਰਥਕ ਭਾਈਚਾਰਾ ਹੈ ਜਿੱਥੇ ਸਵਾਲਾਂ ਦਾ ਸਵਾਗਤ ਹੈ ਅਤੇ ਗਿਆਨ ਖੁਲ ਕੇ ਸਾਂਝਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। [![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) -ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਉਤਪਾਦ ਫੀਡਬੈਕ ਜਾਂ ਤਿਆਰ ਕਰਦੇ ਸਮੇਂ ਕੋਈ ਗਲਤੀਆਂ ਹੋਣ, ਤਾਂ ਜਾਓ: +ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਉਤਪਾਦ ਫੀਡਬੈਕ ਜਾਂ ਨਿਰਮਾਣ ਦੌਰਾਨ ਕੋਈ ਤਰੁਟੀਆਂ ਹਨ ਤਾਂ ਜਾਓ: [![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) --- -**ਇਸਤੇਜ਼ਾਰ**: -ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀਤਾ ਲਈ ਯਤਨ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਧਿਆਨ ਦਿਓ ਕਿ ਸਵੈਚਾਲਿਤ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸਥਿਰਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਆਪਣੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਅਧਿਕਾਰਕ ਸਰੋਤ ਮੰਨਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਜਰੂਰੀ ਜਾਣਕਾਰੀ ਲਈ ਵਿਅਵਸਾਇਕ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਿਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਅਸੀਂ ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਨਾਲ ਪੈਦਾ ਹੋਣ ਵਾਲੀਆਂ ਕਿਸੇ ਵੀ ਗਲਤ ਫਹਿਮੀ ਜਾਂ ਗਲਤ ਅਰਥ ਨਿਕਾਸੀ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ। +**ਛੁਟਕਾਰਾ ਸੂਚਨਾ**: +ਇਹ ਦਸਤਾਵੇਜ਼ AI ਅਨੁਵਾਦ ਸੇਵਾ [Co-op Translator](https://github.com/Azure/co-op-translator) ਦੀ ਵਰਤੋਂ ਨਾਲ ਅਨੁਵਾਦ ਕੀਤਾ ਗਿਆ ਹੈ। ਜਦੋਂ ਕਿ ਅਸੀਂ ਸਹੀਅਤ ਲਈ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਾਂ, ਕਿਰਪਾ ਕਰਕੇ ਜਾਣੂ ਰਹੋ ਕਿ ਆਟੋਮੈਟਿਕ ਅਨੁਵਾਦਾਂ ਵਿੱਚ ਗਲਤੀਆਂ ਜਾਂ ਅਸਮਰੱਥਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਮੂਲ ਦਸਤਾਵੇਜ਼ ਆਪਣੀ ਮੂਲ ਭਾਸ਼ਾ ਵਿੱਚ ਸત્તਾਪ੍ਰਾਪਤ ਸਰੋਤ ਮੰਨਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਹੱਤਵਪੂਰਨ ਜਾਣਕਾਰੀ ਲਈ, ਪੇਸ਼ੇਵਰ ਮਨੁੱਖੀ ਅਨੁਵਾਦ ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਅਨੁਵਾਦ ਦੀ ਵਰਤੋਂ ਨਾਲ ਪੈਦਾਸ਼ ਹੋਣ ਵਾਲੀਆਂ ਕਿਸੇ ਵੀ ਗਲਤਫਹਿਮੀਆਂ ਜਾਂ ਗਲਤ ਸਮਝਾਂ ਲਈ ਅਸੀਂ ਜ਼ਿੰਮੇਵਾਰ ਨਹੀਂ ਹਾਂ। \ No newline at end of file diff --git a/translations/pa/SECURITY.md b/translations/pa/SECURITY.md index 46787b2bb..21eadae0d 100644 --- a/translations/pa/SECURITY.md +++ b/translations/pa/SECURITY.md @@ -1,12 +1,3 @@ - ## ਸੁਰੱਖਿਆ ਮਾਈਕਰੋਸਾਫਟ ਆਪਣੇ ਸੌਫਟਵੇਅਰ ਉਤਪਾਦਾਂ ਅਤੇ ਸੇਵਾਵਾਂ ਦੀ ਸੁਰੱਖਿਆ ਨੂੰ ਗੰਭੀਰਤਾ ਨਾਲ ਲੈਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸਾਡੇ GitHub ਸੰਸਥਾਵਾਂ ਦੁਆਰਾ ਪ੍ਰਬੰਧਿਤ ਸਾਰੇ ਸਰੋਤ ਕੋਡ ਰਿਪੋਜ਼ਿਟਰੀਜ਼ ਸ਼ਾਮਲ ਹਨ, ਜਿਵੇਂ ਕਿ [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin), ਅਤੇ [ਸਾਡੀਆਂ GitHub ਸੰਸਥਾਵਾਂ](https://opensource.microsoft.com/)। diff --git a/translations/pa/SUPPORT.md b/translations/pa/SUPPORT.md index 69fc797de..2f8631d5d 100644 --- a/translations/pa/SUPPORT.md +++ b/translations/pa/SUPPORT.md @@ -1,12 +1,3 @@ - # ਸਹਾਇਤਾ ## ਮਸਲੇ ਦਰਜ ਕਰਨ ਅਤੇ ਮਦਦ ਪ੍ਰਾਪਤ ਕਰਨ ਦਾ ਤਰੀਕਾ diff --git a/translations/pa/TROUBLESHOOTING.md b/translations/pa/TROUBLESHOOTING.md index 8a9c3de8f..e29ae66c7 100644 --- a/translations/pa/TROUBLESHOOTING.md +++ b/translations/pa/TROUBLESHOOTING.md @@ -1,12 +1,3 @@ - # ਸਮੱਸਿਆ ਹੱਲ ਕਰਨ ਦੀ ਗਾਈਡ ਇਹ ਗਾਈਡ ਤੁਹਾਨੂੰ Machine Learning for Beginners ਪਾਠਕ੍ਰਮ ਨਾਲ ਕੰਮ ਕਰਦੇ ਸਮੇਂ ਆਮ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ। ਜੇ ਤੁਸੀਂ ਇੱਥੇ ਹੱਲ ਨਹੀਂ ਲੱਭਦੇ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੇ [Discord Discussions](https://aka.ms/foundry/discord) ਜਾਂ [ਇੱਕ ਮੁੱਦਾ ਖੋਲ੍ਹੋ](https://github.com/microsoft/ML-For-Beginners/issues) ਨੂੰ ਚੈੱਕ ਕਰੋ। diff --git a/translations/pa/docs/_sidebar.md b/translations/pa/docs/_sidebar.md index 36f241cd2..ff162f8c5 100644 --- a/translations/pa/docs/_sidebar.md +++ b/translations/pa/docs/_sidebar.md @@ -1,12 +1,3 @@ - - ਜਾਣ ਪਛਾਣ - [ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦੀ ਜਾਣ ਪਛਾਣ](../1-Introduction/1-intro-to-ML/README.md) - [ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਦਾ ਇਤਿਹਾਸ](../1-Introduction/2-history-of-ML/README.md) diff --git a/translations/pa/for-teachers.md b/translations/pa/for-teachers.md index f5f3c8ac8..af81602b8 100644 --- a/translations/pa/for-teachers.md +++ b/translations/pa/for-teachers.md @@ -1,12 +1,3 @@ - ## ਸਿੱਖਿਆ ਦੇਣ ਵਾਲਿਆਂ ਲਈ ਕੀ ਤੁਸੀਂ ਇਸ ਪਾਠਕ੍ਰਮ ਨੂੰ ਆਪਣੇ ਕਲਾਸਰੂਮ ਵਿੱਚ ਵਰਤਣਾ ਚਾਹੁੰਦੇ ਹੋ? ਬੇਝਿਜਕ ਵਰਤੋ! diff --git a/translations/pa/quiz-app/README.md b/translations/pa/quiz-app/README.md index c3a86de47..84ba2ee4c 100644 --- a/translations/pa/quiz-app/README.md +++ b/translations/pa/quiz-app/README.md @@ -1,12 +1,3 @@ - # ਕਵਿਜ਼ ਇਹ ਕਵਿਜ਼ ML ਪਾਠਕ੍ਰਮ ਲਈ ਲੈਕਚਰ ਤੋਂ ਪਹਿਲਾਂ ਅਤੇ ਬਾਅਦ ਦੇ ਕਵਿਜ਼ ਹਨ: https://aka.ms/ml-beginners diff --git a/translations/pa/sketchnotes/LICENSE.md b/translations/pa/sketchnotes/LICENSE.md index 266008b73..12003ff07 100644 --- a/translations/pa/sketchnotes/LICENSE.md +++ b/translations/pa/sketchnotes/LICENSE.md @@ -1,12 +1,3 @@ - ਅਟ੍ਰਿਬਿਊਸ਼ਨ-ਸ਼ੇਅਰਅਲਾਈਕ 4.0 ਇੰਟਰਨੈਸ਼ਨਲ ======================================================================= diff --git a/translations/pa/sketchnotes/README.md b/translations/pa/sketchnotes/README.md index c4e75c39e..1a003433e 100644 --- a/translations/pa/sketchnotes/README.md +++ b/translations/pa/sketchnotes/README.md @@ -1,12 +1,3 @@ - ਸਾਰੇ ਪਾਠਕ੍ਰਮ ਦੇ ਸਕੈਚਨੋਟਸ ਇੱਥੇ ਡਾਊਨਲੋਡ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ। 🖨 ਉੱਚ-ਰਿਜ਼ੋਲੂਸ਼ਨ ਵਿੱਚ ਪ੍ਰਿੰਟ ਕਰਨ ਲਈ, TIFF ਵਰਜਨ [ਇਸ ਰਿਪੋ](https://github.com/girliemac/a-picture-is-worth-a-1000-words/tree/main/ml/tiff) 'ਤੇ ਉਪਲਬਧ ਹਨ। diff --git a/translations/pt/1-Introduction/1-intro-to-ML/README.md b/translations/pt/1-Introduction/1-intro-to-ML/README.md deleted file mode 100644 index e0df714d7..000000000 --- a/translations/pt/1-Introduction/1-intro-to-ML/README.md +++ /dev/null @@ -1,159 +0,0 @@ - -# Introdução ao machine learning - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- - -[![ML para iniciantes - Introdução ao Machine Learning para Iniciantes](https://img.youtube.com/vi/6mSx_KJxcHI/0.jpg)](https://youtu.be/6mSx_KJxcHI "ML para iniciantes - Introdução ao Machine Learning para Iniciantes") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre esta lição. - -Bem-vindo a este curso sobre machine learning clássico para iniciantes! Quer seja completamente novo neste tema ou um praticante experiente de ML que procura rever uma área, estamos felizes por tê-lo connosco! Queremos criar um ponto de partida amigável para o seu estudo de ML e ficaremos felizes em avaliar, responder e incorporar o seu [feedback](https://github.com/microsoft/ML-For-Beginners/discussions). - -[![Introdução ao ML](https://img.youtube.com/vi/h0e2HAPTGF4/0.jpg)](https://youtu.be/h0e2HAPTGF4 "Introdução ao ML") - -> 🎥 Clique na imagem acima para assistir a um vídeo: John Guttag do MIT apresenta o machine learning - ---- -## Começando com machine learning - -Antes de começar com este currículo, é necessário configurar o seu computador e prepará-lo para executar notebooks localmente. - -- **Configure o seu computador com estes vídeos**. Utilize os seguintes links para aprender [como instalar Python](https://youtu.be/CXZYvNRIAKM) no seu sistema e [configurar um editor de texto](https://youtu.be/EU8eayHWoZg) para desenvolvimento. -- **Aprenda Python**. Também é recomendado ter uma compreensão básica de [Python](https://docs.microsoft.com/learn/paths/python-language/?WT.mc_id=academic-77952-leestott), uma linguagem de programação útil para cientistas de dados que utilizamos neste curso. -- **Aprenda Node.js e JavaScript**. Utilizamos JavaScript algumas vezes neste curso ao criar aplicações web, por isso será necessário ter [node](https://nodejs.org) e [npm](https://www.npmjs.com/) instalados, bem como [Visual Studio Code](https://code.visualstudio.com/) disponível para desenvolvimento em Python e JavaScript. -- **Crie uma conta no GitHub**. Como nos encontrou aqui no [GitHub](https://github.com), talvez já tenha uma conta, mas, se não, crie uma e depois faça um fork deste currículo para usar por conta própria. (Sinta-se à vontade para nos dar uma estrela também 😊) -- **Explore o Scikit-learn**. Familiarize-se com [Scikit-learn](https://scikit-learn.org/stable/user_guide.html), um conjunto de bibliotecas de ML que referenciamos nestas lições. - ---- -## O que é machine learning? - -O termo 'machine learning' é um dos mais populares e frequentemente utilizados atualmente. Existe uma possibilidade significativa de que já tenha ouvido este termo pelo menos uma vez, caso tenha algum tipo de familiaridade com tecnologia, independentemente da área em que trabalha. No entanto, a mecânica do machine learning é um mistério para a maioria das pessoas. Para um iniciante em machine learning, o tema pode, por vezes, parecer avassalador. Por isso, é importante entender o que realmente é machine learning e aprender sobre ele passo a passo, através de exemplos práticos. - ---- -## A curva de hype - -![ml hype curve](../../../../1-Introduction/1-intro-to-ML/images/hype.png) - -> O Google Trends mostra a recente 'curva de hype' do termo 'machine learning' - ---- -## Um universo misterioso - -Vivemos num universo cheio de mistérios fascinantes. Grandes cientistas como Stephen Hawking, Albert Einstein e muitos outros dedicaram as suas vidas à busca de informações significativas que desvendassem os mistérios do mundo ao nosso redor. Esta é a condição humana de aprender: uma criança humana aprende coisas novas e descobre a estrutura do seu mundo ano após ano, à medida que cresce até à idade adulta. - ---- -## O cérebro da criança - -O cérebro e os sentidos de uma criança percebem os factos do seu ambiente e, gradualmente, aprendem os padrões ocultos da vida que ajudam a criança a criar regras lógicas para identificar padrões aprendidos. O processo de aprendizagem do cérebro humano torna os humanos a criatura viva mais sofisticada deste mundo. Aprender continuamente, descobrindo padrões ocultos e depois inovando com base nesses padrões, permite-nos melhorar cada vez mais ao longo da nossa vida. Esta capacidade de aprendizagem e evolução está relacionada a um conceito chamado [plasticidade cerebral](https://www.simplypsychology.org/brain-plasticity.html). Superficialmente, podemos traçar algumas semelhanças motivacionais entre o processo de aprendizagem do cérebro humano e os conceitos de machine learning. - ---- -## O cérebro humano - -O [cérebro humano](https://www.livescience.com/29365-human-brain.html) percebe coisas do mundo real, processa as informações percebidas, toma decisões racionais e realiza certas ações com base nas circunstâncias. Isto é o que chamamos de comportamento inteligente. Quando programamos uma réplica do processo de comportamento inteligente numa máquina, chamamos isso de inteligência artificial (IA). - ---- -## Alguns termos - -Embora os termos possam ser confundidos, machine learning (ML) é um subconjunto importante da inteligência artificial. **ML está relacionado ao uso de algoritmos especializados para descobrir informações significativas e encontrar padrões ocultos a partir de dados percebidos, corroborando o processo de tomada de decisão racional**. - ---- -## IA, ML, Deep Learning - -![AI, ML, deep learning, data science](../../../../1-Introduction/1-intro-to-ML/images/ai-ml-ds.png) - -> Um diagrama mostrando as relações entre IA, ML, deep learning e ciência de dados. Infográfico por [Jen Looper](https://twitter.com/jenlooper) inspirado por [este gráfico](https://softwareengineering.stackexchange.com/questions/366996/distinction-between-ai-ml-neural-networks-deep-learning-and-data-mining) - ---- -## Conceitos a abordar - -Neste currículo, vamos abordar apenas os conceitos principais de machine learning que um iniciante deve conhecer. Abordamos o que chamamos de 'machine learning clássico', utilizando principalmente o Scikit-learn, uma excelente biblioteca que muitos estudantes utilizam para aprender o básico. Para entender conceitos mais amplos de inteligência artificial ou deep learning, um conhecimento fundamental sólido de machine learning é indispensável, e é isso que queremos oferecer aqui. - ---- -## Neste curso, irá aprender: - -- conceitos principais de machine learning -- a história do ML -- ML e equidade -- técnicas de regressão em ML -- técnicas de classificação em ML -- técnicas de clustering em ML -- técnicas de processamento de linguagem natural em ML -- técnicas de previsão de séries temporais em ML -- aprendizagem por reforço -- aplicações reais de ML - ---- -## O que não iremos abordar - -- deep learning -- redes neurais -- IA - -Para proporcionar uma melhor experiência de aprendizagem, evitaremos as complexidades das redes neurais, 'deep learning' - construção de modelos com várias camadas utilizando redes neurais - e IA, que discutiremos num currículo diferente. Também ofereceremos um futuro currículo de ciência de dados para focar nesse aspeto deste campo mais amplo. - ---- -## Por que estudar machine learning? - -Machine learning, do ponto de vista de sistemas, é definido como a criação de sistemas automatizados que podem aprender padrões ocultos a partir de dados para ajudar na tomada de decisões inteligentes. - -Esta motivação é vagamente inspirada por como o cérebro humano aprende certas coisas com base nos dados que percebe do mundo exterior. - -✅ Pense por um momento por que uma empresa gostaria de tentar usar estratégias de machine learning em vez de criar um motor baseado em regras codificadas. - ---- -## Aplicações de machine learning - -As aplicações de machine learning estão agora quase em todo lugar e são tão ubíquas quanto os dados que circulam pelas nossas sociedades, gerados pelos nossos smartphones, dispositivos conectados e outros sistemas. Considerando o imenso potencial dos algoritmos de machine learning de última geração, os investigadores têm explorado a sua capacidade para resolver problemas reais multidimensionais e multidisciplinares com resultados muito positivos. - ---- -## Exemplos de ML aplicado - -**Pode usar machine learning de várias formas**: - -- Para prever a probabilidade de uma doença com base no histórico médico ou relatórios de um paciente. -- Para utilizar dados meteorológicos e prever eventos climáticos. -- Para entender o sentimento de um texto. -- Para detetar notícias falsas e impedir a propagação de propaganda. - -Finanças, economia, ciência da terra, exploração espacial, engenharia biomédica, ciência cognitiva e até áreas das humanidades têm adaptado o machine learning para resolver os problemas árduos e pesados em processamento de dados dos seus domínios. - ---- -## Conclusão - -Machine learning automatiza o processo de descoberta de padrões ao encontrar insights significativos a partir de dados reais ou gerados. Provou ser altamente valioso em aplicações empresariais, de saúde e financeiras, entre outras. - -Num futuro próximo, entender os fundamentos de machine learning será indispensável para pessoas de qualquer área devido à sua ampla adoção. - ---- -# 🚀 Desafio - -Desenhe, em papel ou utilizando uma aplicação online como [Excalidraw](https://excalidraw.com/), a sua compreensão das diferenças entre IA, ML, deep learning e ciência de dados. Adicione algumas ideias sobre os problemas que cada uma destas técnicas é boa em resolver. - -# [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- -# Revisão e Autoestudo - -Para aprender mais sobre como pode trabalhar com algoritmos de ML na nuvem, siga este [Percurso de Aprendizagem](https://docs.microsoft.com/learn/paths/create-no-code-predictive-models-azure-machine-learning/?WT.mc_id=academic-77952-leestott). - -Faça um [Percurso de Aprendizagem](https://docs.microsoft.com/learn/modules/introduction-to-machine-learning/?WT.mc_id=academic-77952-leestott) sobre os fundamentos de ML. - ---- -# Tarefa - -[Prepare-se e comece](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/1-intro-to-ML/assignment.md b/translations/pt/1-Introduction/1-intro-to-ML/assignment.md deleted file mode 100644 index 3566af74a..000000000 --- a/translations/pt/1-Introduction/1-intro-to-ML/assignment.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Comece a Trabalhar - -## Instruções - -Neste exercício não avaliado, deve rever Python e preparar o seu ambiente para executar notebooks. - -Siga este [Percurso de Aprendizagem de Python](https://docs.microsoft.com/learn/paths/python-language/?WT.mc_id=academic-77952-leestott), e depois configure os seus sistemas assistindo aos vídeos introdutórios abaixo: - -https://www.youtube.com/playlist?list=PLlrxD0HtieHhS8VzuMCfQD4uJ9yne1mE6 - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/2-history-of-ML/README.md b/translations/pt/1-Introduction/2-history-of-ML/README.md deleted file mode 100644 index f88f6d2f9..000000000 --- a/translations/pt/1-Introduction/2-history-of-ML/README.md +++ /dev/null @@ -1,164 +0,0 @@ - -# História da aprendizagem automática - -![Resumo da História da aprendizagem automática em um sketchnote](../../../../sketchnotes/ml-history.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- - -[![ML para iniciantes - História da Aprendizagem Automática](https://img.youtube.com/vi/N6wxM4wZ7V0/0.jpg)](https://youtu.be/N6wxM4wZ7V0 "ML para iniciantes - História da Aprendizagem Automática") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre esta lição. - -Nesta lição, vamos explorar os principais marcos na história da aprendizagem automática e da inteligência artificial. - -A história da inteligência artificial (IA) como campo está entrelaçada com a história da aprendizagem automática, já que os algoritmos e avanços computacionais que sustentam a aprendizagem automática contribuíram para o desenvolvimento da IA. É útil lembrar que, embora esses campos como áreas distintas de investigação tenham começado a se cristalizar na década de 1950, importantes [descobertas algorítmicas, estatísticas, matemáticas, computacionais e técnicas](https://wikipedia.org/wiki/Timeline_of_machine_learning) precederam e se sobrepuseram a essa era. Na verdade, as pessoas têm pensado sobre essas questões há [centenas de anos](https://wikipedia.org/wiki/History_of_artificial_intelligence): este artigo discute os fundamentos intelectuais históricos da ideia de uma 'máquina pensante'. - ---- -## Descobertas notáveis - -- 1763, 1812 [Teorema de Bayes](https://wikipedia.org/wiki/Bayes%27_theorem) e seus predecessores. Este teorema e suas aplicações fundamentam a inferência, descrevendo a probabilidade de um evento ocorrer com base em conhecimento prévio. -- 1805 [Teoria dos Mínimos Quadrados](https://wikipedia.org/wiki/Least_squares) pelo matemático francês Adrien-Marie Legendre. Esta teoria, que você aprenderá na nossa unidade de Regressão, ajuda no ajuste de dados. -- 1913 [Cadeias de Markov](https://wikipedia.org/wiki/Markov_chain), nomeadas em homenagem ao matemático russo Andrey Markov, são usadas para descrever uma sequência de eventos possíveis com base em um estado anterior. -- 1957 [Perceptron](https://wikipedia.org/wiki/Perceptron) é um tipo de classificador linear inventado pelo psicólogo americano Frank Rosenblatt que fundamenta avanços em aprendizagem profunda. - ---- - -- 1967 [Vizinho Mais Próximo](https://wikipedia.org/wiki/Nearest_neighbor) é um algoritmo originalmente projetado para mapear rotas. No contexto de aprendizagem automática, é usado para detectar padrões. -- 1970 [Retropropagação](https://wikipedia.org/wiki/Backpropagation) é usada para treinar [redes neurais feedforward](https://wikipedia.org/wiki/Feedforward_neural_network). -- 1982 [Redes Neurais Recorrentes](https://wikipedia.org/wiki/Recurrent_neural_network) são redes neurais artificiais derivadas de redes neurais feedforward que criam gráficos temporais. - -✅ Faça uma pequena pesquisa. Quais outras datas se destacam como marcos na história da aprendizagem automática e da IA? - ---- -## 1950: Máquinas que pensam - -Alan Turing, uma pessoa verdadeiramente notável que foi eleito [pelo público em 2019](https://wikipedia.org/wiki/Icons:_The_Greatest_Person_of_the_20th_Century) como o maior cientista do século XX, é creditado por ajudar a estabelecer as bases para o conceito de uma 'máquina que pode pensar'. Ele enfrentou críticos e sua própria necessidade de evidências empíricas desse conceito, em parte criando o [Teste de Turing](https://www.bbc.com/news/technology-18475646), que você explorará nas nossas lições de PNL. - ---- -## 1956: Projeto de Pesquisa de Verão em Dartmouth - -"O Projeto de Pesquisa de Verão em Dartmouth sobre inteligência artificial foi um evento seminal para a inteligência artificial como campo", e foi aqui que o termo 'inteligência artificial' foi cunhado ([fonte](https://250.dartmouth.edu/highlights/artificial-intelligence-ai-coined-dartmouth)). - -> Todo aspecto de aprendizagem ou qualquer outra característica da inteligência pode, em princípio, ser descrito tão precisamente que uma máquina pode ser feita para simulá-lo. - ---- - -O pesquisador principal, professor de matemática John McCarthy, esperava "prosseguir com base na conjectura de que todo aspecto de aprendizagem ou qualquer outra característica da inteligência pode, em princípio, ser descrito tão precisamente que uma máquina pode ser feita para simulá-lo." Os participantes incluíram outro luminar na área, Marvin Minsky. - -O workshop é creditado por ter iniciado e incentivado várias discussões, incluindo "a ascensão de métodos simbólicos, sistemas focados em domínios limitados (primeiros sistemas especialistas) e sistemas dedutivos versus sistemas indutivos." ([fonte](https://wikipedia.org/wiki/Dartmouth_workshop)). - ---- -## 1956 - 1974: "Os anos dourados" - -Dos anos 1950 até meados dos anos 70, o otimismo era alto na esperança de que a IA pudesse resolver muitos problemas. Em 1967, Marvin Minsky afirmou confiantemente que "Dentro de uma geração ... o problema de criar 'inteligência artificial' será substancialmente resolvido." (Minsky, Marvin (1967), Computation: Finite and Infinite Machines, Englewood Cliffs, N.J.: Prentice-Hall) - -A pesquisa em processamento de linguagem natural floresceu, a busca foi refinada e tornou-se mais poderosa, e o conceito de 'micro-mundos' foi criado, onde tarefas simples eram realizadas usando instruções em linguagem simples. - ---- - -A pesquisa foi bem financiada por agências governamentais, avanços foram feitos em computação e algoritmos, e protótipos de máquinas inteligentes foram construídos. Algumas dessas máquinas incluem: - -* [Shakey o robô](https://wikipedia.org/wiki/Shakey_the_robot), que podia se movimentar e decidir como realizar tarefas 'inteligentemente'. - - ![Shakey, um robô inteligente](../../../../1-Introduction/2-history-of-ML/images/shakey.jpg) - > Shakey em 1972 - ---- - -* Eliza, um dos primeiros 'chatterbots', podia conversar com pessoas e agir como um 'terapeuta' primitivo. Você aprenderá mais sobre Eliza nas lições de PNL. - - ![Eliza, um bot](../../../../1-Introduction/2-history-of-ML/images/eliza.png) - > Uma versão de Eliza, um chatbot - ---- - -* "Blocks world" foi um exemplo de micro-mundo onde blocos podiam ser empilhados e organizados, e experimentos em ensinar máquinas a tomar decisões podiam ser testados. Avanços construídos com bibliotecas como [SHRDLU](https://wikipedia.org/wiki/SHRDLU) ajudaram a impulsionar o processamento de linguagem. - - [![blocks world com SHRDLU](https://img.youtube.com/vi/QAJz4YKUwqw/0.jpg)](https://www.youtube.com/watch?v=QAJz4YKUwqw "blocks world com SHRDLU") - - > 🎥 Clique na imagem acima para assistir a um vídeo: Blocks world com SHRDLU - ---- -## 1974 - 1980: "Inverno da IA" - -Por volta de meados dos anos 1970, tornou-se evidente que a complexidade de criar 'máquinas inteligentes' havia sido subestimada e que sua promessa, dada a potência computacional disponível, havia sido exagerada. O financiamento secou e a confiança na área diminuiu. Alguns problemas que impactaram a confiança incluíram: ---- -- **Limitações**. A potência computacional era muito limitada. -- **Explosão combinatória**. A quantidade de parâmetros necessários para treinar cresceu exponencialmente à medida que mais era exigido dos computadores, sem uma evolução paralela da potência e capacidade computacional. -- **Escassez de dados**. Havia uma escassez de dados que dificultava o processo de testar, desenvolver e refinar algoritmos. -- **Estamos fazendo as perguntas certas?**. As próprias perguntas que estavam sendo feitas começaram a ser questionadas. Pesquisadores começaram a enfrentar críticas sobre suas abordagens: - - Os testes de Turing foram questionados por meio, entre outras ideias, da 'teoria da sala chinesa', que postulava que, "programar um computador digital pode fazê-lo parecer entender a linguagem, mas não poderia produzir compreensão real." ([fonte](https://plato.stanford.edu/entries/chinese-room/)) - - A ética de introduzir inteligências artificiais como o "terapeuta" ELIZA na sociedade foi desafiada. - ---- - -Ao mesmo tempo, várias escolas de pensamento sobre IA começaram a se formar. Uma dicotomia foi estabelecida entre práticas de ["IA desleixada" vs. "IA organizada"](https://wikipedia.org/wiki/Neats_and_scruffies). Laboratórios _desleixados_ ajustavam programas por horas até obterem os resultados desejados. Laboratórios _organizados_ "focavam em lógica e resolução formal de problemas". ELIZA e SHRDLU eram sistemas _desleixados_ bem conhecidos. Nos anos 1980, à medida que surgia a demanda por tornar os sistemas de aprendizagem automática reproduzíveis, a abordagem _organizada_ gradualmente tomou a dianteira, pois seus resultados são mais explicáveis. - ---- -## Sistemas especialistas nos anos 1980 - -À medida que a área crescia, seus benefícios para os negócios tornaram-se mais claros, e nos anos 1980 também ocorreu a proliferação de 'sistemas especialistas'. "Os sistemas especialistas estavam entre as primeiras formas verdadeiramente bem-sucedidas de software de inteligência artificial (IA)." ([fonte](https://wikipedia.org/wiki/Expert_system)). - -Este tipo de sistema é na verdade _híbrido_, consistindo parcialmente de um motor de regras que define os requisitos de negócios e um motor de inferência que utiliza o sistema de regras para deduzir novos fatos. - -Esta era também viu uma atenção crescente às redes neurais. - ---- -## 1987 - 1993: "Resfriamento da IA" - -A proliferação de hardware especializado para sistemas especialistas teve o efeito infeliz de se tornar muito especializado. O surgimento dos computadores pessoais também competiu com esses sistemas grandes, especializados e centralizados. A democratização da computação havia começado, e isso eventualmente abriu caminho para a explosão moderna de big data. - ---- -## 1993 - 2011 - -Este período viu uma nova era para a aprendizagem automática e a IA resolverem alguns dos problemas causados anteriormente pela falta de dados e potência computacional. A quantidade de dados começou a aumentar rapidamente e a se tornar mais amplamente disponível, para o bem e para o mal, especialmente com o advento do smartphone por volta de 2007. A potência computacional expandiu-se exponencialmente, e os algoritmos evoluíram junto. A área começou a ganhar maturidade à medida que os dias livres do passado começaram a se cristalizar em uma verdadeira disciplina. - ---- -## Hoje - -Hoje, a aprendizagem automática e a IA tocam quase todas as partes de nossas vidas. Esta era exige uma compreensão cuidadosa dos riscos e dos potenciais efeitos desses algoritmos na vida humana. Como Brad Smith, da Microsoft, afirmou: "A tecnologia da informação levanta questões que vão ao cerne das proteções fundamentais dos direitos humanos, como privacidade e liberdade de expressão. Essas questões aumentam a responsabilidade das empresas de tecnologia que criam esses produtos. Em nossa visão, elas também exigem uma regulamentação governamental cuidadosa e o desenvolvimento de normas sobre usos aceitáveis" ([fonte](https://www.technologyreview.com/2019/12/18/102365/the-future-of-ais-impact-on-society/)). - ---- - -Ainda não se sabe o que o futuro reserva, mas é importante entender esses sistemas computacionais e o software e os algoritmos que eles executam. Esperamos que este currículo o ajude a obter uma melhor compreensão para que você possa decidir por si mesmo. - -[![A história da aprendizagem profunda](https://img.youtube.com/vi/mTtDfKgLm54/0.jpg)](https://www.youtube.com/watch?v=mTtDfKgLm54 "A história da aprendizagem profunda") -> 🎥 Clique na imagem acima para assistir a um vídeo: Yann LeCun discute a história da aprendizagem profunda nesta palestra - ---- -## 🚀Desafio - -Aprofunde-se em um desses momentos históricos e aprenda mais sobre as pessoas por trás deles. Há personagens fascinantes, e nenhuma descoberta científica foi criada em um vácuo cultural. O que você descobre? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - ---- -## Revisão e Estudo Individual - -Aqui estão itens para assistir e ouvir: - -[Este podcast onde Amy Boyd discute a evolução da IA](http://runasradio.com/Shows/Show/739) - -[![A história da IA por Amy Boyd](https://img.youtube.com/vi/EJt3_bFYKss/0.jpg)](https://www.youtube.com/watch?v=EJt3_bFYKss "A história da IA por Amy Boyd") - ---- - -## Tarefa - -[Criar uma linha do tempo](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/2-history-of-ML/assignment.md b/translations/pt/1-Introduction/2-history-of-ML/assignment.md deleted file mode 100644 index 8d019124e..000000000 --- a/translations/pt/1-Introduction/2-history-of-ML/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Criar uma linha do tempo - -## Instruções - -Usando [este repositório](https://github.com/Digital-Humanities-Toolkit/timeline-builder), crie uma linha do tempo sobre algum aspecto da história dos algoritmos, matemática, estatística, IA ou ML, ou uma combinação destes. Pode focar numa pessoa, numa ideia ou num longo período de pensamento. Certifique-se de adicionar elementos multimédia. - -## Critérios de Avaliação - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | ------------------------------------------------ | --------------------------------------- | ---------------------------------------------------------------- | -| | Uma linha do tempo publicada é apresentada como uma página no GitHub | O código está incompleto e não foi publicado | A linha do tempo está incompleta, pouco pesquisada e não foi publicada | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/3-fairness/README.md b/translations/pt/1-Introduction/3-fairness/README.md deleted file mode 100644 index d271c7787..000000000 --- a/translations/pt/1-Introduction/3-fairness/README.md +++ /dev/null @@ -1,170 +0,0 @@ - -# Construir soluções de Machine Learning com IA responsável - -![Resumo da IA responsável em Machine Learning em um sketchnote](../../../../sketchnotes/ml-fairness.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -Neste currículo, começará a descobrir como o machine learning pode impactar e já está a impactar as nossas vidas diárias. Mesmo agora, sistemas e modelos estão envolvidos em tarefas de tomada de decisão diária, como diagnósticos de saúde, aprovações de empréstimos ou deteção de fraudes. Por isso, é importante que esses modelos funcionem bem para fornecer resultados confiáveis. Assim como qualquer aplicação de software, os sistemas de IA podem falhar em atender às expectativas ou gerar resultados indesejáveis. É por isso que é essencial compreender e explicar o comportamento de um modelo de IA. - -Imagine o que pode acontecer quando os dados que utiliza para construir esses modelos não incluem certos grupos demográficos, como raça, género, visão política, religião, ou representam esses grupos de forma desproporcional. E se a saída do modelo for interpretada de forma a favorecer um grupo demográfico? Qual é a consequência para a aplicação? Além disso, o que acontece quando o modelo gera um resultado adverso e prejudica as pessoas? Quem é responsável pelo comportamento dos sistemas de IA? Estas são algumas questões que exploraremos neste currículo. - -Nesta lição, irá: - -- Aumentar a sua consciência sobre a importância da equidade no machine learning e os danos relacionados com a falta de equidade. -- Familiarizar-se com a prática de explorar outliers e cenários incomuns para garantir fiabilidade e segurança. -- Compreender a necessidade de capacitar todos ao projetar sistemas inclusivos. -- Explorar como é vital proteger a privacidade e a segurança dos dados e das pessoas. -- Perceber a importância de uma abordagem de "caixa de vidro" para explicar o comportamento dos modelos de IA. -- Ter em mente como a responsabilidade é essencial para construir confiança nos sistemas de IA. - -## Pré-requisito - -Como pré-requisito, faça o percurso de aprendizagem "Princípios de IA Responsável" e assista ao vídeo abaixo sobre o tema: - -Saiba mais sobre IA Responsável seguindo este [Percurso de Aprendizagem](https://docs.microsoft.com/learn/modules/responsible-ai-principles/?WT.mc_id=academic-77952-leestott) - -[![Abordagem da Microsoft para IA Responsável](https://img.youtube.com/vi/dnC8-uUZXSc/0.jpg)](https://youtu.be/dnC8-uUZXSc "Abordagem da Microsoft para IA Responsável") - -> 🎥 Clique na imagem acima para assistir ao vídeo: Abordagem da Microsoft para IA Responsável - -## Equidade - -Os sistemas de IA devem tratar todos de forma justa e evitar afetar grupos semelhantes de pessoas de maneiras diferentes. Por exemplo, quando os sistemas de IA fornecem orientações sobre tratamentos médicos, aplicações de empréstimos ou emprego, devem fazer as mesmas recomendações para todos com sintomas, circunstâncias financeiras ou qualificações profissionais semelhantes. Cada um de nós, como seres humanos, carrega preconceitos herdados que afetam as nossas decisões e ações. Esses preconceitos podem ser evidentes nos dados que usamos para treinar sistemas de IA. Tal manipulação pode, por vezes, ocorrer de forma não intencional. Muitas vezes, é difícil perceber conscientemente quando está a introduzir preconceitos nos dados. - -**"Injustiça"** abrange impactos negativos, ou "danos", para um grupo de pessoas, como aqueles definidos em termos de raça, género, idade ou deficiência. Os principais danos relacionados com a equidade podem ser classificados como: - -- **Alocação**, se, por exemplo, um género ou etnia for favorecido em detrimento de outro. -- **Qualidade do serviço**. Se treinar os dados para um cenário específico, mas a realidade for muito mais complexa, isso leva a um serviço de desempenho inferior. Por exemplo, um dispensador de sabão que não consegue detetar pessoas com pele escura. [Referência](https://gizmodo.com/why-cant-this-soap-dispenser-identify-dark-skin-1797931773) -- **Denigração**. Criticar ou rotular algo ou alguém de forma injusta. Por exemplo, uma tecnologia de rotulagem de imagens que, de forma infame, rotulou imagens de pessoas de pele escura como gorilas. -- **Sobre ou sub-representação**. A ideia de que um determinado grupo não é visto numa certa profissão, e qualquer serviço ou função que continue a promover isso está a contribuir para o dano. -- **Estereotipagem**. Associar um grupo a atributos pré-definidos. Por exemplo, um sistema de tradução entre inglês e turco pode apresentar imprecisões devido a palavras com associações estereotipadas de género. - -![tradução para turco](../../../../1-Introduction/3-fairness/images/gender-bias-translate-en-tr.png) -> tradução para turco - -![tradução de volta para inglês](../../../../1-Introduction/3-fairness/images/gender-bias-translate-tr-en.png) -> tradução de volta para inglês - -Ao projetar e testar sistemas de IA, precisamos garantir que a IA seja justa e não programada para tomar decisões enviesadas ou discriminatórias, que também são proibidas para os seres humanos. Garantir a equidade na IA e no machine learning continua a ser um desafio sociotécnico complexo. - -### Fiabilidade e segurança - -Para construir confiança, os sistemas de IA precisam ser fiáveis, seguros e consistentes em condições normais e inesperadas. É importante saber como os sistemas de IA se comportarão numa variedade de situações, especialmente quando se trata de outliers. Ao construir soluções de IA, é necessário focar-se substancialmente em como lidar com uma ampla variedade de circunstâncias que as soluções de IA podem encontrar. Por exemplo, um carro autónomo precisa de colocar a segurança das pessoas como prioridade máxima. Como resultado, a IA que alimenta o carro precisa de considerar todos os cenários possíveis que o carro pode encontrar, como noite, tempestades, nevascas, crianças a atravessar a rua, animais de estimação, obras na estrada, etc. O quão bem um sistema de IA consegue lidar com uma ampla gama de condições de forma fiável e segura reflete o nível de antecipação que o cientista de dados ou desenvolvedor de IA considerou durante o design ou teste do sistema. - -> [🎥 Clique aqui para um vídeo: ](https://www.microsoft.com/videoplayer/embed/RE4vvIl) - -### Inclusividade - -Os sistemas de IA devem ser projetados para envolver e capacitar todos. Ao projetar e implementar sistemas de IA, cientistas de dados e desenvolvedores de IA identificam e abordam potenciais barreiras no sistema que poderiam, de forma não intencional, excluir pessoas. Por exemplo, existem 1 bilião de pessoas com deficiência em todo o mundo. Com o avanço da IA, elas podem aceder a uma ampla gama de informações e oportunidades mais facilmente nas suas vidas diárias. Ao abordar essas barreiras, criam-se oportunidades para inovar e desenvolver produtos de IA com melhores experiências que beneficiam todos. - -> [🎥 Clique aqui para um vídeo: inclusividade na IA](https://www.microsoft.com/videoplayer/embed/RE4vl9v) - -### Segurança e privacidade - -Os sistemas de IA devem ser seguros e respeitar a privacidade das pessoas. As pessoas têm menos confiança em sistemas que colocam a sua privacidade, informações ou vidas em risco. Ao treinar modelos de machine learning, confiamos nos dados para produzir os melhores resultados. Ao fazê-lo, a origem e a integridade dos dados devem ser consideradas. Por exemplo, os dados foram submetidos por utilizadores ou estavam disponíveis publicamente? Além disso, ao trabalhar com os dados, é crucial desenvolver sistemas de IA que possam proteger informações confidenciais e resistir a ataques. À medida que a IA se torna mais prevalente, proteger a privacidade e garantir a segurança de informações pessoais e empresariais importantes está a tornar-se mais crítico e complexo. Questões de privacidade e segurança de dados requerem atenção especial para a IA, pois o acesso aos dados é essencial para que os sistemas de IA façam previsões e decisões precisas e informadas sobre as pessoas. - -> [🎥 Clique aqui para um vídeo: segurança na IA](https://www.microsoft.com/videoplayer/embed/RE4voJF) - -- Como indústria, fizemos avanços significativos em privacidade e segurança, impulsionados significativamente por regulamentações como o RGPD (Regulamento Geral de Proteção de Dados). -- No entanto, com os sistemas de IA, devemos reconhecer a tensão entre a necessidade de mais dados pessoais para tornar os sistemas mais personalizados e eficazes – e a privacidade. -- Assim como com o nascimento de computadores conectados à internet, também estamos a assistir a um grande aumento no número de problemas de segurança relacionados com a IA. -- Ao mesmo tempo, vimos a IA ser usada para melhorar a segurança. Por exemplo, a maioria dos scanners antivírus modernos é alimentada por heurísticas de IA. -- Precisamos garantir que os nossos processos de ciência de dados se harmonizem com as práticas mais recentes de privacidade e segurança. - -### Transparência - -Os sistemas de IA devem ser compreensíveis. Uma parte crucial da transparência é explicar o comportamento dos sistemas de IA e os seus componentes. Melhorar a compreensão dos sistemas de IA exige que as partes interessadas compreendam como e por que funcionam, para que possam identificar potenciais problemas de desempenho, preocupações com segurança e privacidade, preconceitos, práticas de exclusão ou resultados indesejados. Também acreditamos que aqueles que usam sistemas de IA devem ser honestos e claros sobre quando, por que e como escolhem implementá-los, bem como as limitações dos sistemas que utilizam. Por exemplo, se um banco usa um sistema de IA para apoiar as suas decisões de concessão de crédito, é importante examinar os resultados e entender quais dados influenciam as recomendações do sistema. Os governos estão a começar a regulamentar a IA em vários setores, por isso, cientistas de dados e organizações devem explicar se um sistema de IA atende aos requisitos regulamentares, especialmente quando há um resultado indesejável. - -> [🎥 Clique aqui para um vídeo: transparência na IA](https://www.microsoft.com/videoplayer/embed/RE4voJF) - -- Como os sistemas de IA são tão complexos, é difícil entender como funcionam e interpretar os resultados. -- Essa falta de compreensão afeta a forma como esses sistemas são geridos, operacionalizados e documentados. -- Mais importante ainda, essa falta de compreensão afeta as decisões tomadas com base nos resultados produzidos por esses sistemas. - -### Responsabilidade - -As pessoas que projetam e implementam sistemas de IA devem ser responsáveis pelo funcionamento dos seus sistemas. A necessidade de responsabilidade é particularmente crucial com tecnologias sensíveis, como o reconhecimento facial. Recentemente, tem havido uma crescente procura por tecnologia de reconhecimento facial, especialmente por parte de organizações de aplicação da lei que veem o potencial da tecnologia em usos como encontrar crianças desaparecidas. No entanto, essas tecnologias podem ser usadas por um governo para colocar em risco as liberdades fundamentais dos seus cidadãos, por exemplo, ao permitir a vigilância contínua de indivíduos específicos. Por isso, cientistas de dados e organizações precisam ser responsáveis pelo impacto dos seus sistemas de IA em indivíduos ou na sociedade. - -[![Investigador líder em IA alerta para vigilância em massa através do reconhecimento facial](../../../../1-Introduction/3-fairness/images/accountability.png)](https://www.youtube.com/watch?v=Wldt8P5V6D0 "Abordagem da Microsoft para IA Responsável") - -> 🎥 Clique na imagem acima para assistir ao vídeo: Alertas sobre Vigilância em Massa através do Reconhecimento Facial - -Em última análise, uma das maiores questões para a nossa geração, como a primeira geração a trazer a IA para a sociedade, é como garantir que os computadores permaneçam responsáveis perante as pessoas e como garantir que as pessoas que projetam computadores sejam responsáveis perante todos os outros. - -## Avaliação de impacto - -Antes de treinar um modelo de machine learning, é importante realizar uma avaliação de impacto para entender o propósito do sistema de IA; qual é o uso pretendido; onde será implementado; e quem interagirá com o sistema. Estas avaliações são úteis para os revisores ou testadores avaliarem o sistema e saberem quais fatores considerar ao identificar potenciais riscos e consequências esperadas. - -As seguintes áreas devem ser focadas ao realizar uma avaliação de impacto: - -* **Impacto adverso nos indivíduos**. Estar ciente de quaisquer restrições ou requisitos, usos não suportados ou quaisquer limitações conhecidas que prejudiquem o desempenho do sistema é vital para garantir que o sistema não seja usado de forma a causar danos aos indivíduos. -* **Requisitos de dados**. Compreender como e onde o sistema usará os dados permite que os revisores explorem quaisquer requisitos de dados que precisem de ser considerados (por exemplo, regulamentações de dados como RGPD ou HIPAA). Além disso, examine se a origem ou a quantidade de dados é substancial para o treino. -* **Resumo do impacto**. Reúna uma lista de potenciais danos que possam surgir do uso do sistema. Ao longo do ciclo de vida do ML, reveja se os problemas identificados foram mitigados ou resolvidos. -* **Objetivos aplicáveis** para cada um dos seis princípios fundamentais. Avalie se os objetivos de cada princípio foram cumpridos e se existem lacunas. - -## Depuração com IA responsável - -Semelhante à depuração de uma aplicação de software, a depuração de um sistema de IA é um processo necessário para identificar e resolver problemas no sistema. Existem muitos fatores que podem afetar o desempenho de um modelo ou a sua responsabilidade. A maioria das métricas tradicionais de desempenho de modelos são agregados quantitativos do desempenho do modelo, o que não é suficiente para analisar como um modelo viola os princípios de IA responsável. Além disso, um modelo de machine learning é uma "caixa preta", o que dificulta entender o que motiva os seus resultados ou fornecer explicações quando comete um erro. Mais tarde neste curso, aprenderemos a usar o painel de IA Responsável para ajudar a depurar sistemas de IA. O painel fornece uma ferramenta holística para cientistas de dados e desenvolvedores de IA realizarem: - -* **Análise de erros**. Para identificar a distribuição de erros do modelo que pode afetar a equidade ou fiabilidade do sistema. -* **Visão geral do modelo**. Para descobrir onde existem disparidades no desempenho do modelo em diferentes coortes de dados. -* **Análise de dados**. Para compreender a distribuição dos dados e identificar potenciais preconceitos nos dados que possam levar a problemas de equidade, inclusividade e fiabilidade. -* **Interpretabilidade do modelo**. Para entender o que afeta ou influencia as previsões do modelo. Isso ajuda a explicar o comportamento do modelo, o que é importante para transparência e responsabilidade. - -## 🚀 Desafio - -Para evitar que danos sejam introduzidos desde o início, devemos: - -- ter diversidade de origens e perspetivas entre as pessoas que trabalham nos sistemas -- investir em conjuntos de dados que reflitam a diversidade da nossa sociedade -- desenvolver melhores métodos ao longo do ciclo de vida do machine learning para detetar e corrigir problemas de IA responsável quando eles ocorrerem - -Pense em cenários da vida real onde a falta de confiança num modelo é evidente na construção e utilização do modelo. O que mais deveríamos considerar? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Estudo Individual - -Nesta lição, aprendeu alguns conceitos básicos sobre equidade e falta de equidade no machine learning. -Assista a este workshop para aprofundar os tópicos: - -- Em busca de IA responsável: Aplicando princípios na prática por Besmira Nushi, Mehrnoosh Sameki e Amit Sharma - -[![Responsible AI Toolbox: Uma framework de código aberto para construir IA responsável](https://img.youtube.com/vi/tGgJCrA-MZU/0.jpg)](https://www.youtube.com/watch?v=tGgJCrA-MZU "RAI Toolbox: Uma framework de código aberto para construir IA responsável") - -> 🎥 Clique na imagem acima para assistir ao vídeo: RAI Toolbox: Uma framework de código aberto para construir IA responsável por Besmira Nushi, Mehrnoosh Sameki e Amit Sharma - -Além disso, leia: - -- Centro de recursos de IA responsável da Microsoft: [Responsible AI Resources – Microsoft AI](https://www.microsoft.com/ai/responsible-ai-resources?activetab=pivot1%3aprimaryr4) - -- Grupo de pesquisa FATE da Microsoft: [FATE: Fairness, Accountability, Transparency, and Ethics in AI - Microsoft Research](https://www.microsoft.com/research/theme/fate/) - -RAI Toolbox: - -- [Repositório GitHub do Responsible AI Toolbox](https://github.com/microsoft/responsible-ai-toolbox) - -Leia sobre as ferramentas do Azure Machine Learning para garantir equidade: - -- [Azure Machine Learning](https://docs.microsoft.com/azure/machine-learning/concept-fairness-ml?WT.mc_id=academic-77952-leestott) - -## Tarefa - -[Explore o RAI Toolbox](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/3-fairness/assignment.md b/translations/pt/1-Introduction/3-fairness/assignment.md deleted file mode 100644 index 4d0c21bc8..000000000 --- a/translations/pt/1-Introduction/3-fairness/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Explore a Caixa de Ferramentas de IA Responsável - -## Instruções - -Nesta lição, aprendeu sobre a Caixa de Ferramentas de IA Responsável, um "projeto de código aberto e orientado pela comunidade para ajudar cientistas de dados a analisar e melhorar sistemas de IA." Para esta tarefa, explore um dos [notebooks](https://github.com/microsoft/responsible-ai-toolbox/blob/main/notebooks/responsibleaidashboard/getting-started.ipynb) da RAI Toolbox e relate as suas descobertas num artigo ou apresentação. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | --------- | -------- | ----------------------- | -| | Um artigo ou apresentação em PowerPoint é apresentado discutindo os sistemas do Fairlearn, o notebook que foi executado e as conclusões obtidas a partir da sua execução | Um artigo é apresentado sem conclusões | Nenhum artigo é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/4-techniques-of-ML/README.md b/translations/pt/1-Introduction/4-techniques-of-ML/README.md deleted file mode 100644 index 07de5e82b..000000000 --- a/translations/pt/1-Introduction/4-techniques-of-ML/README.md +++ /dev/null @@ -1,132 +0,0 @@ - -# Técnicas de Aprendizagem Automática - -O processo de construir, utilizar e manter modelos de aprendizagem automática e os dados que eles utilizam é muito diferente de muitos outros fluxos de trabalho de desenvolvimento. Nesta lição, vamos desmistificar o processo e delinear as principais técnicas que precisa conhecer. Você irá: - -- Compreender os processos que sustentam a aprendizagem automática a um nível elevado. -- Explorar conceitos básicos como 'modelos', 'previsões' e 'dados de treino'. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -[![ML para iniciantes - Técnicas de Aprendizagem Automática](https://img.youtube.com/vi/4NGM0U2ZSHU/0.jpg)](https://youtu.be/4NGM0U2ZSHU "ML para iniciantes - Técnicas de Aprendizagem Automática") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre esta lição. - -## Introdução - -De forma geral, o processo de criação de processos de aprendizagem automática (ML) é composto por várias etapas: - -1. **Definir a pergunta**. A maioria dos processos de ML começa com uma pergunta que não pode ser respondida por um programa condicional simples ou um motor baseado em regras. Estas perguntas geralmente giram em torno de previsões baseadas numa coleção de dados. -2. **Recolher e preparar os dados**. Para responder à sua pergunta, precisa de dados. A qualidade e, por vezes, a quantidade dos seus dados determinarão o quão bem pode responder à pergunta inicial. Visualizar os dados é um aspeto importante desta fase. Esta fase também inclui dividir os dados em grupos de treino e teste para construir um modelo. -3. **Escolher um método de treino**. Dependendo da sua pergunta e da natureza dos seus dados, precisa de escolher como deseja treinar um modelo para refletir melhor os seus dados e fazer previsões precisas. Esta é a parte do processo de ML que requer conhecimentos específicos e, muitas vezes, uma quantidade considerável de experimentação. -4. **Treinar o modelo**. Usando os seus dados de treino, utilizará vários algoritmos para treinar um modelo que reconheça padrões nos dados. O modelo pode usar pesos internos que podem ser ajustados para privilegiar certas partes dos dados em detrimento de outras, a fim de construir um modelo melhor. -5. **Avaliar o modelo**. Utiliza dados nunca antes vistos (os seus dados de teste) do conjunto recolhido para verificar o desempenho do modelo. -6. **Ajustar parâmetros**. Com base no desempenho do modelo, pode refazer o processo utilizando diferentes parâmetros ou variáveis que controlam o comportamento dos algoritmos usados para treinar o modelo. -7. **Prever**. Use novos dados de entrada para testar a precisão do modelo. - -## Que pergunta fazer - -Os computadores são particularmente habilidosos em descobrir padrões ocultos nos dados. Esta capacidade é muito útil para investigadores que têm perguntas sobre um determinado domínio que não podem ser facilmente respondidas criando um motor de regras condicionais. Dada uma tarefa atuarial, por exemplo, um cientista de dados pode ser capaz de construir regras manuais sobre a mortalidade de fumadores versus não fumadores. - -Quando muitas outras variáveis são introduzidas na equação, no entanto, um modelo de ML pode revelar-se mais eficiente para prever taxas de mortalidade futuras com base no histórico de saúde passado. Um exemplo mais animador pode ser fazer previsões meteorológicas para o mês de abril numa determinada localização com base em dados que incluem latitude, longitude, alterações climáticas, proximidade ao oceano, padrões da corrente de jato, entre outros. - -✅ Este [conjunto de slides](https://www2.cisl.ucar.edu/sites/default/files/2021-10/0900%20June%2024%20Haupt_0.pdf) sobre modelos meteorológicos oferece uma perspetiva histórica sobre o uso de ML na análise do clima. - -## Tarefas pré-construção - -Antes de começar a construir o seu modelo, há várias tarefas que precisa de completar. Para testar a sua pergunta e formar uma hipótese com base nas previsões de um modelo, precisa de identificar e configurar vários elementos. - -### Dados - -Para responder à sua pergunta com algum grau de certeza, precisa de uma boa quantidade de dados do tipo certo. Há duas coisas que precisa de fazer neste momento: - -- **Recolher dados**. Tendo em mente a lição anterior sobre justiça na análise de dados, recolha os seus dados com cuidado. Esteja atento às fontes desses dados, a quaisquer preconceitos inerentes que possam ter e documente a sua origem. -- **Preparar dados**. Há vários passos no processo de preparação de dados. Pode ser necessário reunir dados e normalizá-los se vierem de fontes diversas. Pode melhorar a qualidade e a quantidade dos dados através de vários métodos, como converter strings em números (como fazemos em [Clustering](../../5-Clustering/1-Visualize/README.md)). Também pode gerar novos dados com base nos originais (como fazemos em [Classificação](../../4-Classification/1-Introduction/README.md)). Pode limpar e editar os dados (como faremos antes da lição sobre [Aplicações Web](../../3-Web-App/README.md)). Por fim, pode ser necessário randomizar e embaralhar os dados, dependendo das suas técnicas de treino. - -✅ Após recolher e processar os seus dados, reserve um momento para verificar se a sua estrutura permitirá abordar a pergunta pretendida. Pode ser que os dados não funcionem bem na sua tarefa, como descobrimos nas nossas lições de [Clustering](../../5-Clustering/1-Visualize/README.md)! - -### Features e Target - -Uma [feature](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) é uma propriedade mensurável dos seus dados. Em muitos conjuntos de dados, é expressa como um cabeçalho de coluna, como 'data', 'tamanho' ou 'cor'. A sua variável de feature, geralmente representada como `X` no código, representa a variável de entrada que será usada para treinar o modelo. - -Um target é aquilo que está a tentar prever. O target, geralmente representado como `y` no código, representa a resposta à pergunta que está a tentar fazer aos seus dados: em dezembro, qual será a **cor** das abóboras mais baratas? Em São Francisco, que bairros terão o melhor **preço** imobiliário? Às vezes, o target também é referido como atributo de rótulo. - -### Selecionar a sua variável de feature - -🎓 **Seleção de Features e Extração de Features** Como saber qual variável escolher ao construir um modelo? Provavelmente passará por um processo de seleção de features ou extração de features para escolher as variáveis certas para o modelo mais eficiente. No entanto, não são a mesma coisa: "A extração de features cria novas features a partir de funções das features originais, enquanto a seleção de features retorna um subconjunto das features." ([fonte](https://wikipedia.org/wiki/Feature_selection)) - -### Visualizar os seus dados - -Um aspeto importante do conjunto de ferramentas de um cientista de dados é a capacidade de visualizar dados usando várias bibliotecas excelentes, como Seaborn ou MatPlotLib. Representar os seus dados visualmente pode permitir-lhe descobrir correlações ocultas que pode aproveitar. As suas visualizações também podem ajudá-lo a identificar preconceitos ou dados desequilibrados (como descobrimos em [Classificação](../../4-Classification/2-Classifiers-1/README.md)). - -### Dividir o seu conjunto de dados - -Antes de treinar, precisa de dividir o seu conjunto de dados em duas ou mais partes de tamanhos desiguais que ainda representem bem os dados. - -- **Treino**. Esta parte do conjunto de dados é ajustada ao seu modelo para treiná-lo. Este conjunto constitui a maior parte do conjunto de dados original. -- **Teste**. Um conjunto de teste é um grupo independente de dados, muitas vezes retirado dos dados originais, que utiliza para confirmar o desempenho do modelo construído. -- **Validação**. Um conjunto de validação é um grupo independente menor de exemplos que utiliza para ajustar os hiperparâmetros ou a arquitetura do modelo, a fim de melhorá-lo. Dependendo do tamanho dos seus dados e da pergunta que está a fazer, pode não ser necessário construir este terceiro conjunto (como notamos em [Previsão de Séries Temporais](../../7-TimeSeries/1-Introduction/README.md)). - -## Construir um modelo - -Usando os seus dados de treino, o seu objetivo é construir um modelo, ou uma representação estatística dos seus dados, utilizando vários algoritmos para **treiná-lo**. Treinar um modelo expõe-no aos dados e permite-lhe fazer suposições sobre padrões percebidos que descobre, valida e aceita ou rejeita. - -### Decidir sobre um método de treino - -Dependendo da sua pergunta e da natureza dos seus dados, escolherá um método para treiná-lo. Explorando a [documentação do Scikit-learn](https://scikit-learn.org/stable/user_guide.html) - que usamos neste curso - pode descobrir várias formas de treinar um modelo. Dependendo da sua experiência, pode ter de experimentar vários métodos diferentes para construir o melhor modelo. É provável que passe por um processo em que os cientistas de dados avaliam o desempenho de um modelo alimentando-o com dados não vistos, verificando a precisão, preconceitos e outros problemas que degradam a qualidade, e selecionando o método de treino mais apropriado para a tarefa em questão. - -### Treinar um modelo - -Com os seus dados de treino, está pronto para 'ajustá-los' para criar um modelo. Notará que em muitas bibliotecas de ML encontrará o código 'model.fit' - é neste momento que envia a sua variável de feature como um array de valores (geralmente 'X') e uma variável target (geralmente 'y'). - -### Avaliar o modelo - -Uma vez concluído o processo de treino (pode levar muitas iterações, ou 'épocas', para treinar um modelo grande), poderá avaliar a qualidade do modelo utilizando dados de teste para medir o seu desempenho. Estes dados são um subconjunto dos dados originais que o modelo ainda não analisou. Pode imprimir uma tabela de métricas sobre a qualidade do modelo. - -🎓 **Ajuste do modelo** - -No contexto da aprendizagem automática, o ajuste do modelo refere-se à precisão da função subjacente do modelo enquanto tenta analisar dados com os quais não está familiarizado. - -🎓 **Subajuste** e **sobreajuste** são problemas comuns que degradam a qualidade do modelo, pois o modelo ajusta-se ou não suficientemente bem ou bem demais. Isso faz com que o modelo faça previsões muito alinhadas ou pouco alinhadas com os seus dados de treino. Um modelo sobreajustado prevê os dados de treino muito bem porque aprendeu os detalhes e o ruído dos dados em excesso. Um modelo subajustado não é preciso, pois não consegue analisar com precisão nem os dados de treino nem os dados que ainda não 'viu'. - -![modelo sobreajustado](../../../../1-Introduction/4-techniques-of-ML/images/overfitting.png) -> Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -## Ajuste de parâmetros - -Depois de concluir o treino inicial, observe a qualidade do modelo e considere melhorá-lo ajustando os seus 'hiperparâmetros'. Leia mais sobre o processo [na documentação](https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters?WT.mc_id=academic-77952-leestott). - -## Previsão - -Este é o momento em que pode usar dados completamente novos para testar a precisão do seu modelo. Num cenário de ML 'aplicado', onde está a construir ativos web para usar o modelo em produção, este processo pode envolver a recolha de input do utilizador (um clique num botão, por exemplo) para definir uma variável e enviá-la ao modelo para inferência ou avaliação. - -Nestes módulos, descobrirá como usar estes passos para preparar, construir, testar, avaliar e prever - todos os gestos de um cientista de dados e mais, à medida que progride na sua jornada para se tornar um engenheiro de ML 'full stack'. - ---- - -## 🚀Desafio - -Desenhe um fluxograma refletindo os passos de um praticante de ML. Onde se encontra neste momento no processo? Onde prevê que encontrará dificuldades? O que lhe parece fácil? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Estudo Individual - -Pesquise online entrevistas com cientistas de dados que discutam o seu trabalho diário. Aqui está [uma](https://www.youtube.com/watch?v=Z3IjgbbCEfs). - -## Tarefa - -[Entrevistar um cientista de dados](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/4-techniques-of-ML/assignment.md b/translations/pt/1-Introduction/4-techniques-of-ML/assignment.md deleted file mode 100644 index 741985911..000000000 --- a/translations/pt/1-Introduction/4-techniques-of-ML/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Entrevistar um cientista de dados - -## Instruções - -Na sua empresa, num grupo de utilizadores, ou entre os seus amigos ou colegas de estudo, converse com alguém que trabalhe profissionalmente como cientista de dados. Escreva um pequeno artigo (500 palavras) sobre as suas ocupações diárias. São especialistas ou trabalham de forma 'full stack'? - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | ----------------------------------------------------------------------------------- | ----------------------------------------------------------------- | ----------------------- | -| | Um artigo com o comprimento correto, com fontes atribuídas, apresentado como um ficheiro .doc | O artigo tem atribuições inadequadas ou é mais curto do que o comprimento exigido | Nenhum artigo é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/1-Introduction/README.md b/translations/pt/1-Introduction/README.md deleted file mode 100644 index 4d3a422de..000000000 --- a/translations/pt/1-Introduction/README.md +++ /dev/null @@ -1,37 +0,0 @@ - -# Introdução ao aprendizado de máquina - -Nesta seção do currículo, será apresentada uma introdução aos conceitos básicos que fundamentam o campo do aprendizado de máquina, o que ele é, além de aprender sobre sua história e as técnicas que os pesquisadores utilizam para trabalhar com ele. Vamos explorar juntos este novo mundo do aprendizado de máquina! - -![globo](../../../translated_images/pt-PT/globe.59f26379ceb40428.webp) -> Foto por Bill Oxford no Unsplash - -### Aulas - -1. [Introdução ao aprendizado de máquina](1-intro-to-ML/README.md) -1. [A história do aprendizado de máquina e da IA](2-history-of-ML/README.md) -1. [Justiça e aprendizado de máquina](3-fairness/README.md) -1. [Técnicas de aprendizado de máquina](4-techniques-of-ML/README.md) - -### Créditos - -"Introdução ao Aprendizado de Máquina" foi escrito com ♥️ por uma equipe de pessoas incluindo [Muhammad Sakib Khan Inan](https://twitter.com/Sakibinan), [Ornella Altunyan](https://twitter.com/ornelladotcom) e [Jen Looper](https://twitter.com/jenlooper) - -"A História do Aprendizado de Máquina" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper) e [Amy Boyd](https://twitter.com/AmyKateNicho) - -"Justiça e Aprendizado de Máquina" foi escrito com ♥️ por [Tomomi Imura](https://twitter.com/girliemac) - -"Técnicas de Aprendizado de Máquina" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper) e [Chris Noring](https://twitter.com/softchris) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/1-Tools/README.md b/translations/pt/2-Regression/1-Tools/README.md deleted file mode 100644 index acfac2767..000000000 --- a/translations/pt/2-Regression/1-Tools/README.md +++ /dev/null @@ -1,239 +0,0 @@ - -# Introdução ao Python e Scikit-learn para modelos de regressão - -![Resumo de regressões em um sketchnote](../../../../sketchnotes/ml-regression.png) - -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/1-Tools/solution/R/lesson_1.html) - -## Introdução - -Nestes quatro módulos, irá aprender a construir modelos de regressão. Vamos discutir brevemente para que servem. Mas antes de começar, certifique-se de que tem as ferramentas certas para iniciar o processo! - -Nesta lição, irá aprender a: - -- Configurar o seu computador para tarefas locais de machine learning. -- Trabalhar com Jupyter notebooks. -- Utilizar Scikit-learn, incluindo a instalação. -- Explorar regressão linear com um exercício prático. - -## Instalações e configurações - -[![ML para iniciantes - Configure as suas ferramentas para criar modelos de Machine Learning](https://img.youtube.com/vi/-DfeD2k2Kj0/0.jpg)](https://youtu.be/-DfeD2k2Kj0 "ML para iniciantes - Configure as suas ferramentas para criar modelos de Machine Learning") - -> 🎥 Clique na imagem acima para um vídeo curto sobre como configurar o seu computador para ML. - -1. **Instale o Python**. Certifique-se de que o [Python](https://www.python.org/downloads/) está instalado no seu computador. Irá utilizar Python para muitas tarefas de ciência de dados e machine learning. A maioria dos sistemas já inclui uma instalação do Python. Existem também [Pacotes de Codificação Python](https://code.visualstudio.com/learn/educators/installers?WT.mc_id=academic-77952-leestott) úteis para facilitar a configuração para alguns utilizadores. - - No entanto, algumas utilizações do Python requerem uma versão específica do software. Por isso, é útil trabalhar num [ambiente virtual](https://docs.python.org/3/library/venv.html). - -2. **Instale o Visual Studio Code**. Certifique-se de que tem o Visual Studio Code instalado no seu computador. Siga estas instruções para [instalar o Visual Studio Code](https://code.visualstudio.com/) para uma instalação básica. Vai utilizar Python no Visual Studio Code neste curso, por isso pode ser útil rever como [configurar o Visual Studio Code](https://docs.microsoft.com/learn/modules/python-install-vscode?WT.mc_id=academic-77952-leestott) para desenvolvimento em Python. - - > Familiarize-se com Python ao explorar esta coleção de [módulos de aprendizagem](https://docs.microsoft.com/users/jenlooper-2911/collections/mp1pagggd5qrq7?WT.mc_id=academic-77952-leestott) - > - > [![Configurar Python com Visual Studio Code](https://img.youtube.com/vi/yyQM70vi7V8/0.jpg)](https://youtu.be/yyQM70vi7V8 "Configurar Python com Visual Studio Code") - > - > 🎥 Clique na imagem acima para um vídeo: usar Python no VS Code. - -3. **Instale o Scikit-learn**, seguindo [estas instruções](https://scikit-learn.org/stable/install.html). Como precisa de garantir que utiliza Python 3, é recomendado que use um ambiente virtual. Note que, se estiver a instalar esta biblioteca num Mac com M1, existem instruções específicas na página acima. - -4. **Instale o Jupyter Notebook**. Será necessário [instalar o pacote Jupyter](https://pypi.org/project/jupyter/). - -## O seu ambiente de desenvolvimento para ML - -Irá utilizar **notebooks** para desenvolver o seu código Python e criar modelos de machine learning. Este tipo de ficheiro é uma ferramenta comum para cientistas de dados e pode ser identificado pela extensão `.ipynb`. - -Os notebooks são um ambiente interativo que permite ao programador tanto codificar como adicionar notas e escrever documentação em torno do código, o que é bastante útil para projetos experimentais ou de pesquisa. - -[![ML para iniciantes - Configurar Jupyter Notebooks para começar a criar modelos de regressão](https://img.youtube.com/vi/7E-jC8FLA2E/0.jpg)](https://youtu.be/7E-jC8FLA2E "ML para iniciantes - Configurar Jupyter Notebooks para começar a criar modelos de regressão") - -> 🎥 Clique na imagem acima para um vídeo curto sobre este exercício. - -### Exercício - trabalhar com um notebook - -Nesta pasta, encontrará o ficheiro _notebook.ipynb_. - -1. Abra o _notebook.ipynb_ no Visual Studio Code. - - Um servidor Jupyter será iniciado com Python 3+. Encontrará áreas do notebook que podem ser `executadas`, ou seja, blocos de código. Pode executar um bloco de código selecionando o ícone que parece um botão de reprodução. - -2. Selecione o ícone `md` e adicione um pouco de markdown com o seguinte texto: **# Bem-vindo ao seu notebook**. - - Em seguida, adicione algum código Python. - -3. Escreva **print('hello notebook')** no bloco de código. -4. Selecione a seta para executar o código. - - Deverá ver a seguinte saída: - - ```output - hello notebook - ``` - -![VS Code com um notebook aberto](../../../../2-Regression/1-Tools/images/notebook.jpg) - -Pode intercalar o seu código com comentários para auto-documentar o notebook. - -✅ Pense por um momento como o ambiente de trabalho de um programador web é diferente do de um cientista de dados. - -## Começar com Scikit-learn - -Agora que o Python está configurado no seu ambiente local e está confortável com Jupyter notebooks, vamos ficar igualmente confortáveis com o Scikit-learn (pronuncia-se `sci` como em `science`). O Scikit-learn fornece uma [API extensa](https://scikit-learn.org/stable/modules/classes.html#api-ref) para ajudá-lo a realizar tarefas de ML. - -De acordo com o [site oficial](https://scikit-learn.org/stable/getting_started.html), "Scikit-learn é uma biblioteca de machine learning de código aberto que suporta aprendizagem supervisionada e não supervisionada. Também fornece várias ferramentas para ajuste de modelos, pré-processamento de dados, seleção e avaliação de modelos, entre outras utilidades." - -Neste curso, irá utilizar Scikit-learn e outras ferramentas para construir modelos de machine learning para realizar o que chamamos de tarefas de 'machine learning tradicional'. Evitamos deliberadamente redes neurais e deep learning, pois estes tópicos serão abordados no nosso futuro currículo 'AI for Beginners'. - -O Scikit-learn torna simples a construção e avaliação de modelos para uso. Ele é focado principalmente no uso de dados numéricos e contém vários conjuntos de dados prontos para uso como ferramentas de aprendizagem. Também inclui modelos pré-construídos para os alunos experimentarem. Vamos explorar o processo de carregar dados pré-embalados e usar um estimador para o primeiro modelo de ML com Scikit-learn com alguns dados básicos. - -## Exercício - o seu primeiro notebook com Scikit-learn - -> Este tutorial foi inspirado pelo [exemplo de regressão linear](https://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html#sphx-glr-auto-examples-linear-model-plot-ols-py) no site do Scikit-learn. - -[![ML para iniciantes - O seu primeiro projeto de regressão linear em Python](https://img.youtube.com/vi/2xkXL5EUpS0/0.jpg)](https://youtu.be/2xkXL5EUpS0 "ML para iniciantes - O seu primeiro projeto de regressão linear em Python") - -> 🎥 Clique na imagem acima para um vídeo curto sobre este exercício. - -No ficheiro _notebook.ipynb_ associado a esta lição, limpe todas as células pressionando o ícone da 'lixeira'. - -Nesta secção, irá trabalhar com um pequeno conjunto de dados sobre diabetes que está incluído no Scikit-learn para fins de aprendizagem. Imagine que queria testar um tratamento para pacientes diabéticos. Modelos de Machine Learning podem ajudá-lo a determinar quais pacientes responderiam melhor ao tratamento, com base em combinações de variáveis. Mesmo um modelo de regressão muito básico, quando visualizado, pode mostrar informações sobre variáveis que o ajudariam a organizar os seus ensaios clínicos teóricos. - -✅ Existem muitos tipos de métodos de regressão, e a escolha depende da resposta que procura. Se quiser prever a altura provável de uma pessoa com uma determinada idade, utilizaria regressão linear, pois está à procura de um **valor numérico**. Se estiver interessado em descobrir se um tipo de cozinha deve ser considerado vegan ou não, está à procura de uma **atribuição de categoria**, então utilizaria regressão logística. Aprenderá mais sobre regressão logística mais tarde. Pense um pouco sobre algumas perguntas que pode fazer aos dados e qual destes métodos seria mais apropriado. - -Vamos começar esta tarefa. - -### Importar bibliotecas - -Para esta tarefa, iremos importar algumas bibliotecas: - -- **matplotlib**. É uma ferramenta útil para [criação de gráficos](https://matplotlib.org/) e será usada para criar um gráfico de linha. -- **numpy**. [numpy](https://numpy.org/doc/stable/user/whatisnumpy.html) é uma biblioteca útil para manipulação de dados numéricos em Python. -- **sklearn**. Esta é a biblioteca [Scikit-learn](https://scikit-learn.org/stable/user_guide.html). - -Importe algumas bibliotecas para ajudar nas suas tarefas. - -1. Adicione as importações escrevendo o seguinte código: - - ```python - import matplotlib.pyplot as plt - import numpy as np - from sklearn import datasets, linear_model, model_selection - ``` - - Acima, está a importar `matplotlib`, `numpy` e está a importar `datasets`, `linear_model` e `model_selection` do `sklearn`. `model_selection` é usado para dividir os dados em conjuntos de treino e teste. - -### O conjunto de dados sobre diabetes - -O [conjunto de dados sobre diabetes](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) incluído possui 442 amostras de dados sobre diabetes, com 10 variáveis de características, algumas das quais incluem: - -- age: idade em anos -- bmi: índice de massa corporal -- bp: pressão arterial média -- s1 tc: T-Cells (um tipo de glóbulos brancos) - -✅ Este conjunto de dados inclui o conceito de 'sexo' como uma variável de característica importante para a pesquisa sobre diabetes. Muitos conjuntos de dados médicos incluem este tipo de classificação binária. Pense um pouco sobre como categorizações como esta podem excluir certas partes da população de tratamentos. - -Agora, carregue os dados X e y. - -> 🎓 Lembre-se, isto é aprendizagem supervisionada, e precisamos de um alvo 'y' nomeado. - -Numa nova célula de código, carregue o conjunto de dados sobre diabetes chamando `load_diabetes()`. O parâmetro `return_X_y=True` indica que `X` será uma matriz de dados e `y` será o alvo da regressão. - -1. Adicione alguns comandos `print` para mostrar a forma da matriz de dados e o seu primeiro elemento: - - ```python - X, y = datasets.load_diabetes(return_X_y=True) - print(X.shape) - print(X[0]) - ``` - - O que está a receber como resposta é uma tupla. O que está a fazer é atribuir os dois primeiros valores da tupla a `X` e `y`, respetivamente. Saiba mais [sobre tuplas](https://wikipedia.org/wiki/Tuple). - - Pode ver que estes dados têm 442 itens organizados em arrays de 10 elementos: - - ```text - (442, 10) - [ 0.03807591 0.05068012 0.06169621 0.02187235 -0.0442235 -0.03482076 - -0.04340085 -0.00259226 0.01990842 -0.01764613] - ``` - - ✅ Pense um pouco sobre a relação entre os dados e o alvo da regressão. A regressão linear prevê relações entre a característica X e a variável alvo y. Consegue encontrar o [alvo](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) para o conjunto de dados sobre diabetes na documentação? O que este conjunto de dados está a demonstrar, dado o alvo? - -2. Em seguida, selecione uma parte deste conjunto de dados para plotar, escolhendo a 3ª coluna do conjunto de dados. Pode fazer isso utilizando o operador `:` para selecionar todas as linhas e, em seguida, selecionando a 3ª coluna usando o índice (2). Também pode remodelar os dados para serem um array 2D - conforme necessário para plotagem - utilizando `reshape(n_rows, n_columns)`. Se um dos parâmetros for -1, a dimensão correspondente será calculada automaticamente. - - ```python - X = X[:, 2] - X = X.reshape((-1,1)) - ``` - - ✅ A qualquer momento, imprima os dados para verificar a sua forma. - -3. Agora que tem os dados prontos para serem plotados, pode verificar se uma máquina pode ajudar a determinar uma divisão lógica entre os números neste conjunto de dados. Para isso, precisa de dividir tanto os dados (X) quanto o alvo (y) em conjuntos de teste e treino. O Scikit-learn tem uma forma simples de fazer isso; pode dividir os seus dados de teste num ponto específico. - - ```python - X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.33) - ``` - -4. Agora está pronto para treinar o seu modelo! Carregue o modelo de regressão linear e treine-o com os seus conjuntos de treino X e y utilizando `model.fit()`: - - ```python - model = linear_model.LinearRegression() - model.fit(X_train, y_train) - ``` - - ✅ `model.fit()` é uma função que verá em muitas bibliotecas de ML, como TensorFlow. - -5. Em seguida, crie uma previsão utilizando os dados de teste, com a função `predict()`. Isto será usado para desenhar a linha entre os grupos de dados. - - ```python - y_pred = model.predict(X_test) - ``` - -6. Agora é hora de mostrar os dados num gráfico. O Matplotlib é uma ferramenta muito útil para esta tarefa. Crie um scatterplot de todos os dados de teste X e y, e utilize a previsão para desenhar uma linha no local mais apropriado, entre os agrupamentos de dados do modelo. - - ```python - plt.scatter(X_test, y_test, color='black') - plt.plot(X_test, y_pred, color='blue', linewidth=3) - plt.xlabel('Scaled BMIs') - plt.ylabel('Disease Progression') - plt.title('A Graph Plot Showing Diabetes Progression Against BMI') - plt.show() - ``` - - ![um scatterplot mostrando pontos de dados sobre diabetes](../../../../2-Regression/1-Tools/images/scatterplot.png) -✅ Pensa um pouco sobre o que está a acontecer aqui. Uma linha reta está a passar por muitos pequenos pontos de dados, mas o que está realmente a fazer? Consegues perceber como deverias ser capaz de usar esta linha para prever onde um novo ponto de dados, ainda não visto, deveria encaixar em relação ao eixo y do gráfico? Tenta expressar em palavras a utilidade prática deste modelo. - -Parabéns, construíste o teu primeiro modelo de regressão linear, criaste uma previsão com ele e exibiste-a num gráfico! - ---- -## 🚀Desafio - -Representa graficamente uma variável diferente deste conjunto de dados. Dica: edita esta linha: `X = X[:,2]`. Dado o objetivo deste conjunto de dados, o que consegues descobrir sobre a progressão da diabetes como doença? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Individual - -Neste tutorial, trabalhaste com regressão linear simples, em vez de regressão univariada ou múltipla. Lê um pouco sobre as diferenças entre estes métodos ou dá uma olhada [neste vídeo](https://www.coursera.org/lecture/quantifying-relationships-regression-models/linear-vs-nonlinear-categorical-variables-ai2Ef). - -Lê mais sobre o conceito de regressão e reflete sobre que tipo de perguntas podem ser respondidas com esta técnica. Faz este [tutorial](https://docs.microsoft.com/learn/modules/train-evaluate-regression-models?WT.mc_id=academic-77952-leestott) para aprofundar o teu entendimento. - -## Tarefa - -[Um conjunto de dados diferente](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/1-Tools/assignment.md b/translations/pt/2-Regression/1-Tools/assignment.md deleted file mode 100644 index 84b22d144..000000000 --- a/translations/pt/2-Regression/1-Tools/assignment.md +++ /dev/null @@ -1,27 +0,0 @@ - -# Regressão com Scikit-learn - -## Instruções - -Consulte o [Linnerud dataset](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_linnerud.html#sklearn.datasets.load_linnerud) no Scikit-learn. Este conjunto de dados possui múltiplos [alvos](https://scikit-learn.org/stable/datasets/toy_dataset.html#linnerrud-dataset): 'Consiste em três variáveis de exercício (dados) e três variáveis fisiológicas (alvo) coletadas de vinte homens de meia-idade em um clube de fitness'. - -Com as suas próprias palavras, descreva como criar um modelo de regressão que represente graficamente a relação entre a medida da cintura e o número de abdominais realizados. Faça o mesmo para os outros pontos de dados deste conjunto de dados. - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita de Melhorias | -| ------------------------------ | ----------------------------------- | ----------------------------- | -------------------------- | -| Submeter um parágrafo descritivo | Um parágrafo bem escrito é submetido | Algumas frases são submetidas | Nenhuma descrição é fornecida | - ---- - -**Aviso**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos pela precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/1-Tools/notebook.ipynb b/translations/pt/2-Regression/1-Tools/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/pt/2-Regression/1-Tools/solution/Julia/README.md b/translations/pt/2-Regression/1-Tools/solution/Julia/README.md deleted file mode 100644 index e9c4e967b..000000000 --- a/translations/pt/2-Regression/1-Tools/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/1-Tools/solution/R/lesson_1-R.ipynb b/translations/pt/2-Regression/1-Tools/solution/R/lesson_1-R.ipynb deleted file mode 100644 index a397363e4..000000000 --- a/translations/pt/2-Regression/1-Tools/solution/R/lesson_1-R.ipynb +++ /dev/null @@ -1,449 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_1-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "c18d3bd0bd8ae3878597e89dcd1fa5c1", - "translation_date": "2025-09-03T19:42:25+00:00", - "source_file": "2-Regression/1-Tools/solution/R/lesson_1-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "YJUHCXqK57yz" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Introdução à Regressão - Aula 1\n", - "\n", - "#### Colocando em Perspectiva\n", - "\n", - "✅ Existem muitos tipos de métodos de regressão, e qual você escolhe depende da resposta que está procurando. Se quiser prever a altura provável de uma pessoa com uma determinada idade, utilizaria `regressão linear`, pois está à procura de um **valor numérico**. Se estiver interessado em descobrir se um tipo de culinária deve ser considerado vegano ou não, está à procura de uma **atribuição de categoria**, então utilizaria `regressão logística`. Aprenderá mais sobre regressão logística mais adiante. Pense um pouco sobre algumas perguntas que pode fazer aos dados e qual desses métodos seria mais apropriado.\n", - "\n", - "Nesta seção, irá trabalhar com um [pequeno conjunto de dados sobre diabetes](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html). Imagine que queria testar um tratamento para pacientes diabéticos. Modelos de Machine Learning podem ajudar a determinar quais pacientes responderiam melhor ao tratamento, com base em combinações de variáveis. Mesmo um modelo de regressão muito básico, quando visualizado, pode mostrar informações sobre variáveis que ajudariam a organizar os seus ensaios clínicos teóricos.\n", - "\n", - "Dito isso, vamos começar esta tarefa!\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "\n" - ], - "metadata": { - "id": "LWNNzfqd6feZ" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 1. Carregar o nosso conjunto de ferramentas\n", - "\n", - "Para esta tarefa, vamos precisar dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizagem automática.\n", - "\n", - "Pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\"))`\n", - "\n", - "O script abaixo verifica se tem os pacotes necessários para completar este módulo e instala-os caso algum esteja em falta.\n" - ], - "metadata": { - "id": "FIo2YhO26wI9" - } - }, - { - "cell_type": "code", - "execution_count": 2, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\n", - "pacman::p_load(tidyverse, tidymodels)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "Loading required package: pacman\n", - "\n" - ] - } - ], - "metadata": { - "id": "cIA9fz9v7Dss", - "colab": { - "base_uri": "https://localhost:8080/" - }, - "outputId": "2df7073b-86b2-4b32-cb86-0da605a0dc11" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, vamos carregar estes pacotes incríveis e torná-los disponíveis na nossa sessão atual de R. (Isto é apenas para ilustração, `pacman::p_load()` já fez isso por si)\n" - ], - "metadata": { - "id": "gpO_P_6f9WUG" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# load the core Tidyverse packages\r\n", - "library(tidyverse)\r\n", - "\r\n", - "# load the core Tidymodels packages\r\n", - "library(tidymodels)\r\n" - ], - "outputs": [], - "metadata": { - "id": "NLMycgG-9ezO" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 2. O conjunto de dados sobre diabetes\n", - "\n", - "Neste exercício, vamos demonstrar nossas habilidades de regressão fazendo previsões com um conjunto de dados sobre diabetes. O [conjunto de dados sobre diabetes](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt) inclui `442 amostras` de dados relacionados à diabetes, com 10 variáveis preditoras, `idade`, `sexo`, `índice de massa corporal`, `pressão arterial média` e `seis medições de soro sanguíneo`, além de uma variável de resultado `y`: uma medida quantitativa da progressão da doença um ano após a linha de base.\n", - "\n", - "|Número de observações|442|\n", - "|----------------------|:---|\n", - "|Número de preditores|As primeiras 10 colunas são preditivas numéricas|\n", - "|Resultado/Alvo|A coluna 11 é uma medida quantitativa da progressão da doença um ano após a linha de base|\n", - "|Informação sobre os preditores|- idade em anos\n", - "||- sexo\n", - "||- bmi índice de massa corporal\n", - "||- bp pressão arterial média\n", - "||- s1 tc, colesterol sérico total\n", - "||- s2 ldl, lipoproteínas de baixa densidade\n", - "||- s3 hdl, lipoproteínas de alta densidade\n", - "||- s4 tch, colesterol total / HDL\n", - "||- s5 ltg, possivelmente logaritmo do nível de triglicerídeos no soro\n", - "||- s6 glu, nível de açúcar no sangue|\n", - "\n", - "\n", - "\n", - "> 🎓 Lembre-se, isto é aprendizagem supervisionada, e precisamos de um alvo chamado 'y'.\n", - "\n", - "Antes de poder manipular dados com R, é necessário importar os dados para a memória do R ou estabelecer uma conexão com os dados que o R possa usar para acessá-los remotamente.\n", - "\n", - "> O pacote [readr](https://readr.tidyverse.org/), que faz parte do Tidyverse, oferece uma maneira rápida e amigável de ler dados retangulares no R.\n", - "\n", - "Agora, vamos carregar o conjunto de dados sobre diabetes fornecido neste URL de origem: \n", - "\n", - "Além disso, faremos uma verificação básica nos nossos dados usando `glimpse()` e exibiremos as primeiras 5 linhas usando `slice()`.\n", - "\n", - "Antes de avançarmos, vamos também introduzir algo que você encontrará frequentemente no código R 🥁🥁: o operador pipe `%>%`\n", - "\n", - "O operador pipe (`%>%`) realiza operações em sequência lógica, passando um objeto adiante para uma função ou expressão de chamada. Você pode pensar no operador pipe como dizendo \"e então\" no seu código.\n" - ], - "metadata": { - "id": "KM6iXLH996Cl" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Import the data set\r\n", - "diabetes <- read_table2(file = \"https://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt\")\r\n", - "\r\n", - "\r\n", - "# Get a glimpse and dimensions of the data\r\n", - "glimpse(diabetes)\r\n", - "\r\n", - "\r\n", - "# Select the first 5 rows of the data\r\n", - "diabetes %>% \r\n", - " slice(1:5)" - ], - "outputs": [], - "metadata": { - "id": "Z1geAMhM-bSP" - } - }, - { - "cell_type": "markdown", - "source": [ - "`glimpse()` mostra-nos que estes dados têm 442 linhas e 11 colunas, sendo todas as colunas do tipo de dados `double`.\n", - "\n", - "
\n", - "\n", - "> glimpse() e slice() são funções do [`dplyr`](https://dplyr.tidyverse.org/). Dplyr, parte do Tidyverse, é uma gramática de manipulação de dados que fornece um conjunto consistente de verbos para ajudar a resolver os desafios mais comuns de manipulação de dados.\n", - "\n", - "
\n", - "\n", - "Agora que temos os dados, vamos focar numa única característica (`bmi`) como alvo para este exercício. Isto exigirá que selecionemos as colunas desejadas. Então, como fazemos isso?\n", - "\n", - "[`dplyr::select()`](https://dplyr.tidyverse.org/reference/select.html) permite-nos *selecionar* (e opcionalmente renomear) colunas num data frame.\n" - ], - "metadata": { - "id": "UwjVT1Hz-c3Z" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Select predictor feature `bmi` and outcome `y`\r\n", - "diabetes_select <- diabetes %>% \r\n", - " select(c(bmi, y))\r\n", - "\r\n", - "# Print the first 5 rows\r\n", - "diabetes_select %>% \r\n", - " slice(1:10)" - ], - "outputs": [], - "metadata": { - "id": "RDY1oAKI-m80" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 3. Dados de Treino e Teste\n", - "\n", - "É uma prática comum em aprendizagem supervisionada *dividir* os dados em dois subconjuntos: um conjunto (geralmente maior) para treinar o modelo e um conjunto menor \"reservado\" para verificar como o modelo se comportou.\n", - "\n", - "Agora que temos os dados prontos, podemos verificar se uma máquina pode ajudar a determinar uma divisão lógica entre os números neste conjunto de dados. Podemos usar o pacote [rsample](https://tidymodels.github.io/rsample/), que faz parte do framework Tidymodels, para criar um objeto que contém as informações sobre *como* dividir os dados, e depois usar mais duas funções do rsample para extrair os conjuntos de treino e teste criados:\n" - ], - "metadata": { - "id": "SDk668xK-tc3" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "set.seed(2056)\r\n", - "# Split 67% of the data for training and the rest for tesing\r\n", - "diabetes_split <- diabetes_select %>% \r\n", - " initial_split(prop = 0.67)\r\n", - "\r\n", - "# Extract the resulting train and test sets\r\n", - "diabetes_train <- training(diabetes_split)\r\n", - "diabetes_test <- testing(diabetes_split)\r\n", - "\r\n", - "# Print the first 3 rows of the training set\r\n", - "diabetes_train %>% \r\n", - " slice(1:10)" - ], - "outputs": [], - "metadata": { - "id": "EqtHx129-1h-" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 4. Treinar um modelo de regressão linear com Tidymodels\n", - "\n", - "Agora estamos prontos para treinar o nosso modelo!\n", - "\n", - "No Tidymodels, especifica-se os modelos utilizando `parsnip()` ao definir três conceitos:\n", - "\n", - "- O **tipo** de modelo diferencia modelos como regressão linear, regressão logística, modelos de árvores de decisão, entre outros.\n", - "\n", - "- O **modo** do modelo inclui opções comuns como regressão e classificação; alguns tipos de modelo suportam ambos, enquanto outros têm apenas um modo.\n", - "\n", - "- O **motor** do modelo é a ferramenta computacional que será usada para ajustar o modelo. Muitas vezes, são pacotes R, como **`\"lm\"`** ou **`\"ranger\"`**\n", - "\n", - "Estas informações sobre o modelo são capturadas numa especificação de modelo, então vamos construir uma!\n" - ], - "metadata": { - "id": "sBOS-XhB-6v7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Build a linear model specification\r\n", - "lm_spec <- \r\n", - " # Type\r\n", - " linear_reg() %>% \r\n", - " # Engine\r\n", - " set_engine(\"lm\") %>% \r\n", - " # Mode\r\n", - " set_mode(\"regression\")\r\n", - "\r\n", - "\r\n", - "# Print the model specification\r\n", - "lm_spec" - ], - "outputs": [], - "metadata": { - "id": "20OwEw20--t3" - } - }, - { - "cell_type": "markdown", - "source": [ - "Depois de um modelo ter sido *especificado*, pode ser `estimado` ou `treinado` utilizando a função [`fit()`](https://parsnip.tidymodels.org/reference/fit.html), normalmente com uma fórmula e alguns dados.\n", - "\n", - "`y ~ .` significa que ajustaremos `y` como a quantidade/variável alvo prevista, explicada por todos os preditores/características, ou seja, `.` (neste caso, temos apenas um preditor: `bmi`).\n" - ], - "metadata": { - "id": "_oDHs89k_CJj" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Build a linear model specification\r\n", - "lm_spec <- linear_reg() %>% \r\n", - " set_engine(\"lm\") %>%\r\n", - " set_mode(\"regression\")\r\n", - "\r\n", - "\r\n", - "# Train a linear regression model\r\n", - "lm_mod <- lm_spec %>% \r\n", - " fit(y ~ ., data = diabetes_train)\r\n", - "\r\n", - "# Print the model\r\n", - "lm_mod" - ], - "outputs": [], - "metadata": { - "id": "YlsHqd-q_GJQ" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir do resultado do modelo, podemos observar os coeficientes aprendidos durante o treino. Eles representam os coeficientes da linha de melhor ajuste que nos proporciona o menor erro geral entre a variável real e a prevista.\n", - "
\n", - "\n", - "## 5. Fazer previsões no conjunto de teste\n", - "\n", - "Agora que treinámos um modelo, podemos utilizá-lo para prever a progressão da doença y para o conjunto de dados de teste usando [parsnip::predict()](https://parsnip.tidymodels.org/reference/predict.model_fit.html). Isto será usado para traçar a linha entre os grupos de dados.\n" - ], - "metadata": { - "id": "kGZ22RQj_Olu" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make predictions for the test set\r\n", - "predictions <- lm_mod %>% \r\n", - " predict(new_data = diabetes_test)\r\n", - "\r\n", - "# Print out some of the predictions\r\n", - "predictions %>% \r\n", - " slice(1:5)" - ], - "outputs": [], - "metadata": { - "id": "nXHbY7M2_aao" - } - }, - { - "cell_type": "markdown", - "source": [ - "Woohoo! 💃🕺 Acabámos de treinar um modelo e utilizámo-lo para fazer previsões!\n", - "\n", - "Ao fazer previsões, a convenção do tidymodels é sempre produzir um tibble/data frame de resultados com nomes de colunas padronizados. Isto facilita a combinação dos dados originais com as previsões num formato utilizável para operações subsequentes, como a criação de gráficos.\n", - "\n", - "`dplyr::bind_cols()` une eficientemente várias data frames por coluna.\n" - ], - "metadata": { - "id": "R_JstwUY_bIs" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Combine the predictions and the original test set\r\n", - "results <- diabetes_test %>% \r\n", - " bind_cols(predictions)\r\n", - "\r\n", - "\r\n", - "results %>% \r\n", - " slice(1:5)" - ], - "outputs": [], - "metadata": { - "id": "RybsMJR7_iI8" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 6. Representar os resultados do modelo\n", - "\n", - "Agora é hora de ver isto visualmente 📈. Vamos criar um gráfico de dispersão com todos os valores de `y` e `bmi` do conjunto de teste e, em seguida, usar as previsões para desenhar uma linha no lugar mais apropriado, entre os agrupamentos de dados do modelo.\n", - "\n", - "O R tem vários sistemas para criar gráficos, mas o `ggplot2` é um dos mais elegantes e versáteis. Este permite compor gráficos **combinando componentes independentes**.\n" - ], - "metadata": { - "id": "XJbYbMZW_n_s" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Set a theme for the plot\r\n", - "theme_set(theme_light())\r\n", - "# Create a scatter plot\r\n", - "results %>% \r\n", - " ggplot(aes(x = bmi)) +\r\n", - " # Add a scatter plot\r\n", - " geom_point(aes(y = y), size = 1.6) +\r\n", - " # Add a line plot\r\n", - " geom_line(aes(y = .pred), color = \"blue\", size = 1.5)" - ], - "outputs": [], - "metadata": { - "id": "R9tYp3VW_sTn" - } - }, - { - "cell_type": "markdown", - "source": [ - "✅ Pensa um pouco sobre o que está a acontecer aqui. Uma linha reta está a passar por muitos pequenos pontos de dados, mas o que está realmente a fazer? Consegues perceber como deverias ser capaz de usar esta linha para prever onde um novo ponto de dados, ainda não visto, deveria encaixar em relação ao eixo y do gráfico? Tenta expressar em palavras a utilidade prática deste modelo.\n", - "\n", - "Parabéns, construíste o teu primeiro modelo de regressão linear, criaste uma previsão com ele e exibiste-a num gráfico!\n" - ], - "metadata": { - "id": "zrPtHIxx_tNI" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/2-Regression/1-Tools/solution/notebook.ipynb b/translations/pt/2-Regression/1-Tools/solution/notebook.ipynb deleted file mode 100644 index aebeb137e..000000000 --- a/translations/pt/2-Regression/1-Tools/solution/notebook.ipynb +++ /dev/null @@ -1,675 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Importar bibliotecas necessárias\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "from sklearn import datasets, linear_model, model_selection\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Carregar o conjunto de dados de diabetes, dividido em dados `X` e características `y`\n" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(442, 10)\n", - "[ 0.03807591 0.05068012 0.06169621 0.02187239 -0.0442235 -0.03482076\n", - " -0.04340085 -0.00259226 0.01990749 -0.01764613]\n" - ] - } - ], - "source": [ - "X, y = datasets.load_diabetes(return_X_y=True)\n", - "print(X.shape)\n", - "print(X[0])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Selecione apenas uma funcionalidade para focar neste exercício\n" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(442,)\n" - ] - } - ], - "source": [ - "# Selecting the 3rd feature\n", - "X = X[:, 2]\n", - "print(X.shape)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(442, 1)\n", - "[[ 0.06169621]\n", - " [-0.05147406]\n", - " [ 0.04445121]\n", - " [-0.01159501]\n", - " [-0.03638469]\n", - " [-0.04069594]\n", - " [-0.04716281]\n", - " [-0.00189471]\n", - " [ 0.06169621]\n", - " [ 0.03906215]\n", - " [-0.08380842]\n", - " [ 0.01750591]\n", - " [-0.02884001]\n", - " [-0.00189471]\n", - " [-0.02560657]\n", - " [-0.01806189]\n", - " [ 0.04229559]\n", - " [ 0.01211685]\n", - " [-0.0105172 ]\n", - " [-0.01806189]\n", - " [-0.05686312]\n", - " [-0.02237314]\n", - " [-0.00405033]\n", - " [ 0.06061839]\n", - " [ 0.03582872]\n", - " [-0.01267283]\n", - " [-0.07734155]\n", - " [ 0.05954058]\n", - " [-0.02129532]\n", - " [-0.00620595]\n", - " [ 0.04445121]\n", - " [-0.06548562]\n", - " [ 0.12528712]\n", - " [-0.05039625]\n", - " [-0.06332999]\n", - " [-0.03099563]\n", - " [ 0.02289497]\n", - " [ 0.01103904]\n", - " [ 0.07139652]\n", - " [ 0.01427248]\n", - " [-0.00836158]\n", - " [-0.06764124]\n", - " [-0.0105172 ]\n", - " [-0.02345095]\n", - " [ 0.06816308]\n", - " [-0.03530688]\n", - " [-0.01159501]\n", - " [-0.0730303 ]\n", - " [-0.04177375]\n", - " [ 0.01427248]\n", - " [-0.00728377]\n", - " [ 0.0164281 ]\n", - " [-0.00943939]\n", - " [-0.01590626]\n", - " [ 0.0250506 ]\n", - " [-0.04931844]\n", - " [ 0.04121778]\n", - " [-0.06332999]\n", - " [-0.06440781]\n", - " [-0.02560657]\n", - " [-0.00405033]\n", - " [ 0.00457217]\n", - " [-0.00728377]\n", - " [-0.0374625 ]\n", - " [-0.02560657]\n", - " [-0.02452876]\n", - " [-0.01806189]\n", - " [-0.01482845]\n", - " [-0.02991782]\n", - " [-0.046085 ]\n", - " [-0.06979687]\n", - " [ 0.03367309]\n", - " [-0.00405033]\n", - " [-0.02021751]\n", - " [ 0.00241654]\n", - " [-0.03099563]\n", - " [ 0.02828403]\n", - " [-0.03638469]\n", - " [-0.05794093]\n", - " [-0.0374625 ]\n", - " [ 0.01211685]\n", - " [-0.02237314]\n", - " [-0.03530688]\n", - " [ 0.00996123]\n", - " [-0.03961813]\n", - " [ 0.07139652]\n", - " [-0.07518593]\n", - " [-0.00620595]\n", - " [-0.04069594]\n", - " [-0.04824063]\n", - " [-0.02560657]\n", - " [ 0.0519959 ]\n", - " [ 0.00457217]\n", - " [-0.06440781]\n", - " [-0.01698407]\n", - " [-0.05794093]\n", - " [ 0.00996123]\n", - " [ 0.08864151]\n", - " [-0.00512814]\n", - " [-0.06440781]\n", - " [ 0.01750591]\n", - " [-0.04500719]\n", - " [ 0.02828403]\n", - " [ 0.04121778]\n", - " [ 0.06492964]\n", - " [-0.03207344]\n", - " [-0.07626374]\n", - " [ 0.04984027]\n", - " [ 0.04552903]\n", - " [-0.00943939]\n", - " [-0.03207344]\n", - " [ 0.00457217]\n", - " [ 0.02073935]\n", - " [ 0.01427248]\n", - " [ 0.11019775]\n", - " [ 0.00133873]\n", - " [ 0.05846277]\n", - " [-0.02129532]\n", - " [-0.0105172 ]\n", - " [-0.04716281]\n", - " [ 0.00457217]\n", - " [ 0.01750591]\n", - " [ 0.08109682]\n", - " [ 0.0347509 ]\n", - " [ 0.02397278]\n", - " [-0.00836158]\n", - " [-0.06117437]\n", - " [-0.00189471]\n", - " [-0.06225218]\n", - " [ 0.0164281 ]\n", - " [ 0.09618619]\n", - " [-0.06979687]\n", - " [-0.02129532]\n", - " [-0.05362969]\n", - " [ 0.0433734 ]\n", - " [ 0.05630715]\n", - " [-0.0816528 ]\n", - " [ 0.04984027]\n", - " [ 0.11127556]\n", - " [ 0.06169621]\n", - " [ 0.01427248]\n", - " [ 0.04768465]\n", - " [ 0.01211685]\n", - " [ 0.00564998]\n", - " [ 0.04660684]\n", - " [ 0.12852056]\n", - " [ 0.05954058]\n", - " [ 0.09295276]\n", - " [ 0.01535029]\n", - " [-0.00512814]\n", - " [ 0.0703187 ]\n", - " [-0.00405033]\n", - " [-0.00081689]\n", - " [-0.04392938]\n", - " [ 0.02073935]\n", - " [ 0.06061839]\n", - " [-0.0105172 ]\n", - " [-0.03315126]\n", - " [-0.06548562]\n", - " [ 0.0433734 ]\n", - " [-0.06225218]\n", - " [ 0.06385183]\n", - " [ 0.03043966]\n", - " [ 0.07247433]\n", - " [-0.0191397 ]\n", - " [-0.06656343]\n", - " [-0.06009656]\n", - " [ 0.06924089]\n", - " [ 0.05954058]\n", - " [-0.02668438]\n", - " [-0.02021751]\n", - " [-0.046085 ]\n", - " [ 0.07139652]\n", - " [-0.07949718]\n", - " [ 0.00996123]\n", - " [-0.03854032]\n", - " [ 0.01966154]\n", - " [ 0.02720622]\n", - " [-0.00836158]\n", - " [-0.01590626]\n", - " [ 0.00457217]\n", - " [-0.04285156]\n", - " [ 0.00564998]\n", - " [-0.03530688]\n", - " [ 0.02397278]\n", - " [-0.01806189]\n", - " [ 0.04229559]\n", - " [-0.0547075 ]\n", - " [-0.00297252]\n", - " [-0.06656343]\n", - " [-0.01267283]\n", - " [-0.04177375]\n", - " [-0.03099563]\n", - " [-0.00512814]\n", - " [-0.05901875]\n", - " [ 0.0250506 ]\n", - " [-0.046085 ]\n", - " [ 0.00349435]\n", - " [ 0.05415152]\n", - " [-0.04500719]\n", - " [-0.05794093]\n", - " [-0.05578531]\n", - " [ 0.00133873]\n", - " [ 0.03043966]\n", - " [ 0.00672779]\n", - " [ 0.04660684]\n", - " [ 0.02612841]\n", - " [ 0.04552903]\n", - " [ 0.04013997]\n", - " [-0.01806189]\n", - " [ 0.01427248]\n", - " [ 0.03690653]\n", - " [ 0.00349435]\n", - " [-0.07087468]\n", - " [-0.03315126]\n", - " [ 0.09403057]\n", - " [ 0.03582872]\n", - " [ 0.03151747]\n", - " [-0.06548562]\n", - " [-0.04177375]\n", - " [-0.03961813]\n", - " [-0.03854032]\n", - " [-0.02560657]\n", - " [-0.02345095]\n", - " [-0.06656343]\n", - " [ 0.03259528]\n", - " [-0.046085 ]\n", - " [-0.02991782]\n", - " [-0.01267283]\n", - " [-0.01590626]\n", - " [ 0.07139652]\n", - " [-0.03099563]\n", - " [ 0.00026092]\n", - " [ 0.03690653]\n", - " [ 0.03906215]\n", - " [-0.01482845]\n", - " [ 0.00672779]\n", - " [-0.06871905]\n", - " [-0.00943939]\n", - " [ 0.01966154]\n", - " [ 0.07462995]\n", - " [-0.00836158]\n", - " [-0.02345095]\n", - " [-0.046085 ]\n", - " [ 0.05415152]\n", - " [-0.03530688]\n", - " [-0.03207344]\n", - " [-0.0816528 ]\n", - " [ 0.04768465]\n", - " [ 0.06061839]\n", - " [ 0.05630715]\n", - " [ 0.09834182]\n", - " [ 0.05954058]\n", - " [ 0.03367309]\n", - " [ 0.05630715]\n", - " [-0.06548562]\n", - " [ 0.16085492]\n", - " [-0.05578531]\n", - " [-0.02452876]\n", - " [-0.03638469]\n", - " [-0.00836158]\n", - " [-0.04177375]\n", - " [ 0.12744274]\n", - " [-0.07734155]\n", - " [ 0.02828403]\n", - " [-0.02560657]\n", - " [-0.06225218]\n", - " [-0.00081689]\n", - " [ 0.08864151]\n", - " [-0.03207344]\n", - " [ 0.03043966]\n", - " [ 0.00888341]\n", - " [ 0.00672779]\n", - " [-0.02021751]\n", - " [-0.02452876]\n", - " [-0.01159501]\n", - " [ 0.02612841]\n", - " [-0.05901875]\n", - " [-0.03638469]\n", - " [-0.02452876]\n", - " [ 0.01858372]\n", - " [-0.0902753 ]\n", - " [-0.00512814]\n", - " [-0.05255187]\n", - " [-0.02237314]\n", - " [-0.02021751]\n", - " [-0.0547075 ]\n", - " [-0.00620595]\n", - " [-0.01698407]\n", - " [ 0.05522933]\n", - " [ 0.07678558]\n", - " [ 0.01858372]\n", - " [-0.02237314]\n", - " [ 0.09295276]\n", - " [-0.03099563]\n", - " [ 0.03906215]\n", - " [-0.06117437]\n", - " [-0.00836158]\n", - " [-0.0374625 ]\n", - " [-0.01375064]\n", - " [ 0.07355214]\n", - " [-0.02452876]\n", - " [ 0.03367309]\n", - " [ 0.0347509 ]\n", - " [-0.03854032]\n", - " [-0.03961813]\n", - " [-0.00189471]\n", - " [-0.03099563]\n", - " [-0.046085 ]\n", - " [ 0.00133873]\n", - " [ 0.06492964]\n", - " [ 0.04013997]\n", - " [-0.02345095]\n", - " [ 0.05307371]\n", - " [ 0.04013997]\n", - " [-0.02021751]\n", - " [ 0.01427248]\n", - " [-0.03422907]\n", - " [ 0.00672779]\n", - " [ 0.00457217]\n", - " [ 0.03043966]\n", - " [ 0.0519959 ]\n", - " [ 0.06169621]\n", - " [-0.00728377]\n", - " [ 0.00564998]\n", - " [ 0.05415152]\n", - " [-0.00836158]\n", - " [ 0.114509 ]\n", - " [ 0.06708527]\n", - " [-0.05578531]\n", - " [ 0.03043966]\n", - " [-0.02560657]\n", - " [ 0.10480869]\n", - " [-0.00620595]\n", - " [-0.04716281]\n", - " [-0.04824063]\n", - " [ 0.08540807]\n", - " [-0.01267283]\n", - " [-0.03315126]\n", - " [-0.00728377]\n", - " [-0.01375064]\n", - " [ 0.05954058]\n", - " [ 0.02181716]\n", - " [ 0.01858372]\n", - " [-0.01159501]\n", - " [-0.00297252]\n", - " [ 0.01750591]\n", - " [-0.02991782]\n", - " [-0.02021751]\n", - " [-0.05794093]\n", - " [ 0.06061839]\n", - " [-0.04069594]\n", - " [-0.07195249]\n", - " [-0.05578531]\n", - " [ 0.04552903]\n", - " [-0.00943939]\n", - " [-0.03315126]\n", - " [ 0.04984027]\n", - " [-0.08488624]\n", - " [ 0.00564998]\n", - " [ 0.02073935]\n", - " [-0.00728377]\n", - " [ 0.10480869]\n", - " [-0.02452876]\n", - " [-0.00620595]\n", - " [-0.03854032]\n", - " [ 0.13714305]\n", - " [ 0.17055523]\n", - " [ 0.00241654]\n", - " [ 0.03798434]\n", - " [-0.05794093]\n", - " [-0.00943939]\n", - " [-0.02345095]\n", - " [-0.0105172 ]\n", - " [-0.03422907]\n", - " [-0.00297252]\n", - " [ 0.06816308]\n", - " [ 0.00996123]\n", - " [ 0.00241654]\n", - " [-0.03854032]\n", - " [ 0.02612841]\n", - " [-0.08919748]\n", - " [ 0.06061839]\n", - " [-0.02884001]\n", - " [-0.02991782]\n", - " [-0.0191397 ]\n", - " [-0.04069594]\n", - " [ 0.01535029]\n", - " [-0.02452876]\n", - " [ 0.00133873]\n", - " [ 0.06924089]\n", - " [-0.06979687]\n", - " [-0.02991782]\n", - " [-0.046085 ]\n", - " [ 0.01858372]\n", - " [ 0.00133873]\n", - " [-0.03099563]\n", - " [-0.00405033]\n", - " [ 0.01535029]\n", - " [ 0.02289497]\n", - " [ 0.04552903]\n", - " [-0.04500719]\n", - " [-0.03315126]\n", - " [ 0.097264 ]\n", - " [ 0.05415152]\n", - " [ 0.12313149]\n", - " [-0.08057499]\n", - " [ 0.09295276]\n", - " [-0.05039625]\n", - " [-0.01159501]\n", - " [-0.0277622 ]\n", - " [ 0.05846277]\n", - " [ 0.08540807]\n", - " [-0.00081689]\n", - " [ 0.00672779]\n", - " [ 0.00888341]\n", - " [ 0.08001901]\n", - " [ 0.07139652]\n", - " [-0.02452876]\n", - " [-0.0547075 ]\n", - " [-0.03638469]\n", - " [ 0.0164281 ]\n", - " [ 0.07786339]\n", - " [-0.03961813]\n", - " [ 0.01103904]\n", - " [-0.04069594]\n", - " [-0.03422907]\n", - " [ 0.00564998]\n", - " [ 0.08864151]\n", - " [-0.03315126]\n", - " [-0.05686312]\n", - " [-0.03099563]\n", - " [ 0.05522933]\n", - " [-0.06009656]\n", - " [ 0.00133873]\n", - " [-0.02345095]\n", - " [-0.07410811]\n", - " [ 0.01966154]\n", - " [-0.01590626]\n", - " [-0.01590626]\n", - " [ 0.03906215]\n", - " [-0.0730303 ]]\n" - ] - } - ], - "source": [ - "#Reshaping to get a 2D array\n", - "X = X.reshape(-1, 1)\n", - "print(X.shape)\n", - "print(X)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Divida os dados de treino e teste tanto para `X` como para `y`\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.33)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Selecione o modelo e ajuste-o com os dados de treino\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
LinearRegression()
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" - ], - "text/plain": [ - "LinearRegression()" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "model = linear_model.LinearRegression()\n", - "model.fit(X_train, y_train)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Usar dados de teste para prever uma linha\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "y_pred = model.predict(X_test)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Exibir os resultados num gráfico\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "plt.scatter(X_test, y_test, color='black')\n", - "plt.plot(X_test, y_pred, color='blue', linewidth=3)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.1" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "16ff1a974f6e4348e869e4a7d366b86a", - "translation_date": "2025-09-03T19:39:31+00:00", - "source_file": "2-Regression/1-Tools/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/2-Data/README.md b/translations/pt/2-Regression/2-Data/README.md deleted file mode 100644 index 5e024032f..000000000 --- a/translations/pt/2-Regression/2-Data/README.md +++ /dev/null @@ -1,226 +0,0 @@ - -# Construir um modelo de regressão usando Scikit-learn: preparar e visualizar dados - -![Infográfico de visualização de dados](../../../../2-Regression/2-Data/images/data-visualization.png) - -Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/2-Data/solution/R/lesson_2.html) - -## Introdução - -Agora que já está equipado com as ferramentas necessárias para começar a construir modelos de machine learning com Scikit-learn, está pronto para começar a fazer perguntas aos seus dados. Ao trabalhar com dados e aplicar soluções de ML, é muito importante saber como formular a pergunta certa para desbloquear adequadamente o potencial do seu conjunto de dados. - -Nesta lição, irá aprender: - -- Como preparar os seus dados para a construção de modelos. -- Como usar o Matplotlib para visualização de dados. - -## Fazer a pergunta certa aos seus dados - -A pergunta que precisa de responder determinará o tipo de algoritmos de ML que irá utilizar. E a qualidade da resposta que obtém dependerá muito da natureza dos seus dados. - -Veja os [dados](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/data/US-pumpkins.csv) fornecidos para esta lição. Pode abrir este ficheiro .csv no VS Code. Uma rápida análise mostra imediatamente que há espaços em branco e uma mistura de dados em formato texto e numérico. Há também uma coluna estranha chamada 'Package', onde os dados são uma mistura entre 'sacks', 'bins' e outros valores. Os dados, na verdade, estão um pouco desorganizados. - -[![ML para iniciantes - Como analisar e limpar um conjunto de dados](https://img.youtube.com/vi/5qGjczWTrDQ/0.jpg)](https://youtu.be/5qGjczWTrDQ "ML para iniciantes - Como analisar e limpar um conjunto de dados") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre como preparar os dados para esta lição. - -De facto, não é muito comum receber um conjunto de dados completamente pronto para criar um modelo de ML diretamente. Nesta lição, irá aprender como preparar um conjunto de dados bruto usando bibliotecas padrão do Python. Também aprenderá várias técnicas para visualizar os dados. - -## Estudo de caso: 'o mercado de abóboras' - -Nesta pasta encontrará um ficheiro .csv na pasta raiz `data` chamado [US-pumpkins.csv](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/data/US-pumpkins.csv), que inclui 1757 linhas de dados sobre o mercado de abóboras, organizados por cidade. Estes são dados brutos extraídos dos [Relatórios Padrão dos Mercados de Culturas Especiais](https://www.marketnews.usda.gov/mnp/fv-report-config-step1?type=termPrice) distribuídos pelo Departamento de Agricultura dos Estados Unidos. - -### Preparar os dados - -Estes dados estão em domínio público. Podem ser descarregados em vários ficheiros separados, por cidade, no site do USDA. Para evitar muitos ficheiros separados, concatenámos todos os dados das cidades num único ficheiro, portanto já _preparámos_ os dados um pouco. Agora, vamos analisar os dados mais de perto. - -### Os dados das abóboras - primeiras conclusões - -O que nota sobre estes dados? Já viu que há uma mistura de texto, números, espaços em branco e valores estranhos que precisa de interpretar. - -Que pergunta pode fazer a estes dados, usando uma técnica de regressão? Que tal "Prever o preço de uma abóbora à venda durante um determinado mês"? Olhando novamente para os dados, há algumas alterações que precisa de fazer para criar a estrutura de dados necessária para esta tarefa. - -## Exercício - analisar os dados das abóboras - -Vamos usar o [Pandas](https://pandas.pydata.org/) (o nome significa `Python Data Analysis`), uma ferramenta muito útil para moldar dados, para analisar e preparar estes dados das abóboras. - -### Primeiro, verificar datas em falta - -Primeiro, precisará de tomar medidas para verificar se há datas em falta: - -1. Converter as datas para um formato de mês (estas são datas dos EUA, então o formato é `MM/DD/YYYY`). -2. Extrair o mês para uma nova coluna. - -Abra o ficheiro _notebook.ipynb_ no Visual Studio Code e importe a folha de cálculo para um novo dataframe do Pandas. - -1. Use a função `head()` para visualizar as primeiras cinco linhas. - - ```python - import pandas as pd - pumpkins = pd.read_csv('../data/US-pumpkins.csv') - pumpkins.head() - ``` - - ✅ Que função usaria para visualizar as últimas cinco linhas? - -1. Verifique se há dados em falta no dataframe atual: - - ```python - pumpkins.isnull().sum() - ``` - - Há dados em falta, mas talvez isso não seja relevante para a tarefa em questão. - -1. Para tornar o seu dataframe mais fácil de trabalhar, selecione apenas as colunas necessárias, usando a função `loc`, que extrai do dataframe original um grupo de linhas (passado como primeiro parâmetro) e colunas (passado como segundo parâmetro). A expressão `:` no caso abaixo significa "todas as linhas". - - ```python - columns_to_select = ['Package', 'Low Price', 'High Price', 'Date'] - pumpkins = pumpkins.loc[:, columns_to_select] - ``` - -### Segundo, determinar o preço médio da abóbora - -Pense em como determinar o preço médio de uma abóbora num determinado mês. Que colunas escolheria para esta tarefa? Dica: precisará de 3 colunas. - -Solução: calcule a média das colunas `Low Price` e `High Price` para preencher a nova coluna Price e converta a coluna Date para mostrar apenas o mês. Felizmente, de acordo com a verificação acima, não há dados em falta para datas ou preços. - -1. Para calcular a média, adicione o seguinte código: - - ```python - price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2 - - month = pd.DatetimeIndex(pumpkins['Date']).month - - ``` - - ✅ Sinta-se à vontade para imprimir quaisquer dados que queira verificar usando `print(month)`. - -2. Agora, copie os seus dados convertidos para um novo dataframe do Pandas: - - ```python - new_pumpkins = pd.DataFrame({'Month': month, 'Package': pumpkins['Package'], 'Low Price': pumpkins['Low Price'],'High Price': pumpkins['High Price'], 'Price': price}) - ``` - - Ao imprimir o seu dataframe, verá um conjunto de dados limpo e organizado, no qual pode construir o seu novo modelo de regressão. - -### Mas espere! Há algo estranho aqui - -Se olhar para a coluna `Package`, verá que as abóboras são vendidas em muitas configurações diferentes. Algumas são vendidas em medidas de '1 1/9 bushel', outras em '1/2 bushel', algumas por abóbora, outras por peso, e algumas em grandes caixas com larguras variadas. - -> Parece que as abóboras são muito difíceis de pesar de forma consistente - -Ao analisar os dados originais, é interessante notar que qualquer coisa com `Unit of Sale` igual a 'EACH' ou 'PER BIN' também tem o tipo `Package` por polegada, por bin ou 'each'. Parece que as abóboras são muito difíceis de pesar de forma consistente, então vamos filtrá-las selecionando apenas abóboras com a string 'bushel' na coluna `Package`. - -1. Adicione um filtro no topo do ficheiro, sob a importação inicial do .csv: - - ```python - pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)] - ``` - - Se imprimir os dados agora, verá que está a obter apenas cerca de 415 linhas de dados contendo abóboras por bushel. - -### Mas espere! Há mais uma coisa a fazer - -Notou que a quantidade de bushel varia por linha? Precisa de normalizar os preços para mostrar o preço por bushel, então faça alguns cálculos para padronizá-lo. - -1. Adicione estas linhas após o bloco que cria o dataframe new_pumpkins: - - ```python - new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/(1 + 1/9) - - new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price/(1/2) - ``` - -✅ De acordo com [The Spruce Eats](https://www.thespruceeats.com/how-much-is-a-bushel-1389308), o peso de um bushel depende do tipo de produto, pois é uma medida de volume. "Um bushel de tomates, por exemplo, deve pesar 56 libras... Folhas e verduras ocupam mais espaço com menos peso, então um bushel de espinafre pesa apenas 20 libras." É tudo bastante complicado! Vamos evitar fazer uma conversão de bushel para libra e, em vez disso, calcular o preço por bushel. Todo este estudo sobre bushels de abóboras, no entanto, mostra como é muito importante entender a natureza dos seus dados! - -Agora, pode analisar o preço por unidade com base na medida de bushel. Se imprimir os dados mais uma vez, verá como estão padronizados. - -✅ Reparou que as abóboras vendidas por meio bushel são muito caras? Consegue descobrir porquê? Dica: abóboras pequenas são muito mais caras do que grandes, provavelmente porque há muito mais delas por bushel, dado o espaço não utilizado ocupado por uma grande abóbora oca para torta. - -## Estratégias de Visualização - -Parte do papel do cientista de dados é demonstrar a qualidade e a natureza dos dados com os quais está a trabalhar. Para isso, frequentemente criam visualizações interessantes, como gráficos, diagramas e tabelas, mostrando diferentes aspetos dos dados. Desta forma, conseguem mostrar visualmente relações e lacunas que, de outra forma, seriam difíceis de identificar. - -[![ML para iniciantes - Como visualizar dados com Matplotlib](https://img.youtube.com/vi/SbUkxH6IJo0/0.jpg)](https://youtu.be/SbUkxH6IJo0 "ML para iniciantes - Como visualizar dados com Matplotlib") - -> 🎥 Clique na imagem acima para assistir a um vídeo curto sobre como visualizar os dados para esta lição. - -As visualizações também podem ajudar a determinar a técnica de machine learning mais apropriada para os dados. Um gráfico de dispersão que parece seguir uma linha, por exemplo, indica que os dados são bons candidatos para um exercício de regressão linear. - -Uma biblioteca de visualização de dados que funciona bem em notebooks Jupyter é [Matplotlib](https://matplotlib.org/) (que também viu na lição anterior). - -> Obtenha mais experiência com visualização de dados nestes [tutoriais](https://docs.microsoft.com/learn/modules/explore-analyze-data-with-python?WT.mc_id=academic-77952-leestott). - -## Exercício - experimentar com Matplotlib - -Tente criar alguns gráficos básicos para exibir o novo dataframe que acabou de criar. O que um gráfico de linha básico mostraria? - -1. Importe o Matplotlib no topo do ficheiro, sob a importação do Pandas: - - ```python - import matplotlib.pyplot as plt - ``` - -1. Execute novamente todo o notebook para atualizar. -1. No final do notebook, adicione uma célula para plotar os dados como um boxplot: - - ```python - price = new_pumpkins.Price - month = new_pumpkins.Month - plt.scatter(price, month) - plt.show() - ``` - - ![Um gráfico de dispersão mostrando a relação entre preço e mês](../../../../2-Regression/2-Data/images/scatterplot.png) - - Este gráfico é útil? Há algo nele que o surpreenda? - - Não é particularmente útil, pois apenas exibe os seus dados como uma dispersão de pontos num determinado mês. - -### Torná-lo útil - -Para que os gráficos exibam dados úteis, geralmente é necessário agrupar os dados de alguma forma. Vamos tentar criar um gráfico onde o eixo y mostra os meses e os dados demonstram a distribuição. - -1. Adicione uma célula para criar um gráfico de barras agrupado: - - ```python - new_pumpkins.groupby(['Month'])['Price'].mean().plot(kind='bar') - plt.ylabel("Pumpkin Price") - ``` - - ![Um gráfico de barras mostrando a relação entre preço e mês](../../../../2-Regression/2-Data/images/barchart.png) - - Este é um gráfico de visualização de dados mais útil! Parece indicar que o preço mais alto das abóboras ocorre em setembro e outubro. Isso corresponde às suas expectativas? Porquê ou porquê não? - ---- - -## 🚀Desafio - -Explore os diferentes tipos de visualização que o Matplotlib oferece. Quais tipos são mais apropriados para problemas de regressão? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Explore as várias formas de visualizar dados. Faça uma lista das diferentes bibliotecas disponíveis e anote quais são melhores para determinados tipos de tarefas, por exemplo, visualizações 2D vs. visualizações 3D. O que descobre? - -## Tarefa - -[Explorar visualização](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/2-Data/assignment.md b/translations/pt/2-Regression/2-Data/assignment.md deleted file mode 100644 index cb681b22a..000000000 --- a/translations/pt/2-Regression/2-Data/assignment.md +++ /dev/null @@ -1,22 +0,0 @@ - -# Explorando Visualizações - -Existem várias bibliotecas disponíveis para visualização de dados. Crie algumas visualizações utilizando os dados de Abóbora desta lição com matplotlib e seaborn num notebook de exemplo. Quais bibliotecas são mais fáceis de usar? -## Rubrica - -| Critério | Exemplar | Adequado | Necessita Melhorias | -| -------- | --------- | -------- | ------------------- | -| | Um notebook é submetido com duas explorações/visualizações | Um notebook é submetido com uma exploração/visualização | Um notebook não é submetido | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/2-Data/notebook.ipynb b/translations/pt/2-Regression/2-Data/notebook.ipynb deleted file mode 100644 index ba323a12f..000000000 --- a/translations/pt/2-Regression/2-Data/notebook.ipynb +++ /dev/null @@ -1,46 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.3-final" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3", - "language": "python" - }, - "coopTranslator": { - "original_hash": "1b2ab303ac6c604a34c6ca7a49077fc7", - "translation_date": "2025-09-03T19:44:42+00:00", - "source_file": "2-Regression/2-Data/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/2-Regression/2-Data/solution/Julia/README.md b/translations/pt/2-Regression/2-Data/solution/Julia/README.md deleted file mode 100644 index 1755c4f41..000000000 --- a/translations/pt/2-Regression/2-Data/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/2-Data/solution/R/lesson_2-R.ipynb b/translations/pt/2-Regression/2-Data/solution/R/lesson_2-R.ipynb deleted file mode 100644 index 51c7168e7..000000000 --- a/translations/pt/2-Regression/2-Data/solution/R/lesson_2-R.ipynb +++ /dev/null @@ -1,666 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_2-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "f3c335f9940cfd76528b3ef918b9b342", - "translation_date": "2025-09-03T19:48:56+00:00", - "source_file": "2-Regression/2-Data/solution/R/lesson_2-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Construir um modelo de regressão: preparar e visualizar dados\n", - "\n", - "## **Regressão Linear para Abóboras - Aula 2**\n", - "#### Introdução\n", - "\n", - "Agora que já tem as ferramentas necessárias para começar a construir modelos de machine learning com Tidymodels e Tidyverse, está pronto para começar a fazer perguntas aos seus dados. Ao trabalhar com dados e aplicar soluções de ML, é muito importante saber como formular a pergunta certa para desbloquear adequadamente o potencial do seu conjunto de dados.\n", - "\n", - "Nesta aula, irá aprender:\n", - "\n", - "- Como preparar os seus dados para a construção de modelos.\n", - "\n", - "- Como usar `ggplot2` para visualização de dados.\n", - "\n", - "A pergunta que precisa de responder determinará o tipo de algoritmos de ML que irá utilizar. E a qualidade da resposta que obtém dependerá fortemente da natureza dos seus dados.\n", - "\n", - "Vamos ver isso através de um exercício prático.\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "Pg5aexcOPqAZ" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 1. Importar dados de abóboras e invocar o Tidyverse\n", - "\n", - "Vamos precisar dos seguintes pacotes para explorar esta lição:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "Pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\"))`\n", - "\n", - "O script abaixo verifica se tem os pacotes necessários para completar este módulo e instala-os caso algum esteja em falta.\n" - ], - "metadata": { - "id": "dc5WhyVdXAjR" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\n", - "pacman::p_load(tidyverse)" - ], - "outputs": [], - "metadata": { - "id": "GqPYUZgfXOBt" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, vamos ativar alguns pacotes e carregar os [dados](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/data/US-pumpkins.csv) fornecidos para esta lição!\n" - ], - "metadata": { - "id": "kvjDTPDSXRr2" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the core Tidyverse packages\n", - "library(tidyverse)\n", - "\n", - "# Import the pumpkins data\n", - "pumpkins <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/2-Regression/data/US-pumpkins.csv\")\n", - "\n", - "\n", - "# Get a glimpse and dimensions of the data\n", - "glimpse(pumpkins)\n", - "\n", - "\n", - "# Print the first 50 rows of the data set\n", - "pumpkins %>% \n", - " slice_head(n =50)" - ], - "outputs": [], - "metadata": { - "id": "VMri-t2zXqgD" - } - }, - { - "cell_type": "markdown", - "source": [ - "Um rápido `glimpse()` mostra imediatamente que há espaços em branco e uma mistura de strings (`chr`) e dados numéricos (`dbl`). A `Date` é do tipo carácter e há também uma coluna estranha chamada `Package`, onde os dados são uma mistura entre `sacks`, `bins` e outros valores. Os dados, na verdade, estão um pouco desorganizados 😤.\n", - "\n", - "De facto, não é muito comum receber um conjunto de dados completamente pronto para usar e criar um modelo de ML diretamente. Mas não se preocupe, nesta lição, irá aprender como preparar um conjunto de dados bruto utilizando bibliotecas padrão do R 🧑‍🔧. Também irá aprender várias técnicas para visualizar os dados.📈📊\n", - "
\n", - "\n", - "> Um lembrete: O operador pipe (`%>%`) realiza operações numa sequência lógica ao passar um objeto para uma função ou expressão. Pode pensar no operador pipe como dizendo \"e depois\" no seu código.\n" - ], - "metadata": { - "id": "REWcIv9yX29v" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 2. Verificar dados em falta\n", - "\n", - "Um dos problemas mais comuns que os cientistas de dados enfrentam é lidar com dados incompletos ou em falta. O R representa valores em falta, ou desconhecidos, com um valor especial chamado `NA` (Not Available).\n", - "\n", - "Então, como podemos saber se o data frame contém valores em falta?\n", - "
\n", - "- Uma forma direta seria usar a função base do R `anyNA`, que retorna os objetos lógicos `TRUE` ou `FALSE`.\n" - ], - "metadata": { - "id": "Zxfb3AM5YbUe" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "pumpkins %>% \n", - " anyNA()" - ], - "outputs": [], - "metadata": { - "id": "G--DQutAYltj" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ótimo, parece que há alguns dados em falta! Esse é um bom ponto de partida.\n", - "\n", - "- Outra forma seria usar a função `is.na()` que indica quais elementos individuais das colunas estão em falta com um valor lógico `TRUE`.\n" - ], - "metadata": { - "id": "mU-7-SB6YokF" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "pumpkins %>% \n", - " is.na() %>% \n", - " head(n = 7)" - ], - "outputs": [], - "metadata": { - "id": "W-DxDOR4YxSW" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ok, trabalho concluído, mas com um conjunto de dados tão grande como este, seria ineficiente e praticamente impossível rever todas as linhas e colunas individualmente😴.\n", - "\n", - "- Uma forma mais intuitiva seria calcular a soma dos valores em falta para cada coluna:\n" - ], - "metadata": { - "id": "xUWxipKYY0o7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "pumpkins %>% \n", - " is.na() %>% \n", - " colSums()" - ], - "outputs": [], - "metadata": { - "id": "ZRBWV6P9ZArL" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito melhor! Faltam alguns dados, mas talvez isso não seja relevante para a tarefa em questão. Vamos ver que tipo de análise adicional pode surgir.\n", - "\n", - "> Além dos conjuntos incríveis de pacotes e funções, o R possui uma documentação muito boa. Por exemplo, use `help(colSums)` ou `?colSums` para saber mais sobre a função.\n" - ], - "metadata": { - "id": "9gv-crB6ZD1Y" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 3. Dplyr: Uma Gramática para Manipulação de Dados\n", - "\n", - "

\n", - " \n", - "

Ilustração por @allison_horst
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "o4jLY5-VZO2C" - } - }, - { - "cell_type": "markdown", - "source": [ - "[`dplyr`](https://dplyr.tidyverse.org/), um pacote do Tidyverse, é uma gramática de manipulação de dados que oferece um conjunto consistente de verbos para ajudar a resolver os desafios mais comuns de manipulação de dados. Nesta seção, vamos explorar alguns dos verbos do dplyr!\n" - ], - "metadata": { - "id": "i5o33MQBZWWw" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::select()\n", - "\n", - "`select()` é uma função do pacote `dplyr` que ajuda a escolher colunas para manter ou excluir.\n", - "\n", - "Para tornar o seu data frame mais fácil de trabalhar, elimine várias das suas colunas, utilizando `select()`, mantendo apenas as colunas necessárias.\n", - "\n", - "Por exemplo, neste exercício, a nossa análise irá envolver as colunas `Package`, `Low Price`, `High Price` e `Date`. Vamos selecionar estas colunas.\n" - ], - "metadata": { - "id": "x3VGMAGBZiUr" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Select desired columns\n", - "pumpkins <- pumpkins %>% \n", - " select(Package, `Low Price`, `High Price`, Date)\n", - "\n", - "\n", - "# Print data set\n", - "pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "F_FgxQnVZnM0" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::mutate()\n", - "\n", - "`mutate()` é uma função do pacote `dplyr` que ajuda a criar ou modificar colunas, mantendo as colunas existentes.\n", - "\n", - "A estrutura geral do `mutate` é:\n", - "\n", - "`data %>% mutate(new_column_name = what_it_contains)`\n", - "\n", - "Vamos experimentar o `mutate` utilizando a coluna `Date` e realizar as seguintes operações:\n", - "\n", - "1. Converter as datas (atualmente do tipo carácter) para um formato de mês (estas são datas dos EUA, então o formato é `MM/DD/YYYY`).\n", - "\n", - "2. Extrair o mês das datas para uma nova coluna.\n", - "\n", - "Em R, o pacote [lubridate](https://lubridate.tidyverse.org/) facilita o trabalho com dados de data e hora. Então, vamos usar `dplyr::mutate()`, `lubridate::mdy()`, `lubridate::month()` e ver como alcançar os objetivos acima. Podemos eliminar a coluna `Date`, já que não será mais necessária em operações subsequentes.\n" - ], - "metadata": { - "id": "2KKo0Ed9Z1VB" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load lubridate\n", - "library(lubridate)\n", - "\n", - "pumpkins <- pumpkins %>% \n", - " # Convert the Date column to a date object\n", - " mutate(Date = mdy(Date)) %>% \n", - " # Extract month from Date\n", - " mutate(Month = month(Date)) %>% \n", - " # Drop Date column\n", - " select(-Date)\n", - "\n", - "# View the first few rows\n", - "pumpkins %>% \n", - " slice_head(n = 7)" - ], - "outputs": [], - "metadata": { - "id": "5joszIVSZ6xe" - } - }, - { - "cell_type": "markdown", - "source": [ - "Uhuu! 🤩\n", - "\n", - "A seguir, vamos criar uma nova coluna `Price`, que representa o preço médio de uma abóbora. Agora, vamos calcular a média das colunas `Low Price` e `High Price` para preencher a nova coluna Price.\n", - "
\n" - ], - "metadata": { - "id": "nIgLjNMCZ-6Y" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Create a new column Price\n", - "pumpkins <- pumpkins %>% \n", - " mutate(Price = (`Low Price` + `High Price`)/2)\n", - "\n", - "# View the first few rows of the data\n", - "pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "Zo0BsqqtaJw2" - } - }, - { - "cell_type": "markdown", - "source": [ - "Sim!💪\n", - "\n", - "\"Mas espera aí!\", dirás depois de examinar todo o conjunto de dados com `View(pumpkins)`, \"Há algo estranho aqui!\"🤔\n", - "\n", - "Se olhares para a coluna `Package`, as abóboras são vendidas em várias configurações diferentes. Algumas são vendidas em medidas de `1 1/9 bushel`, outras em medidas de `1/2 bushel`, algumas por abóbora, outras por peso, e algumas em grandes caixas com larguras variadas.\n", - "\n", - "Vamos verificar isto:\n" - ], - "metadata": { - "id": "p77WZr-9aQAR" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Verify the distinct observations in Package column\n", - "pumpkins %>% \n", - " distinct(Package)" - ], - "outputs": [], - "metadata": { - "id": "XISGfh0IaUy6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Incrível!👏\n", - "\n", - "As abóboras parecem ser muito difíceis de pesar de forma consistente, por isso vamos filtrá-las selecionando apenas as abóboras com a palavra *bushel* na coluna `Package` e colocar isso num novo quadro de dados `new_pumpkins`.\n" - ], - "metadata": { - "id": "7sMjiVujaZxY" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::filter() e stringr::str_detect()\n", - "\n", - "[`dplyr::filter()`](https://dplyr.tidyverse.org/reference/filter.html): cria um subconjunto dos dados contendo apenas as **linhas** que satisfazem as suas condições, neste caso, abóboras com a string *bushel* na coluna `Package`.\n", - "\n", - "[stringr::str_detect()](https://stringr.tidyverse.org/reference/str_detect.html): deteta a presença ou ausência de um padrão numa string.\n", - "\n", - "O pacote [`stringr`](https://github.com/tidyverse/stringr) fornece funções simples para operações comuns com strings.\n" - ], - "metadata": { - "id": "L8Qfcs92ageF" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Retain only pumpkins with \"bushel\"\n", - "new_pumpkins <- pumpkins %>% \n", - " filter(str_detect(Package, \"bushel\"))\n", - "\n", - "# Get the dimensions of the new data\n", - "dim(new_pumpkins)\n", - "\n", - "# View a few rows of the new data\n", - "new_pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "hy_SGYREampd" - } - }, - { - "cell_type": "markdown", - "source": [ - "Pode ver que reduzimos para cerca de 415 linhas de dados contendo abóboras por alqueire.🤩 \n" - ], - "metadata": { - "id": "VrDwF031avlR" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### dplyr::case_when()\n", - "\n", - "**Mas espera! Ainda há algo mais a fazer**\n", - "\n", - "Reparaste que a quantidade por alqueire varia por linha? É necessário normalizar os preços para que sejam apresentados por alqueire, e não por 1 1/9 ou 1/2 alqueire. Está na hora de fazer alguns cálculos para os padronizar.\n", - "\n", - "Vamos usar a função [`case_when()`](https://dplyr.tidyverse.org/reference/case_when.html) para *alterar* a coluna Price com base em algumas condições. `case_when` permite vectorizar múltiplas instruções `if_else()`.\n" - ], - "metadata": { - "id": "mLpw2jH4a0tx" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Convert the price if the Package contains fractional bushel values\n", - "new_pumpkins <- new_pumpkins %>% \n", - " mutate(Price = case_when(\n", - " str_detect(Package, \"1 1/9\") ~ Price/(1 + 1/9),\n", - " str_detect(Package, \"1/2\") ~ Price/(1/2),\n", - " TRUE ~ Price))\n", - "\n", - "# View the first few rows of the data\n", - "new_pumpkins %>% \n", - " slice_head(n = 30)" - ], - "outputs": [], - "metadata": { - "id": "P68kLVQmbM6I" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora podemos analisar o preço por unidade com base na sua medida em alqueires. Todo este estudo sobre alqueires de abóboras, no entanto, mostra como é `importante` `compreender a natureza dos seus dados`!\n", - "\n", - "> ✅ De acordo com [The Spruce Eats](https://www.thespruceeats.com/how-much-is-a-bushel-1389308), o peso de um alqueire depende do tipo de produto, já que é uma medida de volume. \"Um alqueire de tomates, por exemplo, deve pesar 56 libras... Folhas e verduras ocupam mais espaço com menos peso, então um alqueire de espinafre pesa apenas 20 libras.\" É tudo bastante complicado! Não vamos nos preocupar em fazer uma conversão de alqueires para libras e, em vez disso, vamos precificar por alqueire. Todo este estudo sobre alqueires de abóboras, no entanto, mostra como é muito importante compreender a natureza dos seus dados!\n", - ">\n", - "> ✅ Reparaste que as abóboras vendidas por meio alqueire são muito caras? Consegues descobrir porquê? Dica: abóboras pequenas são muito mais caras do que as grandes, provavelmente porque há muito mais delas por alqueire, considerando o espaço não utilizado ocupado por uma grande abóbora oca para tartes.\n" - ], - "metadata": { - "id": "pS2GNPagbSdb" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora, por pura diversão 💁‍♀️, vamos também mover a coluna Mês para a primeira posição, ou seja, `antes` da coluna `Pacote`.\n", - "\n", - "`dplyr::relocate()` é usado para alterar as posições das colunas.\n" - ], - "metadata": { - "id": "qql1SowfbdnP" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Create a new data frame new_pumpkins\n", - "new_pumpkins <- new_pumpkins %>% \n", - " relocate(Month, .before = Package)\n", - "\n", - "new_pumpkins %>% \n", - " slice_head(n = 7)" - ], - "outputs": [], - "metadata": { - "id": "JJ1x6kw8bixF" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho!👌 Agora tens um conjunto de dados limpo e organizado para construir o teu novo modelo de regressão!\n" - ], - "metadata": { - "id": "y8TJ0Za_bn5Y" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 4. Visualização de dados com ggplot2\n", - "\n", - "

\n", - " \n", - "

Infografia por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "\n", - "Há um ditado *sábio* que diz o seguinte:\n", - "\n", - "> \"O gráfico simples trouxe mais informação à mente do analista de dados do que qualquer outro dispositivo.\" --- John Tukey\n", - "\n", - "Parte do papel do cientista de dados é demonstrar a qualidade e a natureza dos dados com os quais está a trabalhar. Para isso, muitas vezes criam visualizações interessantes, ou gráficos, diagramas e tabelas, que mostram diferentes aspetos dos dados. Desta forma, conseguem mostrar visualmente relações e lacunas que, de outra forma, seriam difíceis de identificar.\n", - "\n", - "As visualizações também podem ajudar a determinar a técnica de machine learning mais adequada para os dados. Um gráfico de dispersão que parece seguir uma linha, por exemplo, indica que os dados são bons candidatos para um exercício de regressão linear.\n", - "\n", - "O R oferece vários sistemas para criar gráficos, mas o [`ggplot2`](https://ggplot2.tidyverse.org/index.html) é um dos mais elegantes e versáteis. O `ggplot2` permite compor gráficos **combinando componentes independentes**.\n", - "\n", - "Vamos começar com um simples gráfico de dispersão para as colunas Price e Month.\n", - "\n", - "Neste caso, começaremos com [`ggplot()`](https://ggplot2.tidyverse.org/reference/ggplot.html), fornecendo um conjunto de dados e um mapeamento estético (com [`aes()`](https://ggplot2.tidyverse.org/reference/aes.html)) e, em seguida, adicionaremos camadas (como [`geom_point()`](https://ggplot2.tidyverse.org/reference/geom_point.html)) para gráficos de dispersão.\n" - ], - "metadata": { - "id": "mYSH6-EtbvNa" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Set a theme for the plots\n", - "theme_set(theme_light())\n", - "\n", - "# Create a scatter plot\n", - "p <- ggplot(data = new_pumpkins, aes(x = Price, y = Month))\n", - "p + geom_point()" - ], - "outputs": [], - "metadata": { - "id": "g2YjnGeOcLo4" - } - }, - { - "cell_type": "markdown", - "source": [ - "É um gráfico útil 🤷? Há algo nele que te surpreenda?\n", - "\n", - "Não é particularmente útil, pois tudo o que faz é mostrar os teus dados como uma dispersão de pontos num determinado mês.\n", - "
\n" - ], - "metadata": { - "id": "Ml7SDCLQcPvE" - } - }, - { - "cell_type": "markdown", - "source": [ - "### **Como torná-lo útil?**\n", - "\n", - "Para que os gráficos exibam dados úteis, normalmente é necessário agrupar os dados de alguma forma. Por exemplo, no nosso caso, calcular o preço médio das abóboras para cada mês proporcionaria mais insights sobre os padrões subjacentes nos nossos dados. Isso leva-nos a mais uma abordagem rápida do **dplyr**:\n", - "\n", - "#### `dplyr::group_by() %>% summarize()`\n", - "\n", - "A agregação agrupada em R pode ser facilmente calculada usando\n", - "\n", - "`dplyr::group_by() %>% summarize()`\n", - "\n", - "- `dplyr::group_by()` altera a unidade de análise do conjunto de dados completo para grupos individuais, como por mês.\n", - "\n", - "- `dplyr::summarize()` cria um novo data frame com uma coluna para cada variável de agrupamento e uma coluna para cada estatística resumida que especificares.\n", - "\n", - "Por exemplo, podemos usar `dplyr::group_by() %>% summarize()` para agrupar as abóboras com base na coluna **Month** e, em seguida, calcular o **preço médio** para cada mês.\n" - ], - "metadata": { - "id": "jMakvJZIcVkh" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Find the average price of pumpkins per month\r\n", - "new_pumpkins %>%\r\n", - " group_by(Month) %>% \r\n", - " summarise(mean_price = mean(Price))" - ], - "outputs": [], - "metadata": { - "id": "6kVSUa2Bcilf" - } - }, - { - "cell_type": "markdown", - "source": [ - "Sucinto!✨\n", - "\n", - "Características categóricas, como meses, são melhor representadas utilizando um gráfico de barras 📊. As camadas responsáveis pelos gráficos de barras são `geom_bar()` e `geom_col()`. Consulte `?geom_bar` para saber mais.\n", - "\n", - "Vamos criar um agora!\n" - ], - "metadata": { - "id": "Kds48GUBcj3W" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Find the average price of pumpkins per month then plot a bar chart\r\n", - "new_pumpkins %>%\r\n", - " group_by(Month) %>% \r\n", - " summarise(mean_price = mean(Price)) %>% \r\n", - " ggplot(aes(x = Month, y = mean_price)) +\r\n", - " geom_col(fill = \"midnightblue\", alpha = 0.7) +\r\n", - " ylab(\"Pumpkin Price\")" - ], - "outputs": [], - "metadata": { - "id": "VNbU1S3BcrxO" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤩🤩Esta é uma visualização de dados mais útil! Parece indicar que o preço mais alto das abóboras ocorre em setembro e outubro. Isso corresponde às suas expectativas? Porquê ou porquê não?\n", - "\n", - "Parabéns por concluir a segunda lição 👏! Preparou os seus dados para a construção do modelo e, em seguida, descobriu mais informações através de visualizações!\n" - ], - "metadata": { - "id": "zDm0VOzzcuzR" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/2-Regression/2-Data/solution/notebook.ipynb b/translations/pt/2-Regression/2-Data/solution/notebook.ipynb deleted file mode 100644 index a1f689a8e..000000000 --- a/translations/pt/2-Regression/2-Data/solution/notebook.ipynb +++ /dev/null @@ -1,437 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
70BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN9/24/1615.015.015.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
71BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN9/24/1618.018.018.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
72BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN10/1/1618.018.018.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
73BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN10/1/1617.017.017.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
74BALTIMORENaN1 1/9 bushel cartonsPIE TYPENaNNaN10/8/1615.015.015.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade \\\n", - "70 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "71 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "72 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "73 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "74 BALTIMORE NaN 1 1/9 bushel cartons PIE TYPE NaN NaN \n", - "\n", - " Date Low Price High Price Mostly Low ... Unit of Sale Quality \\\n", - "70 9/24/16 15.0 15.0 15.0 ... NaN NaN \n", - "71 9/24/16 18.0 18.0 18.0 ... NaN NaN \n", - "72 10/1/16 18.0 18.0 18.0 ... NaN NaN \n", - "73 10/1/16 17.0 17.0 17.0 ... NaN NaN \n", - "74 10/8/16 15.0 15.0 15.0 ... NaN NaN \n", - "\n", - " Condition Appearance Storage Crop Repack Trans Mode Unnamed: 24 \\\n", - "70 NaN NaN NaN NaN N NaN NaN \n", - "71 NaN NaN NaN NaN N NaN NaN \n", - "72 NaN NaN NaN NaN N NaN NaN \n", - "73 NaN NaN NaN NaN N NaN NaN \n", - "74 NaN NaN NaN NaN N NaN NaN \n", - "\n", - " Unnamed: 25 \n", - "70 NaN \n", - "71 NaN \n", - "72 NaN \n", - "73 NaN \n", - "74 NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 2, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "pumpkins = pd.read_csv('../../data/US-pumpkins.csv')\n", - "\n", - "pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)]\n", - "\n", - "pumpkins.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "City Name 0\n", - "Type 406\n", - "Package 0\n", - "Variety 0\n", - "Sub Variety 167\n", - "Grade 415\n", - "Date 0\n", - "Low Price 0\n", - "High Price 0\n", - "Mostly Low 24\n", - "Mostly High 24\n", - "Origin 0\n", - "Origin District 396\n", - "Item Size 114\n", - "Color 145\n", - "Environment 415\n", - "Unit of Sale 404\n", - "Quality 415\n", - "Condition 415\n", - "Appearance 415\n", - "Storage 415\n", - "Crop 415\n", - "Repack 0\n", - "Trans Mode 415\n", - "Unnamed: 24 415\n", - "Unnamed: 25 391\n", - "dtype: int64" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pumpkins.isnull().sum()" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - " Month Package Low Price High Price Price\n", - "70 9 1 1/9 bushel cartons 15.00 15.0 13.50\n", - "71 9 1 1/9 bushel cartons 18.00 18.0 16.20\n", - "72 10 1 1/9 bushel cartons 18.00 18.0 16.20\n", - "73 10 1 1/9 bushel cartons 17.00 17.0 15.30\n", - "74 10 1 1/9 bushel cartons 15.00 15.0 13.50\n", - "... ... ... ... ... ...\n", - "1738 9 1/2 bushel cartons 15.00 15.0 30.00\n", - "1739 9 1/2 bushel cartons 13.75 15.0 28.75\n", - "1740 9 1/2 bushel cartons 10.75 15.0 25.75\n", - "1741 9 1/2 bushel cartons 12.00 12.0 24.00\n", - "1742 9 1/2 bushel cartons 12.00 12.0 24.00\n", - "\n", - "[415 rows x 5 columns]\n" - ] - } - ], - "source": [ - "\n", - "# A set of new columns for a new dataframe. Filter out nonmatching columns\n", - "columns_to_select = ['Package', 'Low Price', 'High Price', 'Date']\n", - "pumpkins = pumpkins.loc[:, columns_to_select]\n", - "\n", - "# Get an average between low and high price for the base pumpkin price\n", - "price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2\n", - "\n", - "# Convert the date to its month only\n", - "month = pd.DatetimeIndex(pumpkins['Date']).month\n", - "\n", - "# Create a new dataframe with this basic data\n", - "new_pumpkins = pd.DataFrame({'Month': month, 'Package': pumpkins['Package'], 'Low Price': pumpkins['Low Price'],'High Price': pumpkins['High Price'], 'Price': price})\n", - "\n", - "# Convert the price if the Package contains fractional bushel values\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/(1 + 1/9)\n", - "\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price/(1/2)\n", - "\n", - "print(new_pumpkins)\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "\n", - "price = new_pumpkins.Price\n", - "month = new_pumpkins.Month\n", - "plt.scatter(price, month)\n", - "plt.show()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0, 0.5, 'Pumpkin Price')" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX4AAAEJCAYAAACT/UyFAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAAARAElEQVR4nO3de5AlZX3G8e8joKigiIwbVNYVQ6ErwcVaiRW0CgUNikEQKxFTijHJahlUSsvUqknE/LVE0KoYNVkDigloNCoQLt5AxUuCLrrhIhqUQgMiLBGE0goR+OWP0+sMszOzZ8ft0zO830/VqTndfc7phwae6XlPX1JVSJLa8aChA0iSJsvil6TGWPyS1BiLX5IaY/FLUmMsfklqzK5DBxjHPvvsU6tWrRo6hiQtK1dcccVtVTU1e/6yKP5Vq1axadOmoWNI0rKS5IdzzXeoR5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktSYZXECl3auVesvHDoCN2w4eugIUrMsfjXNX4JqkUM9ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqTG/Fn2S/JF9M8p0k1yR5Yzf/lCQ3JdncPV7YVwZJ0rZ27fGz7wHeXFXfSrIncEWSz3fL3lNVp/W4bknSPHor/qq6Gbi5e35XkmuBx/W1PknSePrc4/+VJKuAQ4DLgcOAk5K8EtjE6K+C2yeRQ9L8Vq2/cOgI3LDh6KEjNKH3L3eT7AF8Eji5qu4EPgA8CVjD6C+C0+d537okm5Js2rJlS98xJakZvRZ/kt0Ylf7ZVfUpgKq6parurar7gA8Ch8713qraWFVrq2rt1NRUnzElqSl9HtUT4Azg2qp694z5+8542XHA1X1lkCRtq88x/sOAVwBXJdnczXsbcEKSNUABNwCv6TGDJGmWPo/q+SqQORZd1Nc6F+IXV5I04pm7ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktQYi1+SGmPxS1JjLH5JakxvxZ9kvyRfTPKdJNckeWM3f+8kn09yXffzUX1lkCRtq889/nuAN1fVauCZwJ8lWQ2sBy6pqgOAS7ppSdKE9Fb8VXVzVX2re34XcC3wOODFwFndy84Cju0rgyRpWxMZ40+yCjgEuBxYUVU3d4t+AqyY5z3rkmxKsmnLli2TiClJTei9+JPsAXwSOLmq7py5rKoKqLneV1Ubq2ptVa2dmprqO6YkNWOs4k/y0CQH7uiHJ9mNUemfXVWf6mbfkmTfbvm+wK07+rmSpMXbbvEn+T1gM/CZbnpNkvPHeF+AM4Brq+rdMxadD5zYPT8ROG8HM0uSfg3j7PGfAhwK3AFQVZuBJ47xvsOAVwDPTbK5e7wQ2AA8L8l1wJHdtCRpQnYd4zW/rKqfjXbgf2XOcfn7vaDqq0DmWXzEGOuVJPVgnOK/JsnLgV2SHAC8Afh6v7EkSX0ZZ6jn9cBTgbuBc4CfASf3mEmS1KPt7vFX1S+At3cPSdIyN85RPZ9PsteM6Ucl+WyvqSRJvRlnqGefqrpj60RV3Q48prdEkqRejVP89yVZuXUiyRMY46geSdLSNM5RPW8Hvprky4wOz3w2sK7XVJKk3ozz5e5nkjyd0aWVYXTNndv6jSVJ6su8Qz1Jntz9fDqwEvhx91jZzZMkLUML7fG/idGQzulzLCvgub0kkiT1at7ir6p1SR4E/EVVfW2CmSRJPVrwqJ6qug/4uwllkSRNwDiHc16S5PjMukqbJGl5Gqf4XwN8Arg7yZ1J7kpy5/beJElamsY5nHPPSQSRJE3GQodzHpDkvCRXJzknyeMmGUyS1I+FhnrOBC4Ajge+Dbx3IokkSb1aaKhnz6r6YPf8XUm+NYlAkqR+LVT8uyc5hOnbJz505nRV+YtAkpahhYr/ZuDdM6Z/MmPaM3claZla6Mzd50wyiCRpMsY5jl+S9ABi8UtSYyx+SWrMOHfgojt56wkzX19Vl/UVSpLUn+0Wf5JTgT8AvgPc280uwOKXpGVonD3+Y4EDq+runrNIkiZgnOK/HtgN2KHiT3Im8CLg1qo6qJt3CvCnwJbuZW+rqot25HMlqW+r1l84dARu2HB0b589TvH/Atic5BJmlH9VvWE77/swo5u4fGTW/PdU1Wk7ElKStPOMU/znd48dUlWXJVm1w4kkSb0a53r8Z+3kdZ6U5JXAJuDNVXX7XC9Kso7Rzd5ZuXLlTo4gSe1a6Hr8H+9+XpXkytmPRa7vA8CTgDWMrgV0+nwvrKqNVbW2qtZOTU0tcnWSpNkW2uN/Y/fzRTtrZVV1y9bnST7I6Hr/kqQJmnePv6pu7p6urqofznwAL1jMypLsO2PyOODqxXyOJGnxxvly9y+T3F1VlwIk+XPgOcDfL/SmJB8FDgf2SXIj8A7g8CRrGJ0AdgOjG7lLkiZonOI/BrggyVuAo4AnAy/e3puq6oQ5Zp+xY/EkSTvbOEf13JbkGOALwBXAS6uqek8mSerFvMWf5C5GQzJbPRjYH3hpkqqqR/QdTpK08y10B649JxlEkjQZ416W+SXAsxj9BfCVqjq3z1CSpP5s90YsSd4PvBa4itHhl69N8r6+g0mS+jHOHv9zgads/UI3yVnANb2mkiT1ZpxbL34fmHmxnP26eZKkZWicPf49gWuTfKObfgawKcn5AFV1TF/hJEk73zjF/1e9p5AkTcw4J3B9GSDJI7j/zdZ/2mMuSVJPxrnZ+jrgr4H/Be4Dwuiwzv37jSZJ6sM4Qz1vAQ6qqtv6DiNJ6t84R/X8gNF9dyVJDwDj7PG/Ffh6ksvZsZutS5KWoHGK/x+ASxmduXtfv3EkSX0bp/h3q6o39Z5EkjQR44zxX5xkXZJ9k+y99dF7MklSL8bZ4996J623zpjn4ZyStEyNcwLXEycRRJI0GeOcwPXKueZX1Ud2fhxJUt/GGep5xoznuwNHAN8CLH5JWobGGep5/czpJHsBH+srkCSpX+Mc1TPbzwHH/SVpmRpnjP/fGB3FA6NfFKuBj/cZSpLUn3HG+E+b8fwe4IdVdWNPeSRJPZu3+JPszugm67/J6HINZ1TVPZMKJknqx0Jj/GcBaxmV/guA0yeSSJLUq4WGelZX1W8BJDkD+MYCr91GkjOBFwG3VtVB3by9gX8BVgE3AL9fVbfveGxJ0mIttMf/y61PFjnE82HgqFnz1gOXVNUBwCXdtCRpghYq/qclubN73AUcvPV5kju398FVdRkw+768L2Y0hET389jFhJYkLd68Qz1VtUsP61tRVTd3z38CrOhhHZKkBSzmBK6doqqK6fMDttFdCnpTkk1btmyZYDJJemCbdPHfkmRfgO7nrfO9sKo2VtXaqlo7NTU1sYCS9EA36eI/Hzixe34icN6E1y9Jzeut+JN8FPh34MAkNyb5Y2AD8Lwk1wFHdtOSpAka55INi1JVJ8yz6Ii+1ilJ2r7BvtyVJA3D4pekxlj8ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktSYXYdYaZIbgLuAe4F7qmrtEDkkqUWDFH/nOVV124Drl6QmOdQjSY0ZqvgL+FySK5KsGyiDJDVpqKGeZ1XVTUkeA3w+yXer6rKZL+h+IawDWLly5RAZJekBaZA9/qq6qft5K/Bp4NA5XrOxqtZW1dqpqalJR5SkB6yJF3+ShyfZc+tz4PnA1ZPOIUmtGmKoZwXw6SRb139OVX1mgByS1KSJF39VXQ88bdLrlSSNeDinJDXG4pekxlj8ktQYi1+SGmPxS1JjLH5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSYyx+SWqMxS9JjbH4JakxFr8kNcbil6TGWPyS1BiLX5IaY/FLUmMsfklqjMUvSY2x+CWpMRa/JDXG4pekxlj8ktQYi1+SGjNI8Sc5Ksn3knw/yfohMkhSqyZe/El2Ad4HvABYDZyQZPWkc0hSq4bY4z8U+H5VXV9V/wd8DHjxADkkqUmpqsmuMHkpcFRV/Uk3/Qrgt6vqpFmvWwes6yYPBL430aDb2ge4beAMS4XbYprbYprbYtpS2RZPqKqp2TN3HSLJOKpqI7Bx6BxbJdlUVWuHzrEUuC2muS2muS2mLfVtMcRQz03AfjOmH9/NkyRNwBDF/03ggCRPTPJg4GXA+QPkkKQmTXyop6ruSXIS8FlgF+DMqrpm0jkWYckMOy0BbotpbotpbotpS3pbTPzLXUnSsDxzV5IaY/FLUmMsfklqzJI9jn9IM442+nFVfSHJy4HfAa4FNlbVLwcNOGFJ9gdewugw3HuB/wLOqao7Bw0maVH8cncOSc5m9EvxYcAdwB7Ap4AjGG2zE4dLN1lJ3gC8CLgMeCHwbUbb5DjgdVX1pcHCSVoUi38OSa6sqoOT7Mro5LLHVtW9SQL8Z1UdPHDEiUlyFbCm++d/GHBRVR2eZCVwXlUdMnDEiUnySOCtwLHAY4ACbgXOAzZU1R2DhVtCklxcVS8YOsekJHkEo/8uHg9cXFXnzFj2/qp63WDh5uFQz9we1A33PJzRXv8jgZ8CDwF2GzLYQHZlNMTzEEZ//VBVP0rS2rb4OHApcHhV/QQgyW8AJ3bLnj9gtolK8vT5FgFrJhhlKfgQcB3wSeDVSY4HXl5VdwPPHDTZPCz+uZ0BfJfRCWZvBz6R5HpG/xI/NmSwAfwj8M0klwPPBk4FSDLF6JdhS1ZV1akzZ3S/AE5N8uqBMg3lm8CXGRX9bHtNNsrgnlRVx3fPz03yduDSJMcMGWohDvXMI8ljAarqx0n2Ao4EflRV3xg02ACSPBV4CnB1VX136DxDSfI54AvAWVV1SzdvBfAq4HlVdeSA8SYqydXAcVV13RzL/ruq9pvjbQ9ISa4FnlpV982Y9yrgLcAeVfWEobLNx+KXxpTkUcB6RvePeEw3+xZG15raUFW3D5Vt0rrLq19VVdtcLj3JsVV17uRTDSPJ3wCfq6ovzJp/FPDeqjpgmGTzs/ilnSDJH1XVh4bOsRS4LaYt1W1h8Us7QZIfVdXKoXMsBW6LaUt1W/jlrjSmJFfOtwhYMcksQ3NbTFuO28Lil8a3AvhdYPZYfoCvTz7OoNwW05bdtrD4pfFdwOgojc2zFyT50sTTDMttMW3ZbQvH+CWpMV6dU5IaY/FLUmMsfglIUkn+ecb0rkm2JLlgkZ+3V5LXzZg+fLGfJe1sFr808nPgoCQP7aafx+jKrIu1F7DkrsoogcUvzXQRcHT3/ATgo1sXJNk7yblJrkzyH0kO7uafkuTMJF9Kcn13/wKADcCTkmxO8q5u3h5J/jXJd5Oc3V3mW5o4i1+a9jHgZUl2Bw4GLp+x7J3At7t7MbwN+MiMZU9mdBz3ocA7ustVrwd+UFVrquot3esOAU4GVgP7A4f1+M8izcvilzpVdSWwitHe/kWzFj8L+KfudZcCj+5uwAFwYVXdXVW3Mboxy3xna36jqm7sruK4uVuXNHGewCXd3/nAacDhwKPHfM/dM57fy/z/X437OqlX7vFL93cm8M6qumrW/K8AfwijI3SA27Zzs/m7gD37CCj9utzjkGaoqhuBv51j0SnAmd0FuX7B6HaLC33O/yT5WnfDkouBC3d2VmmxvGSDJDXGoR5JaozFL0mNsfglqTEWvyQ1xuKXpMZY/JLUGItfkhpj8UtSY/4fZDFW+b6+4WkAAAAASUVORK5CYII=", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "\n", - "new_pumpkins.groupby(['Month'])['Price'].mean().plot(kind='bar')\n", - "plt.ylabel(\"Pumpkin Price\")" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6" - }, - "kernelspec": { - "display_name": "Python 3.7.0 64-bit ('3.7')", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.1" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "95726f0b8283628d5356a4f8eb8b4b76", - "translation_date": "2025-09-03T19:44:58+00:00", - "source_file": "2-Regression/2-Data/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/3-Linear/README.md b/translations/pt/2-Regression/3-Linear/README.md deleted file mode 100644 index f6a348251..000000000 --- a/translations/pt/2-Regression/3-Linear/README.md +++ /dev/null @@ -1,380 +0,0 @@ - -# Construir um modelo de regressão usando Scikit-learn: quatro abordagens de regressão - -![Infográfico de regressão linear vs polinomial](../../../../2-Regression/3-Linear/images/linear-polynomial.png) -> Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/3-Linear/solution/R/lesson_3.html) -### Introdução - -Até agora, exploraste o que é regressão com dados de exemplo retirados do conjunto de dados de preços de abóboras que utilizaremos ao longo desta lição. Também já os visualizaste utilizando o Matplotlib. - -Agora estás pronto para mergulhar mais fundo na regressão para Machine Learning. Embora a visualização permita compreender os dados, o verdadeiro poder do Machine Learning vem do _treinamento de modelos_. Os modelos são treinados com dados históricos para capturar automaticamente as dependências dos dados, permitindo prever resultados para novos dados que o modelo ainda não viu. - -Nesta lição, aprenderás mais sobre dois tipos de regressão: _regressão linear básica_ e _regressão polinomial_, juntamente com algumas das matemáticas subjacentes a estas técnicas. Esses modelos permitirão prever os preços das abóboras dependendo de diferentes dados de entrada. - -[![ML para iniciantes - Compreendendo a Regressão Linear](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "ML para iniciantes - Compreendendo a Regressão Linear") - -> 🎥 Clica na imagem acima para uma breve visão geral sobre regressão linear. - -> Ao longo deste currículo, assumimos um conhecimento mínimo de matemática e procuramos torná-lo acessível para estudantes de outras áreas. Por isso, presta atenção às notas, 🧮 chamadas, diagramas e outras ferramentas de aprendizagem para ajudar na compreensão. - -### Pré-requisitos - -Deves estar familiarizado, neste momento, com a estrutura dos dados de abóboras que estamos a analisar. Podes encontrá-los pré-carregados e pré-limpos no ficheiro _notebook.ipynb_ desta lição. No ficheiro, o preço das abóboras é exibido por alqueire num novo _data frame_. Certifica-te de que consegues executar estes _notebooks_ em _kernels_ no Visual Studio Code. - -### Preparação - -Como lembrete, estás a carregar estes dados para fazer perguntas sobre eles. - -- Qual é a melhor altura para comprar abóboras? -- Que preço posso esperar por uma caixa de abóboras miniatura? -- Devo comprá-las em cestos de meio alqueire ou em caixas de 1 1/9 de alqueire? -Vamos continuar a explorar estes dados. - -Na lição anterior, criaste um _data frame_ com Pandas e preencheste-o com parte do conjunto de dados original, padronizando os preços por alqueire. No entanto, ao fazer isso, só conseguiste reunir cerca de 400 pontos de dados e apenas para os meses de outono. - -Dá uma olhada nos dados que pré-carregámos no _notebook_ que acompanha esta lição. Os dados estão pré-carregados e um gráfico de dispersão inicial é traçado para mostrar os dados por mês. Talvez possamos obter mais detalhes sobre a natureza dos dados ao limpá-los mais. - -## Uma linha de regressão linear - -Como aprendeste na Lição 1, o objetivo de um exercício de regressão linear é ser capaz de traçar uma linha para: - -- **Mostrar relações entre variáveis**. Mostrar a relação entre variáveis. -- **Fazer previsões**. Fazer previsões precisas sobre onde um novo ponto de dados cairia em relação a essa linha. - -É típico da **Regressão dos Mínimos Quadrados** traçar este tipo de linha. O termo 'mínimos quadrados' significa que todos os pontos de dados ao redor da linha de regressão são elevados ao quadrado e depois somados. Idealmente, essa soma final é o menor possível, porque queremos um número baixo de erros, ou `mínimos quadrados`. - -Fazemos isso porque queremos modelar uma linha que tenha a menor distância cumulativa de todos os nossos pontos de dados. Também elevamos os termos ao quadrado antes de somá-los, pois estamos preocupados com a magnitude e não com a direção. - -> **🧮 Mostra-me a matemática** -> -> Esta linha, chamada de _linha de melhor ajuste_, pode ser expressa por [uma equação](https://en.wikipedia.org/wiki/Simple_linear_regression): -> -> ``` -> Y = a + bX -> ``` -> -> `X` é a 'variável explicativa'. `Y` é a 'variável dependente'. A inclinação da linha é `b` e `a` é o intercepto em Y, que se refere ao valor de `Y` quando `X = 0`. -> ->![calcular a inclinação](../../../../2-Regression/3-Linear/images/slope.png) -> -> Primeiro, calcula-se a inclinação `b`. Infográfico por [Jen Looper](https://twitter.com/jenlooper) -> -> Em outras palavras, e referindo-se à pergunta original sobre os dados das abóboras: "prever o preço de uma abóbora por alqueire por mês", `X` referir-se-ia ao preço e `Y` ao mês de venda. -> ->![completar a equação](../../../../2-Regression/3-Linear/images/calculation.png) -> -> Calcula o valor de Y. Se estás a pagar cerca de $4, deve ser abril! Infográfico por [Jen Looper](https://twitter.com/jenlooper) -> -> A matemática que calcula a linha deve demonstrar a inclinação da linha, que também depende do intercepto, ou onde `Y` está situado quando `X = 0`. -> -> Podes observar o método de cálculo desses valores no site [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Também visita [este calculador de mínimos quadrados](https://www.mathsisfun.com/data/least-squares-calculator.html) para ver como os valores dos números impactam a linha. - -## Correlação - -Outro termo a compreender é o **Coeficiente de Correlação** entre as variáveis X e Y fornecidas. Usando um gráfico de dispersão, podes visualizar rapidamente este coeficiente. Um gráfico com pontos de dados dispersos numa linha ordenada tem alta correlação, mas um gráfico com pontos de dados espalhados por todo o lado entre X e Y tem baixa correlação. - -Um bom modelo de regressão linear será aquele que tem um Coeficiente de Correlação alto (mais próximo de 1 do que de 0) usando o método de Regressão dos Mínimos Quadrados com uma linha de regressão. - -✅ Executa o _notebook_ que acompanha esta lição e observa o gráfico de dispersão de Mês para Preço. Os dados que associam Mês ao Preço das vendas de abóboras parecem ter alta ou baixa correlação, de acordo com a tua interpretação visual do gráfico de dispersão? Isso muda se usares uma medida mais detalhada em vez de `Mês`, por exemplo, *dia do ano* (ou seja, número de dias desde o início do ano)? - -No código abaixo, assumiremos que limpámos os dados e obtivemos um _data frame_ chamado `new_pumpkins`, semelhante ao seguinte: - -ID | Mês | DiaDoAno | Variedade | Cidade | Embalagem | Preço Baixo | Preço Alto | Preço ----|-----|----------|-----------|--------|-----------|-------------|------------|------- -70 | 9 | 267 | TIPO TORTA | BALTIMORE | caixas de 1 1/9 alqueires | 15.0 | 15.0 | 13.636364 -71 | 9 | 267 | TIPO TORTA | BALTIMORE | caixas de 1 1/9 alqueires | 18.0 | 18.0 | 16.363636 -72 | 10 | 274 | TIPO TORTA | BALTIMORE | caixas de 1 1/9 alqueires | 18.0 | 18.0 | 16.363636 -73 | 10 | 274 | TIPO TORTA | BALTIMORE | caixas de 1 1/9 alqueires | 17.0 | 17.0 | 15.454545 -74 | 10 | 281 | TIPO TORTA | BALTIMORE | caixas de 1 1/9 alqueires | 15.0 | 15.0 | 13.636364 - -> O código para limpar os dados está disponível em [`notebook.ipynb`](../../../../2-Regression/3-Linear/notebook.ipynb). Realizámos os mesmos passos de limpeza da lição anterior e calculámos a coluna `DiaDoAno` usando a seguinte expressão: - -```python -day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days) -``` - -Agora que tens uma compreensão da matemática por trás da regressão linear, vamos criar um modelo de Regressão para ver se conseguimos prever qual embalagem de abóboras terá os melhores preços. Alguém que compra abóboras para um campo de abóboras de feriado pode querer esta informação para otimizar as suas compras de embalagens de abóboras para o campo. - -## Procurando por Correlação - -[![ML para iniciantes - Procurando por Correlação: A Chave para a Regressão Linear](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML para iniciantes - Procurando por Correlação: A Chave para a Regressão Linear") - -> 🎥 Clica na imagem acima para uma breve visão geral sobre correlação. - -Na lição anterior, provavelmente viste que o preço médio para diferentes meses parece assim: - -Preço médio por mês - -Isto sugere que deve haver alguma correlação, e podemos tentar treinar um modelo de regressão linear para prever a relação entre `Mês` e `Preço`, ou entre `DiaDoAno` e `Preço`. Aqui está o gráfico de dispersão que mostra a última relação: - -Gráfico de dispersão de Preço vs. Dia do Ano - -Vamos verificar se há correlação usando a função `corr`: - -```python -print(new_pumpkins['Month'].corr(new_pumpkins['Price'])) -print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price'])) -``` - -Parece que a correlação é bastante pequena, -0.15 por `Mês` e -0.17 por `DiaDoAno`, mas pode haver outra relação importante. Parece que há diferentes agrupamentos de preços correspondentes a diferentes variedades de abóboras. Para confirmar esta hipótese, vamos traçar cada categoria de abóbora usando uma cor diferente. Passando um parâmetro `ax` para a função de plotagem `scatter`, podemos traçar todos os pontos no mesmo gráfico: - -```python -ax=None -colors = ['red','blue','green','yellow'] -for i,var in enumerate(new_pumpkins['Variety'].unique()): - df = new_pumpkins[new_pumpkins['Variety']==var] - ax = df.plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var) -``` - -Gráfico de dispersão de Preço vs. Dia do Ano - -A nossa investigação sugere que a variedade tem mais efeito no preço geral do que a data de venda. Podemos ver isso com um gráfico de barras: - -```python -new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar') -``` - -Gráfico de barras de preço vs variedade - -Vamos focar-nos, por enquanto, apenas numa variedade de abóbora, o 'tipo torta', e ver qual o efeito da data no preço: - -```python -pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE'] -pie_pumpkins.plot.scatter('DayOfYear','Price') -``` -Gráfico de dispersão de Preço vs. Dia do Ano - -Se agora calcularmos a correlação entre `Preço` e `DiaDoAno` usando a função `corr`, obteremos algo como `-0.27` - o que significa que treinar um modelo preditivo faz sentido. - -> Antes de treinar um modelo de regressão linear, é importante garantir que os nossos dados estão limpos. A regressão linear não funciona bem com valores ausentes, por isso faz sentido eliminar todas as células vazias: - -```python -pie_pumpkins.dropna(inplace=True) -pie_pumpkins.info() -``` - -Outra abordagem seria preencher esses valores vazios com valores médios da coluna correspondente. - -## Regressão Linear Simples - -[![ML para iniciantes - Regressão Linear e Polinomial usando Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "ML para iniciantes - Regressão Linear e Polinomial usando Scikit-learn") - -> 🎥 Clica na imagem acima para uma breve visão geral sobre regressão linear e polinomial. - -Para treinar o nosso modelo de Regressão Linear, utilizaremos a biblioteca **Scikit-learn**. - -```python -from sklearn.linear_model import LinearRegression -from sklearn.metrics import mean_squared_error -from sklearn.model_selection import train_test_split -``` - -Começamos separando os valores de entrada (características) e a saída esperada (rótulo) em arrays numpy separados: - -```python -X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1) -y = pie_pumpkins['Price'] -``` - -> Nota que tivemos de realizar `reshape` nos dados de entrada para que o pacote de Regressão Linear os compreendesse corretamente. A Regressão Linear espera um array 2D como entrada, onde cada linha do array corresponde a um vetor de características de entrada. No nosso caso, como temos apenas uma entrada, precisamos de um array com forma N×1, onde N é o tamanho do conjunto de dados. - -Depois, precisamos dividir os dados em conjuntos de treino e teste, para que possamos validar o nosso modelo após o treino: - -```python -X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) -``` - -Finalmente, treinar o modelo de Regressão Linear propriamente dito leva apenas duas linhas de código. Definimos o objeto `LinearRegression` e ajustamo-lo aos nossos dados usando o método `fit`: - -```python -lin_reg = LinearRegression() -lin_reg.fit(X_train,y_train) -``` - -O objeto `LinearRegression` após o ajuste (`fit`) contém todos os coeficientes da regressão, que podem ser acessados usando a propriedade `.coef_`. No nosso caso, há apenas um coeficiente, que deve ser em torno de `-0.017`. Isso significa que os preços parecem cair um pouco com o tempo, mas não muito, cerca de 2 cêntimos por dia. Também podemos acessar o ponto de interseção da regressão com o eixo Y usando `lin_reg.intercept_` - será em torno de `21` no nosso caso, indicando o preço no início do ano. - -Para ver quão preciso é o nosso modelo, podemos prever preços num conjunto de dados de teste e depois medir quão próximas estão as nossas previsões dos valores esperados. Isso pode ser feito usando a métrica de erro quadrático médio (MSE), que é a média de todas as diferenças ao quadrado entre o valor esperado e o previsto. - -```python -pred = lin_reg.predict(X_test) - -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') -``` -O nosso erro parece estar em torno de 2 pontos, o que equivale a ~17%. Não é muito bom. Outro indicador da qualidade do modelo é o **coeficiente de determinação**, que pode ser obtido assim: - -```python -score = lin_reg.score(X_train,y_train) -print('Model determination: ', score) -``` -Se o valor for 0, significa que o modelo não considera os dados de entrada e age como o *pior preditor linear*, que é simplesmente o valor médio do resultado. O valor 1 significa que conseguimos prever perfeitamente todos os resultados esperados. No nosso caso, o coeficiente é cerca de 0,06, o que é bastante baixo. - -Também podemos traçar os dados de teste juntamente com a linha de regressão para visualizar melhor como a regressão funciona no nosso caso: - -```python -plt.scatter(X_test,y_test) -plt.plot(X_test,pred) -``` - -Regressão linear - -## Regressão Polinomial - -Outro tipo de Regressão Linear é a Regressão Polinomial. Embora às vezes exista uma relação linear entre variáveis - quanto maior o volume da abóbora, maior o preço - em outras situações essas relações não podem ser representadas como um plano ou linha reta. - -✅ Aqui estão [alguns exemplos adicionais](https://online.stat.psu.edu/stat501/lesson/9/9.8) de dados que poderiam usar Regressão Polinomial. - -Observe novamente a relação entre Data e Preço. Este gráfico de dispersão parece que deveria ser analisado necessariamente por uma linha reta? Os preços não podem flutuar? Neste caso, pode-se tentar a regressão polinomial. - -✅ Polinómios são expressões matemáticas que podem consistir em uma ou mais variáveis e coeficientes. - -A regressão polinomial cria uma linha curva para se ajustar melhor a dados não lineares. No nosso caso, se incluirmos uma variável `DayOfYear` ao quadrado nos dados de entrada, deveremos ser capazes de ajustar os dados com uma curva parabólica, que terá um mínimo em determinado ponto do ano. - -O Scikit-learn inclui uma [API de pipeline](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) útil para combinar diferentes etapas de processamento de dados. Um **pipeline** é uma cadeia de **estimadores**. No nosso caso, criaremos um pipeline que primeiro adiciona características polinomiais ao modelo e, em seguida, treina a regressão: - -```python -from sklearn.preprocessing import PolynomialFeatures -from sklearn.pipeline import make_pipeline - -pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) - -pipeline.fit(X_train,y_train) -``` - -Usar `PolynomialFeatures(2)` significa que incluiremos todos os polinómios de segundo grau dos dados de entrada. No nosso caso, isso significará apenas `DayOfYear`2, mas, dado duas variáveis de entrada X e Y, isso adicionará X2, XY e Y2. Também podemos usar polinómios de grau superior, se quisermos. - -Os pipelines podem ser usados da mesma forma que o objeto original `LinearRegression`, ou seja, podemos usar `fit` no pipeline e, em seguida, usar `predict` para obter os resultados da previsão. Aqui está o gráfico mostrando os dados de teste e a curva de aproximação: - -Regressão polinomial - -Usando a Regressão Polinomial, conseguimos um MSE ligeiramente mais baixo e um coeficiente de determinação mais alto, mas não significativamente. Precisamos levar em conta outras características! - -> Pode-se observar que os preços mínimos das abóboras ocorrem por volta do Halloween. Como explicaria isso? - -🎃 Parabéns, acabou de criar um modelo que pode ajudar a prever o preço das abóboras para tartes. Provavelmente poderia repetir o mesmo procedimento para todos os tipos de abóbora, mas isso seria trabalhoso. Vamos agora aprender como levar em conta a variedade de abóbora no nosso modelo! - -## Características Categóricas - -No mundo ideal, queremos ser capazes de prever preços para diferentes variedades de abóbora usando o mesmo modelo. No entanto, a coluna `Variety` é um pouco diferente de colunas como `Month`, porque contém valores não numéricos. Essas colunas são chamadas de **categóricas**. - -[![ML para principiantes - Previsões com características categóricas usando Regressão Linear](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML para principiantes - Previsões com características categóricas usando Regressão Linear") - -> 🎥 Clique na imagem acima para um breve vídeo sobre o uso de características categóricas. - -Aqui pode ver como o preço médio depende da variedade: - -Preço médio por variedade - -Para levar a variedade em conta, primeiro precisamos convertê-la para uma forma numérica, ou **codificá-la**. Existem várias formas de fazer isso: - -* A **codificação numérica simples** criará uma tabela com as diferentes variedades e, em seguida, substituirá o nome da variedade por um índice nessa tabela. Esta não é a melhor ideia para regressão linear, porque a regressão linear considera o valor numérico do índice e adiciona-o ao resultado, multiplicando por algum coeficiente. No nosso caso, a relação entre o número do índice e o preço é claramente não linear, mesmo que garantamos que os índices estejam ordenados de uma forma específica. -* A **codificação one-hot** substituirá a coluna `Variety` por 4 colunas diferentes, uma para cada variedade. Cada coluna conterá `1` se a linha correspondente for de uma determinada variedade, e `0` caso contrário. Isso significa que haverá quatro coeficientes na regressão linear, um para cada variedade de abóbora, responsáveis pelo "preço inicial" (ou melhor, "preço adicional") para essa variedade específica. - -O código abaixo mostra como podemos codificar uma variedade usando one-hot encoding: - -```python -pd.get_dummies(new_pumpkins['Variety']) -``` - - ID | FAIRYTALE | MINIATURE | MIXED HEIRLOOM VARIETIES | PIE TYPE -----|-----------|-----------|--------------------------|---------- -70 | 0 | 0 | 0 | 1 -71 | 0 | 0 | 0 | 1 -... | ... | ... | ... | ... -1738 | 0 | 1 | 0 | 0 -1739 | 0 | 1 | 0 | 0 -1740 | 0 | 1 | 0 | 0 -1741 | 0 | 1 | 0 | 0 -1742 | 0 | 1 | 0 | 0 - -Para treinar a regressão linear usando a variedade codificada como one-hot nos dados de entrada, só precisamos inicializar os dados `X` e `y` corretamente: - -```python -X = pd.get_dummies(new_pumpkins['Variety']) -y = new_pumpkins['Price'] -``` - -O restante do código é o mesmo que usamos acima para treinar a Regressão Linear. Se experimentar, verá que o erro quadrático médio é aproximadamente o mesmo, mas obtemos um coeficiente de determinação muito mais alto (~77%). Para obter previsões ainda mais precisas, podemos levar em conta mais características categóricas, bem como características numéricas, como `Month` ou `DayOfYear`. Para obter um grande conjunto de características, podemos usar `join`: - -```python -X = pd.get_dummies(new_pumpkins['Variety']) \ - .join(new_pumpkins['Month']) \ - .join(pd.get_dummies(new_pumpkins['City'])) \ - .join(pd.get_dummies(new_pumpkins['Package'])) -y = new_pumpkins['Price'] -``` - -Aqui também levamos em conta `City` e o tipo de `Package`, o que nos dá um MSE de 2,84 (10%) e um coeficiente de determinação de 0,94! - -## Resumindo tudo - -Para criar o melhor modelo, podemos usar dados combinados (categóricos codificados como one-hot + numéricos) do exemplo acima juntamente com a Regressão Polinomial. Aqui está o código completo para sua conveniência: - -```python -# set up training data -X = pd.get_dummies(new_pumpkins['Variety']) \ - .join(new_pumpkins['Month']) \ - .join(pd.get_dummies(new_pumpkins['City'])) \ - .join(pd.get_dummies(new_pumpkins['Package'])) -y = new_pumpkins['Price'] - -# make train-test split -X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) - -# setup and train the pipeline -pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) -pipeline.fit(X_train,y_train) - -# predict results for test data -pred = pipeline.predict(X_test) - -# calculate MSE and determination -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') - -score = pipeline.score(X_train,y_train) -print('Model determination: ', score) -``` - -Isso deve nos dar o melhor coeficiente de determinação de quase 97% e MSE=2,23 (~8% de erro de previsão). - -| Modelo | MSE | Determinação | -|--------|-----|--------------| -| `DayOfYear` Linear | 2,77 (17,2%) | 0,07 | -| `DayOfYear` Polinomial | 2,73 (17,0%) | 0,08 | -| `Variety` Linear | 5,24 (19,7%) | 0,77 | -| Todas as características Linear | 2,84 (10,5%) | 0,94 | -| Todas as características Polinomial | 2,23 (8,25%) | 0,97 | - -🏆 Muito bem! Criou quatro modelos de Regressão numa única lição e melhorou a qualidade do modelo para 97%. Na seção final sobre Regressão, aprenderá sobre Regressão Logística para determinar categorias. - ---- -## 🚀Desafio - -Teste várias variáveis diferentes neste notebook para ver como a correlação corresponde à precisão do modelo. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Nesta lição aprendemos sobre Regressão Linear. Existem outros tipos importantes de Regressão. Leia sobre as técnicas Stepwise, Ridge, Lasso e Elasticnet. Um bom curso para aprender mais é o [curso de Aprendizagem Estatística de Stanford](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning). - -## Tarefa - -[Crie um Modelo](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/3-Linear/assignment.md b/translations/pt/2-Regression/3-Linear/assignment.md deleted file mode 100644 index b964c9790..000000000 --- a/translations/pt/2-Regression/3-Linear/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Criar um Modelo de Regressão - -## Instruções - -Nesta lição, foi mostrado como construir um modelo utilizando Regressão Linear e Polinomial. Com base nesse conhecimento, encontre um conjunto de dados ou utilize um dos conjuntos integrados do Scikit-learn para criar um novo modelo. Explique no seu notebook por que escolheu a técnica utilizada e demonstre a precisão do seu modelo. Caso não seja preciso, explique o motivo. - -## Rubrica - -| Critério | Exemplar | Adequado | Precisa de Melhorias | -| -------- | ----------------------------------------------------------- | -------------------------- | -------------------------------- | -| | apresenta um notebook completo com uma solução bem documentada | a solução está incompleta | a solução apresenta falhas ou erros | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/3-Linear/notebook.ipynb b/translations/pt/2-Regression/3-Linear/notebook.ipynb deleted file mode 100644 index dd488939a..000000000 --- a/translations/pt/2-Regression/3-Linear/notebook.ipynb +++ /dev/null @@ -1,128 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Preços de Abóboras\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n", - "\n", - "- Obtenha apenas abóboras com preços por alqueire\n", - "- Converta a data para um mês\n", - "- Calcule o preço como uma média entre os preços altos e baixos\n", - "- Converta o preço para refletir a quantidade por alqueire\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "from datetime import datetime\n", - "\n", - "pumpkins = pd.read_csv('../data/US-pumpkins.csv')\n", - "\n", - "pumpkins.head()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)]\n", - "\n", - "columns_to_select = ['Package', 'Variety', 'City Name', 'Low Price', 'High Price', 'Date']\n", - "pumpkins = pumpkins.loc[:, columns_to_select]\n", - "\n", - "price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2\n", - "\n", - "month = pd.DatetimeIndex(pumpkins['Date']).month\n", - "day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days)\n", - "\n", - "new_pumpkins = pd.DataFrame(\n", - " {'Month': month, \n", - " 'DayOfYear' : day_of_year, \n", - " 'Variety': pumpkins['Variety'], \n", - " 'City': pumpkins['City Name'], \n", - " 'Package': pumpkins['Package'], \n", - " 'Low Price': pumpkins['Low Price'],\n", - " 'High Price': pumpkins['High Price'], \n", - " 'Price': price})\n", - "\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/1.1\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price*2\n", - "\n", - "new_pumpkins.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Um gráfico de dispersão básico lembra-nos que só temos dados mensais de agosto a dezembro. Provavelmente precisamos de mais dados para conseguir tirar conclusões de forma linear.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "plt.scatter('Month','Price',data=new_pumpkins)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "\n", - "plt.scatter('DayOfYear','Price',data=new_pumpkins)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.3-final" - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "b032d371c75279373507f003439a577e", - "translation_date": "2025-09-03T19:16:20+00:00", - "source_file": "2-Regression/3-Linear/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/3-Linear/solution/Julia/README.md b/translations/pt/2-Regression/3-Linear/solution/Julia/README.md deleted file mode 100644 index 68d6b50fd..000000000 --- a/translations/pt/2-Regression/3-Linear/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/3-Linear/solution/R/lesson_3-R.ipynb b/translations/pt/2-Regression/3-Linear/solution/R/lesson_3-R.ipynb deleted file mode 100644 index e4bd71ed7..000000000 --- a/translations/pt/2-Regression/3-Linear/solution/R/lesson_3-R.ipynb +++ /dev/null @@ -1,1087 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_3-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "5015d65d61ba75a223bfc56c273aa174", - "translation_date": "2025-09-03T19:24:43+00:00", - "source_file": "2-Regression/3-Linear/solution/R/lesson_3-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "EgQw8osnsUV-" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Regressão Linear e Polinomial para Preços de Abóboras - Aula 3\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "#### Introdução\n", - "\n", - "Até agora, exploraste o que é regressão com dados de exemplo recolhidos do conjunto de dados sobre preços de abóboras que utilizaremos ao longo desta aula. Também já os visualizaste usando `ggplot2`. 💪\n", - "\n", - "Agora estás pronto para aprofundar o tema da regressão para ML. Nesta aula, vais aprender mais sobre dois tipos de regressão: *regressão linear básica* e *regressão polinomial*, juntamente com alguns dos conceitos matemáticos subjacentes a estas técnicas.\n", - "\n", - "> Ao longo deste currículo, assumimos um conhecimento mínimo de matemática e procuramos torná-la acessível para estudantes de outras áreas. Por isso, presta atenção às notas, 🧮 destaques, diagramas e outras ferramentas de aprendizagem que ajudam na compreensão.\n", - "\n", - "#### Preparação\n", - "\n", - "Como lembrete, estás a carregar estes dados para fazer perguntas sobre eles.\n", - "\n", - "- Qual é a melhor altura para comprar abóboras?\n", - "\n", - "- Qual o preço que posso esperar por uma caixa de abóboras miniatura?\n", - "\n", - "- Devo comprá-las em cestos de meio alqueire ou em caixas de 1 1/9 alqueire? Vamos continuar a explorar estes dados.\n", - "\n", - "Na aula anterior, criaste um `tibble` (uma reinterpretação moderna do data frame) e preencheste-o com parte do conjunto de dados original, padronizando os preços por alqueire. Ao fazer isso, no entanto, só conseguiste recolher cerca de 400 pontos de dados e apenas para os meses de outono. Talvez possamos obter um pouco mais de detalhe sobre a natureza dos dados ao limpá-los melhor? Vamos ver... 🕵️‍♀️\n", - "\n", - "Para esta tarefa, vamos precisar dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [estrutura de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizagem automática.\n", - "\n", - "- `janitor`: O [pacote janitor](https://github.com/sfirke/janitor) oferece ferramentas simples para examinar e limpar dados desorganizados.\n", - "\n", - "- `corrplot`: O [pacote corrplot](https://cran.r-project.org/web/packages/corrplot/vignettes/corrplot-intro.html) fornece uma ferramenta visual exploratória para matrizes de correlação que suporta o reordenamento automático de variáveis para ajudar a detectar padrões ocultos entre variáveis.\n", - "\n", - "Podes instalá-los da seguinte forma:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"janitor\", \"corrplot\"))`\n", - "\n", - "O script abaixo verifica se tens os pacotes necessários para completar este módulo e instala-os para ti caso estejam em falta.\n" - ], - "metadata": { - "id": "WqQPS1OAsg3H" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if (!require(\"pacman\")) install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load(tidyverse, tidymodels, janitor, corrplot)" - ], - "outputs": [], - "metadata": { - "id": "tA4C2WN3skCf", - "colab": { - "base_uri": "https://localhost:8080/" - }, - "outputId": "c06cd805-5534-4edc-f72b-d0d1dab96ac0" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos carregar estes pacotes incríveis e torná-los disponíveis na nossa sessão atual de R. (Isto é apenas para ilustração, `pacman::p_load()` já fez isso por você)\n", - "\n", - "## 1. Uma linha de regressão linear\n", - "\n", - "Como aprendeste na Lição 1, o objetivo de um exercício de regressão linear é conseguir traçar uma *linha* *de* *melhor ajuste* para:\n", - "\n", - "- **Mostrar relações entre variáveis**. Mostrar a relação entre as variáveis.\n", - "\n", - "- **Fazer previsões**. Fazer previsões precisas sobre onde um novo ponto de dados se situaria em relação a essa linha.\n", - "\n", - "Para desenhar este tipo de linha, usamos uma técnica estatística chamada **Regressão dos Mínimos Quadrados**. O termo `mínimos quadrados` significa que todos os pontos de dados ao redor da linha de regressão são elevados ao quadrado e depois somados. Idealmente, essa soma final é o menor valor possível, porque queremos um número baixo de erros, ou `mínimos quadrados`. Assim, a linha de melhor ajuste é a linha que nos dá o menor valor para a soma dos erros ao quadrado - daí o nome *regressão dos mínimos quadrados*.\n", - "\n", - "Fazemos isso porque queremos modelar uma linha que tenha a menor distância acumulada de todos os nossos pontos de dados. Também elevamos os termos ao quadrado antes de somá-los, pois estamos preocupados com a sua magnitude e não com a sua direção.\n", - "\n", - "> **🧮 Mostra-me a matemática**\n", - ">\n", - "> Esta linha, chamada de *linha de melhor ajuste*, pode ser expressa por [uma equação](https://en.wikipedia.org/wiki/Simple_linear_regression):\n", - ">\n", - "> Y = a + bX\n", - ">\n", - "> `X` é a '`variável explicativa` ou `preditor`'. `Y` é a '`variável dependente` ou `resultado`'. A inclinação da linha é `b` e `a` é o ponto de interseção no eixo Y, que se refere ao valor de `Y` quando `X = 0`.\n", - ">\n", - "\n", - "> ![](../../../../../../2-Regression/3-Linear/solution/images/slope.png \"slope = $y/x$\")\n", - " Infográfico por Jen Looper\n", - ">\n", - "> Primeiro, calcula a inclinação `b`.\n", - ">\n", - "> Em outras palavras, e referindo-nos à pergunta original sobre os dados das abóboras: \"prever o preço de uma abóbora por alqueire ao longo dos meses\", `X` referiria-se ao preço e `Y` ao mês de venda.\n", - ">\n", - "> ![](../../../../../../translated_images/pt-PT/calculation.989aa7822020d9d0ba9fc781f1ab5192f3421be86ebb88026528aef33c37b0d8.png)\n", - " Infográfico por Jen Looper\n", - "> \n", - "> Calcula o valor de Y. Se estás a pagar cerca de \\$4, deve ser abril!\n", - ">\n", - "> A matemática que calcula a linha deve demonstrar a inclinação da linha, que também depende do ponto de interseção, ou onde `Y` está situado quando `X = 0`.\n", - ">\n", - "> Podes observar o método de cálculo destes valores no site [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Também visita [este calculador de mínimos quadrados](https://www.mathsisfun.com/data/least-squares-calculator.html) para ver como os valores dos números impactam a linha.\n", - "\n", - "Não é tão assustador, certo? 🤓\n", - "\n", - "#### Correlação\n", - "\n", - "Outro termo importante para entender é o **Coeficiente de Correlação** entre as variáveis X e Y fornecidas. Usando um gráfico de dispersão, podes visualizar rapidamente este coeficiente. Um gráfico com pontos de dados alinhados de forma ordenada tem alta correlação, mas um gráfico com pontos de dados espalhados aleatoriamente entre X e Y tem baixa correlação.\n", - "\n", - "Um bom modelo de regressão linear será aquele que tem um Coeficiente de Correlação alto (mais próximo de 1 do que de 0) usando o método de Regressão dos Mínimos Quadrados com uma linha de regressão.\n" - ], - "metadata": { - "id": "cdX5FRpvsoP5" - } - }, - { - "cell_type": "markdown", - "source": [ - "## **2. Uma dança com dados: criar um data frame que será usado para modelação**\n", - "\n", - "

\n", - " \n", - "

Ilustração por @allison_horst
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "WdUKXk7Bs8-V" - } - }, - { - "cell_type": "markdown", - "source": [ - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um data frame contendo um subconjunto dos dados:\n", - "\n", - "- Obtenha apenas abóboras com preços por alqueire\n", - "\n", - "- Converta a data para um mês\n", - "\n", - "- Calcule o preço como uma média entre os preços altos e baixos\n", - "\n", - "- Converta o preço para refletir a quantidade por alqueire\n", - "\n", - "> Abordámos estes passos na [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/2-Regression/2-Data/solution/lesson_2-R.ipynb).\n" - ], - "metadata": { - "id": "fMCtu2G2s-p8" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the core Tidyverse packages\n", - "library(tidyverse)\n", - "library(lubridate)\n", - "\n", - "# Import the pumpkins data\n", - "pumpkins <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/2-Regression/data/US-pumpkins.csv\")\n", - "\n", - "\n", - "# Get a glimpse and dimensions of the data\n", - "glimpse(pumpkins)\n", - "\n", - "\n", - "# Print the first 50 rows of the data set\n", - "pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "ryMVZEEPtERn" - } - }, - { - "cell_type": "markdown", - "source": [ - "No espírito de pura aventura, vamos explorar o [`pacote janitor`](../../../../../../2-Regression/3-Linear/solution/R/github.com/sfirke/janitor) que fornece funções simples para examinar e limpar dados desorganizados. Por exemplo, vamos dar uma olhada nos nomes das colunas dos nossos dados:\n" - ], - "metadata": { - "id": "xcNxM70EtJjb" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Return column names\n", - "pumpkins %>% \n", - " names()" - ], - "outputs": [], - "metadata": { - "id": "5XtpaIigtPfW" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤔 Podemos fazer melhor. Vamos tornar estes nomes de colunas `friendR` ao convertê-los para a convenção [snake_case](https://en.wikipedia.org/wiki/Snake_case) usando `janitor::clean_names`. Para saber mais sobre esta função: `?clean_names`\n" - ], - "metadata": { - "id": "IbIqrMINtSHe" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Clean names to the snake_case convention\n", - "pumpkins <- pumpkins %>% \n", - " clean_names(case = \"snake\")\n", - "\n", - "# Return column names\n", - "pumpkins %>% \n", - " names()" - ], - "outputs": [], - "metadata": { - "id": "a2uYvclYtWvX" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito tidyR 🧹! Agora, uma dança com os dados usando `dplyr`, como na lição anterior! 💃\n" - ], - "metadata": { - "id": "HfhnuzDDtaDd" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Select desired columns\n", - "pumpkins <- pumpkins %>% \n", - " select(variety, city_name, package, low_price, high_price, date)\n", - "\n", - "\n", - "\n", - "# Extract the month from the dates to a new column\n", - "pumpkins <- pumpkins %>%\n", - " mutate(date = mdy(date),\n", - " month = month(date)) %>% \n", - " select(-date)\n", - "\n", - "\n", - "\n", - "# Create a new column for average Price\n", - "pumpkins <- pumpkins %>% \n", - " mutate(price = (low_price + high_price)/2)\n", - "\n", - "\n", - "# Retain only pumpkins with the string \"bushel\"\n", - "new_pumpkins <- pumpkins %>% \n", - " filter(str_detect(string = package, pattern = \"bushel\"))\n", - "\n", - "\n", - "# Normalize the pricing so that you show the pricing per bushel, not per 1 1/9 or 1/2 bushel\n", - "new_pumpkins <- new_pumpkins %>% \n", - " mutate(price = case_when(\n", - " str_detect(package, \"1 1/9\") ~ price/(1.1),\n", - " str_detect(package, \"1/2\") ~ price*2,\n", - " TRUE ~ price))\n", - "\n", - "# Relocate column positions\n", - "new_pumpkins <- new_pumpkins %>% \n", - " relocate(month, .before = variety)\n", - "\n", - "\n", - "# Display the first 5 rows\n", - "new_pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "X0wU3gQvtd9f" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho!👌 Agora tens um conjunto de dados limpo e organizado sobre o qual podes construir o teu novo modelo de regressão!\n", - "\n", - "Que tal um gráfico de dispersão?\n" - ], - "metadata": { - "id": "UpaIwaxqth82" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Set theme\n", - "theme_set(theme_light())\n", - "\n", - "# Make a scatter plot of month and price\n", - "new_pumpkins %>% \n", - " ggplot(mapping = aes(x = month, y = price)) +\n", - " geom_point(size = 1.6)\n" - ], - "outputs": [], - "metadata": { - "id": "DXgU-j37tl5K" - } - }, - { - "cell_type": "markdown", - "source": [ - "Um gráfico de dispersão lembra-nos que só temos dados mensais de agosto a dezembro. Provavelmente precisamos de mais dados para conseguir tirar conclusões de forma linear.\n", - "\n", - "Vamos analisar novamente os nossos dados de modelação:\n" - ], - "metadata": { - "id": "Ve64wVbwtobI" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Display first 5 rows\n", - "new_pumpkins %>% \n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "HFQX2ng1tuSJ" - } - }, - { - "cell_type": "markdown", - "source": [ - "E se quiséssemos prever o `price` de uma abóbora com base nas colunas `city` ou `package`, que são do tipo carácter? Ou, ainda mais simples, como poderíamos encontrar a correlação (que exige que ambos os seus inputs sejam numéricos) entre, por exemplo, `package` e `price`? 🤷🤷\n", - "\n", - "Os modelos de aprendizagem automática funcionam melhor com características numéricas em vez de valores de texto, por isso, geralmente é necessário converter características categóricas em representações numéricas.\n", - "\n", - "Isto significa que temos de encontrar uma forma de reformular os nossos preditores para os tornar mais fáceis de usar por um modelo de forma eficaz, um processo conhecido como `feature engineering`.\n" - ], - "metadata": { - "id": "7hsHoxsStyjJ" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 3. Pré-processamento de dados para modelação com recipes 👩‍🍳👨‍🍳\n", - "\n", - "Atividades que reformulam os valores dos preditores para torná-los mais fáceis de usar de forma eficaz por um modelo são chamadas de `engenharia de características`.\n", - "\n", - "Modelos diferentes têm requisitos de pré-processamento distintos. Por exemplo, mínimos quadrados requerem `codificação de variáveis categóricas`, como mês, variedade e city_name. Isso envolve simplesmente `traduzir` uma coluna com `valores categóricos` em uma ou mais `colunas numéricas` que substituem a original.\n", - "\n", - "Por exemplo, suponha que os seus dados incluam a seguinte característica categórica:\n", - "\n", - "| cidade |\n", - "|:---------:|\n", - "| Denver |\n", - "| Nairobi |\n", - "| Tóquio |\n", - "\n", - "Pode aplicar *codificação ordinal* para substituir cada categoria por um valor inteiro único, assim:\n", - "\n", - "| cidade |\n", - "|:------:|\n", - "| 0 |\n", - "| 1 |\n", - "| 2 |\n", - "\n", - "E é isso que vamos fazer com os nossos dados!\n", - "\n", - "Nesta secção, vamos explorar outro pacote incrível do Tidymodels: [recipes](https://tidymodels.github.io/recipes/) - que foi criado para ajudar a pré-processar os seus dados **antes** de treinar o modelo. No seu núcleo, uma receita é um objeto que define quais passos devem ser aplicados a um conjunto de dados para prepará-lo para a modelação.\n", - "\n", - "Agora, vamos criar uma receita que prepara os nossos dados para modelação, substituindo um número inteiro único por todas as observações nas colunas de preditores:\n" - ], - "metadata": { - "id": "AD5kQbcvt3Xl" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Specify a recipe\n", - "pumpkins_recipe <- recipe(price ~ ., data = new_pumpkins) %>% \n", - " step_integer(all_predictors(), zero_based = TRUE)\n", - "\n", - "\n", - "# Print out the recipe\n", - "pumpkins_recipe" - ], - "outputs": [], - "metadata": { - "id": "BNaFKXfRt9TU" - } - }, - { - "cell_type": "markdown", - "source": [ - "Incrível! 👏 Acabámos de criar a nossa primeira receita que especifica um resultado (preço) e os seus respetivos preditores, e que todas as colunas de preditores devem ser codificadas como um conjunto de números inteiros 🙌! Vamos analisar rapidamente:\n", - "\n", - "- A chamada para `recipe()` com uma fórmula indica à receita os *papéis* das variáveis, utilizando os dados de `new_pumpkins` como referência. Por exemplo, a coluna `price` foi atribuída ao papel de `outcome`, enquanto o resto das colunas foram atribuídas ao papel de `predictor`.\n", - "\n", - "- `step_integer(all_predictors(), zero_based = TRUE)` especifica que todos os preditores devem ser convertidos num conjunto de números inteiros, começando a numeração em 0.\n", - "\n", - "Temos a certeza de que pode estar a pensar algo como: \"Isto é tão fixe!! Mas e se eu precisar de confirmar que as receitas estão a fazer exatamente o que espero? 🤔\"\n", - "\n", - "Essa é uma ótima ideia! Veja, uma vez que a sua receita está definida, pode estimar os parâmetros necessários para realmente pré-processar os dados e, em seguida, extrair os dados processados. Normalmente, não precisa de fazer isto quando utiliza Tidymodels (vamos ver a convenção normal daqui a pouco-\\> `workflows`), mas pode ser útil quando quiser fazer algum tipo de verificação para confirmar que as receitas estão a funcionar como esperado.\n", - "\n", - "Para isso, vai precisar de mais dois verbos: `prep()` e `bake()`. E, como sempre, os nossos pequenos amigos do R criados por [`Allison Horst`](https://github.com/allisonhorst/stats-illustrations) ajudam a compreender isto melhor!\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "KEiO0v7kuC9O" - } - }, - { - "cell_type": "markdown", - "source": [ - "[`prep()`](https://recipes.tidymodels.org/reference/prep.html): estima os parâmetros necessários a partir de um conjunto de treino que podem ser posteriormente aplicados a outros conjuntos de dados. Por exemplo, para uma determinada coluna preditora, qual observação será atribuída ao número inteiro 0, 1, 2, etc.\n", - "\n", - "[`bake()`](https://recipes.tidymodels.org/reference/bake.html): utiliza uma receita preparada e aplica as operações a qualquer conjunto de dados.\n", - "\n", - "Dito isto, vamos preparar e aplicar as nossas receitas para realmente confirmar que, nos bastidores, as colunas preditoras serão primeiro codificadas antes de ajustar um modelo.\n" - ], - "metadata": { - "id": "Q1xtzebuuTCP" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Prep the recipe\n", - "pumpkins_prep <- prep(pumpkins_recipe)\n", - "\n", - "# Bake the recipe to extract a preprocessed new_pumpkins data\n", - "baked_pumpkins <- bake(pumpkins_prep, new_data = NULL)\n", - "\n", - "# Print out the baked data set\n", - "baked_pumpkins %>% \n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "FGBbJbP_uUUn" - } - }, - { - "cell_type": "markdown", - "source": [ - "Woo-hoo!🥳 Os dados processados `baked_pumpkins` têm todos os seus preditores codificados, confirmando que, de facto, os passos de pré-processamento definidos como a nossa receita funcionarão conforme esperado. Isto torna mais difícil para ti ler, mas muito mais inteligível para o Tidymodels! Dedica algum tempo a descobrir que observação foi mapeada para um número inteiro correspondente.\n", - "\n", - "Também vale a pena mencionar que `baked_pumpkins` é um data frame no qual podemos realizar cálculos.\n", - "\n", - "Por exemplo, vamos tentar encontrar uma boa correlação entre dois pontos dos teus dados para, potencialmente, construir um bom modelo preditivo. Vamos usar a função `cor()` para fazer isto. Escreve `?cor()` para saberes mais sobre a função.\n" - ], - "metadata": { - "id": "1dvP0LBUueAW" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Find the correlation between the city_name and the price\n", - "cor(baked_pumpkins$city_name, baked_pumpkins$price)\n", - "\n", - "# Find the correlation between the package and the price\n", - "cor(baked_pumpkins$package, baked_pumpkins$price)\n" - ], - "outputs": [], - "metadata": { - "id": "3bQzXCjFuiSV" - } - }, - { - "cell_type": "markdown", - "source": [ - "Afinal, há apenas uma correlação fraca entre a Cidade e o Preço. No entanto, há uma correlação um pouco melhor entre o Pacote e o seu Preço. Faz sentido, certo? Normalmente, quanto maior a caixa de produtos, maior o preço.\n", - "\n", - "Já que estamos nisso, vamos também tentar visualizar uma matriz de correlação de todas as colunas usando o pacote `corrplot`.\n" - ], - "metadata": { - "id": "BToPWbgjuoZw" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the corrplot package\n", - "library(corrplot)\n", - "\n", - "# Obtain correlation matrix\n", - "corr_mat <- cor(baked_pumpkins %>% \n", - " # Drop columns that are not really informative\n", - " select(-c(low_price, high_price)))\n", - "\n", - "# Make a correlation plot between the variables\n", - "corrplot(corr_mat, method = \"shade\", shade.col = NA, tl.col = \"black\", tl.srt = 45, addCoef.col = \"black\", cl.pos = \"n\", order = \"original\")" - ], - "outputs": [], - "metadata": { - "id": "ZwAL3ksmutVR" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤩🤩 Muito melhor.\n", - "\n", - "Uma boa pergunta a fazer agora com estes dados seria: '`Que preço posso esperar de um determinado pacote de abóboras?`' Vamos começar!\n", - "\n", - "> Nota: Quando **`bake()`** a receita preparada **`pumpkins_prep`** com **`new_data = NULL`**, extrai os dados de treino processados (ou seja, codificados). Se tiver outro conjunto de dados, por exemplo, um conjunto de teste, e quiser ver como uma receita o pré-processaria, basta fazer o bake de **`pumpkins_prep`** com **`new_data = test_set`**.\n", - "\n", - "## 4. Construir um modelo de regressão linear\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "YqXjLuWavNxW" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora que criámos uma receita e confirmámos que os dados serão pré-processados de forma adequada, vamos agora construir um modelo de regressão para responder à pergunta: `Qual o preço que posso esperar de um determinado pacote de abóbora?`\n", - "\n", - "#### Treinar um modelo de regressão linear utilizando o conjunto de treino\n", - "\n", - "Como já deve ter percebido, a coluna *price* é a variável `resultado`, enquanto a coluna *package* é a variável `preditor`.\n", - "\n", - "Para isso, primeiro vamos dividir os dados de forma que 80% sejam usados para treino e 20% para teste, depois definiremos uma receita que codificará a coluna preditora num conjunto de inteiros e, em seguida, construiremos uma especificação de modelo. Não vamos preparar e aplicar a nossa receita, pois já sabemos que ela irá pré-processar os dados conforme esperado.\n" - ], - "metadata": { - "id": "Pq0bSzCevW-h" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "set.seed(2056)\n", - "# Split the data into training and test sets\n", - "pumpkins_split <- new_pumpkins %>% \n", - " initial_split(prop = 0.8)\n", - "\n", - "\n", - "# Extract training and test data\n", - "pumpkins_train <- training(pumpkins_split)\n", - "pumpkins_test <- testing(pumpkins_split)\n", - "\n", - "\n", - "\n", - "# Create a recipe for preprocessing the data\n", - "lm_pumpkins_recipe <- recipe(price ~ package, data = pumpkins_train) %>% \n", - " step_integer(all_predictors(), zero_based = TRUE)\n", - "\n", - "\n", - "\n", - "# Create a linear model specification\n", - "lm_spec <- linear_reg() %>% \n", - " set_engine(\"lm\") %>% \n", - " set_mode(\"regression\")" - ], - "outputs": [], - "metadata": { - "id": "CyoEh_wuvcLv" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho! Agora que temos uma receita e uma especificação de modelo, precisamos encontrar uma forma de agrupá-los num objeto que primeiro pré-processa os dados (prep+bake nos bastidores), ajusta o modelo nos dados pré-processados e também permite possíveis atividades de pós-processamento. Que tal para a tua tranquilidade!🤩\n", - "\n", - "No Tidymodels, este objeto prático chama-se [`workflow`](https://workflows.tidymodels.org/) e guarda convenientemente os teus componentes de modelação! Isto é o que chamaríamos de *pipelines* em *Python*.\n", - "\n", - "Então, vamos agrupar tudo num workflow!📦\n" - ], - "metadata": { - "id": "G3zF_3DqviFJ" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Hold modelling components in a workflow\n", - "lm_wf <- workflow() %>% \n", - " add_recipe(lm_pumpkins_recipe) %>% \n", - " add_model(lm_spec)\n", - "\n", - "# Print out the workflow\n", - "lm_wf" - ], - "outputs": [], - "metadata": { - "id": "T3olroU3v-WX" - } - }, - { - "cell_type": "markdown", - "source": [ - "Além disso, um fluxo de trabalho pode ser ajustado/treinado de forma muito semelhante a um modelo.\n" - ], - "metadata": { - "id": "zd1A5tgOwEPX" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Train the model\n", - "lm_wf_fit <- lm_wf %>% \n", - " fit(data = pumpkins_train)\n", - "\n", - "# Print the model coefficients learned \n", - "lm_wf_fit" - ], - "outputs": [], - "metadata": { - "id": "NhJagFumwFHf" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir dos resultados do modelo, podemos observar os coeficientes aprendidos durante o treino. Eles representam os coeficientes da linha de melhor ajuste que nos proporciona o menor erro geral entre a variável real e a prevista.\n", - "\n", - "#### Avaliar o desempenho do modelo utilizando o conjunto de teste\n", - "\n", - "É hora de ver como o modelo se saiu 📏! Como fazemos isso?\n", - "\n", - "Agora que treinámos o modelo, podemos utilizá-lo para fazer previsões no test_set usando `parsnip::predict()`. Depois, podemos comparar estas previsões com os valores reais das etiquetas para avaliar quão bem (ou não!) o modelo está a funcionar.\n", - "\n", - "Vamos começar por fazer previsões para o conjunto de teste e, em seguida, ligar as colunas ao conjunto de teste.\n" - ], - "metadata": { - "id": "_4QkGtBTwItF" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make predictions for the test set\n", - "predictions <- lm_wf_fit %>% \n", - " predict(new_data = pumpkins_test)\n", - "\n", - "\n", - "# Bind predictions to the test set\n", - "lm_results <- pumpkins_test %>% \n", - " select(c(package, price)) %>% \n", - " bind_cols(predictions)\n", - "\n", - "\n", - "# Print the first ten rows of the tibble\n", - "lm_results %>% \n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "UFZzTG0gwTs9" - } - }, - { - "cell_type": "markdown", - "source": [ - "Sim, acabou de treinar um modelo e utilizou-o para fazer previsões! 🔮 Será que é bom? Vamos avaliar o desempenho do modelo!\n", - "\n", - "No Tidymodels, fazemos isso utilizando `yardstick::metrics()`! Para regressão linear, vamos focar nas seguintes métricas:\n", - "\n", - "- `Root Mean Square Error (RMSE)`: A raiz quadrada do [MSE](https://en.wikipedia.org/wiki/Mean_squared_error). Esta métrica fornece um valor absoluto na mesma unidade que o rótulo (neste caso, o preço de uma abóbora). Quanto menor o valor, melhor o modelo (de forma simplista, representa o preço médio pelo qual as previsões estão erradas!).\n", - "\n", - "- `Coefficient of Determination (geralmente conhecido como R-quadrado ou R2)`: Uma métrica relativa em que, quanto maior o valor, melhor o ajuste do modelo. Essencialmente, esta métrica representa o quanto da variância entre os valores previstos e os valores reais o modelo consegue explicar.\n" - ], - "metadata": { - "id": "0A5MjzM7wW9M" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Evaluate performance of linear regression\n", - "metrics(data = lm_results,\n", - " truth = price,\n", - " estimate = .pred)" - ], - "outputs": [], - "metadata": { - "id": "reJ0UIhQwcEH" - } - }, - { - "cell_type": "markdown", - "source": [ - "Lá se vai o desempenho do modelo. Vamos ver se conseguimos obter uma indicação melhor ao visualizar um gráfico de dispersão do pacote e do preço, e depois usar as previsões feitas para sobrepor uma linha de melhor ajuste.\n", - "\n", - "Isto significa que teremos de preparar e processar o conjunto de teste para codificar a coluna do pacote e, em seguida, associar isso às previsões feitas pelo nosso modelo.\n" - ], - "metadata": { - "id": "fdgjzjkBwfWt" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Encode package column\n", - "package_encode <- lm_pumpkins_recipe %>% \n", - " prep() %>% \n", - " bake(new_data = pumpkins_test) %>% \n", - " select(package)\n", - "\n", - "\n", - "# Bind encoded package column to the results\n", - "lm_results <- lm_results %>% \n", - " bind_cols(package_encode %>% \n", - " rename(package_integer = package)) %>% \n", - " relocate(package_integer, .after = package)\n", - "\n", - "\n", - "# Print new results data frame\n", - "lm_results %>% \n", - " slice_head(n = 5)\n", - "\n", - "\n", - "# Make a scatter plot\n", - "lm_results %>% \n", - " ggplot(mapping = aes(x = package_integer, y = price)) +\n", - " geom_point(size = 1.6) +\n", - " # Overlay a line of best fit\n", - " geom_line(aes(y = .pred), color = \"orange\", size = 1.2) +\n", - " xlab(\"package\")\n", - " \n" - ], - "outputs": [], - "metadata": { - "id": "R0nw719lwkHE" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ótimo! Como pode ver, o modelo de regressão linear não generaliza muito bem a relação entre um pacote e o seu preço correspondente.\n", - "\n", - "🎃 Parabéns, acabou de criar um modelo que pode ajudar a prever o preço de algumas variedades de abóboras. O seu campo de abóboras para o feriado será lindo. Mas provavelmente pode criar um modelo ainda melhor!\n", - "\n", - "## 5. Construir um modelo de regressão polinomial\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n" - ], - "metadata": { - "id": "HOCqJXLTwtWI" - } - }, - { - "cell_type": "markdown", - "source": [ - "Às vezes, os nossos dados podem não ter uma relação linear, mas ainda assim queremos prever um resultado. A regressão polinomial pode ajudar-nos a fazer previsões para relações não lineares mais complexas.\n", - "\n", - "Por exemplo, considere a relação entre o tamanho e o preço no nosso conjunto de dados de abóboras. Embora, por vezes, exista uma relação linear entre as variáveis - quanto maior o volume da abóbora, maior o preço - outras vezes estas relações não podem ser representadas como um plano ou uma linha reta.\n", - "\n", - "> ✅ Aqui estão [alguns exemplos adicionais](https://online.stat.psu.edu/stat501/lesson/9/9.8) de dados que poderiam usar regressão polinomial\n", - ">\n", - "> Observe novamente a relação entre Variedade e Preço no gráfico anterior. Este diagrama de dispersão parece que deveria ser necessariamente analisado por uma linha reta? Talvez não. Neste caso, pode experimentar a regressão polinomial.\n", - ">\n", - "> ✅ Polinómios são expressões matemáticas que podem consistir em uma ou mais variáveis e coeficientes\n", - "\n", - "#### Treinar um modelo de regressão polinomial usando o conjunto de treino\n", - "\n", - "A regressão polinomial cria uma *linha curva* para ajustar melhor os dados não lineares.\n", - "\n", - "Vamos ver se um modelo polinomial terá um desempenho melhor ao fazer previsões. Seguiremos um procedimento algo semelhante ao que fizemos anteriormente:\n", - "\n", - "- Criar uma receita que especifique os passos de pré-processamento que devem ser realizados nos nossos dados para os preparar para modelação, ou seja: codificar preditores e calcular polinómios de grau *n*\n", - "\n", - "- Construir uma especificação de modelo\n", - "\n", - "- Agrupar a receita e a especificação de modelo num fluxo de trabalho\n", - "\n", - "- Criar um modelo ajustando o fluxo de trabalho\n", - "\n", - "- Avaliar o desempenho do modelo nos dados de teste\n", - "\n", - "Vamos começar!\n" - ], - "metadata": { - "id": "VcEIpRV9wzYr" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Specify a recipe\r\n", - "poly_pumpkins_recipe <-\r\n", - " recipe(price ~ package, data = pumpkins_train) %>%\r\n", - " step_integer(all_predictors(), zero_based = TRUE) %>% \r\n", - " step_poly(all_predictors(), degree = 4)\r\n", - "\r\n", - "\r\n", - "# Create a model specification\r\n", - "poly_spec <- linear_reg() %>% \r\n", - " set_engine(\"lm\") %>% \r\n", - " set_mode(\"regression\")\r\n", - "\r\n", - "\r\n", - "# Bundle recipe and model spec into a workflow\r\n", - "poly_wf <- workflow() %>% \r\n", - " add_recipe(poly_pumpkins_recipe) %>% \r\n", - " add_model(poly_spec)\r\n", - "\r\n", - "\r\n", - "# Create a model\r\n", - "poly_wf_fit <- poly_wf %>% \r\n", - " fit(data = pumpkins_train)\r\n", - "\r\n", - "\r\n", - "# Print learned model coefficients\r\n", - "poly_wf_fit\r\n", - "\r\n", - " " - ], - "outputs": [], - "metadata": { - "id": "63n_YyRXw3CC" - } - }, - { - "cell_type": "markdown", - "source": [ - "#### Avaliar o desempenho do modelo\n", - "\n", - "👏👏Construíste um modelo polinomial, vamos fazer previsões no conjunto de teste!\n" - ], - "metadata": { - "id": "-LHZtztSxDP0" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make price predictions on test data\r\n", - "poly_results <- poly_wf_fit %>% predict(new_data = pumpkins_test) %>% \r\n", - " bind_cols(pumpkins_test %>% select(c(package, price))) %>% \r\n", - " relocate(.pred, .after = last_col())\r\n", - "\r\n", - "\r\n", - "# Print the results\r\n", - "poly_results %>% \r\n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "YUFpQ_dKxJGx" - } - }, - { - "cell_type": "markdown", - "source": [ - "Woo-hoo, vamos avaliar como o modelo se saiu no test_set usando `yardstick::metrics()`.\n" - ], - "metadata": { - "id": "qxdyj86bxNGZ" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "metrics(data = poly_results, truth = price, estimate = .pred)" - ], - "outputs": [], - "metadata": { - "id": "8AW5ltkBxXDm" - } - }, - { - "cell_type": "markdown", - "source": [ - "🤩🤩 Desempenho muito melhor.\n", - "\n", - "O `rmse` diminuiu de cerca de 7 para cerca de 3, uma indicação de um erro reduzido entre o preço real e o preço previsto. Pode-se *interpretar de forma aproximada* que, em média, as previsões incorretas erram por cerca de 3€. O `rsq` aumentou de cerca de 0.4 para 0.8.\n", - "\n", - "Todos estes indicadores mostram que o modelo polinomial tem um desempenho muito superior ao modelo linear. Bom trabalho!\n", - "\n", - "Vamos ver se conseguimos visualizar isto!\n" - ], - "metadata": { - "id": "6gLHNZDwxYaS" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Bind encoded package column to the results\r\n", - "poly_results <- poly_results %>% \r\n", - " bind_cols(package_encode %>% \r\n", - " rename(package_integer = package)) %>% \r\n", - " relocate(package_integer, .after = package)\r\n", - "\r\n", - "\r\n", - "# Print new results data frame\r\n", - "poly_results %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "\r\n", - "# Make a scatter plot\r\n", - "poly_results %>% \r\n", - " ggplot(mapping = aes(x = package_integer, y = price)) +\r\n", - " geom_point(size = 1.6) +\r\n", - " # Overlay a line of best fit\r\n", - " geom_line(aes(y = .pred), color = \"midnightblue\", size = 1.2) +\r\n", - " xlab(\"package\")\r\n" - ], - "outputs": [], - "metadata": { - "id": "A83U16frxdF1" - } - }, - { - "cell_type": "markdown", - "source": [ - "Pode ver uma linha curva que se ajusta melhor aos seus dados! 🤩\n", - "\n", - "Pode torná-la mais suave ao passar uma fórmula polinomial para `geom_smooth` assim:\n" - ], - "metadata": { - "id": "4U-7aHOVxlGU" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make a scatter plot\r\n", - "poly_results %>% \r\n", - " ggplot(mapping = aes(x = package_integer, y = price)) +\r\n", - " geom_point(size = 1.6) +\r\n", - " # Overlay a line of best fit\r\n", - " geom_smooth(method = lm, formula = y ~ poly(x, degree = 4), color = \"midnightblue\", size = 1.2, se = FALSE) +\r\n", - " xlab(\"package\")" - ], - "outputs": [], - "metadata": { - "id": "5vzNT0Uexm-w" - } - }, - { - "cell_type": "markdown", - "source": [ - "Muito parecido com uma curva suave!🤩\n", - "\n", - "Aqui está como fazer uma nova previsão:\n" - ], - "metadata": { - "id": "v9u-wwyLxq4G" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make a hypothetical data frame\r\n", - "hypo_tibble <- tibble(package = \"bushel baskets\")\r\n", - "\r\n", - "# Make predictions using linear model\r\n", - "lm_pred <- lm_wf_fit %>% predict(new_data = hypo_tibble)\r\n", - "\r\n", - "# Make predictions using polynomial model\r\n", - "poly_pred <- poly_wf_fit %>% predict(new_data = hypo_tibble)\r\n", - "\r\n", - "# Return predictions in a list\r\n", - "list(\"linear model prediction\" = lm_pred, \r\n", - " \"polynomial model prediction\" = poly_pred)\r\n" - ], - "outputs": [], - "metadata": { - "id": "jRPSyfQGxuQv" - } - }, - { - "cell_type": "markdown", - "source": [ - "A previsão do `polynomial model` faz sentido, considerando os gráficos de dispersão de `price` e `package`! E, se este modelo for melhor do que o anterior, olhando para os mesmos dados, será necessário prever um orçamento para estas abóboras mais caras!\n", - "\n", - "🏆 Muito bem! Você criou dois modelos de regressão em uma única lição. Na seção final sobre regressão, aprenderá sobre regressão logística para determinar categorias.\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Teste várias variáveis diferentes neste notebook para ver como a correlação corresponde à precisão do modelo.\n", - "\n", - "## [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/14/)\n", - "\n", - "## **Revisão & Estudo Autônomo**\n", - "\n", - "Nesta lição aprendemos sobre Regressão Linear. Existem outros tipos importantes de Regressão. Leia sobre as técnicas Stepwise, Ridge, Lasso e Elasticnet. Um bom curso para aprender mais é o [curso de Aprendizagem Estatística de Stanford](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning).\n", - "\n", - "Se quiser aprender mais sobre como usar o incrível framework Tidymodels, consulte os seguintes recursos:\n", - "\n", - "- Website do Tidymodels: [Introdução ao Tidymodels](https://www.tidymodels.org/start/)\n", - "\n", - "- Max Kuhn e Julia Silge, [*Tidy Modeling with R*](https://www.tmwr.org/)*.*\n", - "\n", - "###### **AGRADECIMENTOS A:**\n", - "\n", - "[Allison Horst](https://twitter.com/allison_horst?lang=en) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n" - ], - "metadata": { - "id": "8zOLOWqMxzk5" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/2-Regression/3-Linear/solution/notebook.ipynb b/translations/pt/2-Regression/3-Linear/solution/notebook.ipynb deleted file mode 100644 index fdccd458f..000000000 --- a/translations/pt/2-Regression/3-Linear/solution/notebook.ipynb +++ /dev/null @@ -1,1111 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Regressão Linear e Polinomial para Preços de Abóboras - Aula 3\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n", - "\n", - "- Obtenha apenas abóboras com preços por alqueire\n", - "- Converta a data para um mês\n", - "- Calcule o preço como uma média entre os preços altos e baixos\n", - "- Converta o preço para refletir o valor por quantidade de alqueires\n" - ] - }, - { - "cell_type": "code", - "execution_count": 167, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
0BALTIMORENaN24 inch binsNaNNaNNaN4/29/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
1BALTIMORENaN24 inch binsNaNNaNNaN5/6/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
2BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
3BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
4BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN11/5/1690.0100.090.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade Date \\\n", - "0 BALTIMORE NaN 24 inch bins NaN NaN NaN 4/29/17 \n", - "1 BALTIMORE NaN 24 inch bins NaN NaN NaN 5/6/17 \n", - "2 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "3 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "4 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 11/5/16 \n", - "\n", - " Low Price High Price Mostly Low ... Unit of Sale Quality Condition \\\n", - "0 270.0 280.0 270.0 ... NaN NaN NaN \n", - "1 270.0 280.0 270.0 ... NaN NaN NaN \n", - "2 160.0 160.0 160.0 ... NaN NaN NaN \n", - "3 160.0 160.0 160.0 ... NaN NaN NaN \n", - "4 90.0 100.0 90.0 ... NaN NaN NaN \n", - "\n", - " Appearance Storage Crop Repack Trans Mode Unnamed: 24 Unnamed: 25 \n", - "0 NaN NaN NaN E NaN NaN NaN \n", - "1 NaN NaN NaN E NaN NaN NaN \n", - "2 NaN NaN NaN N NaN NaN NaN \n", - "3 NaN NaN NaN N NaN NaN NaN \n", - "4 NaN NaN NaN N NaN NaN NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 167, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "from datetime import datetime\n", - "\n", - "pumpkins = pd.read_csv('../../data/US-pumpkins.csv')\n", - "pumpkins.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 168, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
MonthDayOfYearVarietyCityPackageLow PriceHigh PricePrice
709267PIE TYPEBALTIMORE1 1/9 bushel cartons15.015.013.636364
719267PIE TYPEBALTIMORE1 1/9 bushel cartons18.018.016.363636
7210274PIE TYPEBALTIMORE1 1/9 bushel cartons18.018.016.363636
7310274PIE TYPEBALTIMORE1 1/9 bushel cartons17.017.015.454545
7410281PIE TYPEBALTIMORE1 1/9 bushel cartons15.015.013.636364
\n", - "
" - ], - "text/plain": [ - " Month DayOfYear Variety City Package Low Price \\\n", - "70 9 267 PIE TYPE BALTIMORE 1 1/9 bushel cartons 15.0 \n", - "71 9 267 PIE TYPE BALTIMORE 1 1/9 bushel cartons 18.0 \n", - "72 10 274 PIE TYPE BALTIMORE 1 1/9 bushel cartons 18.0 \n", - "73 10 274 PIE TYPE BALTIMORE 1 1/9 bushel cartons 17.0 \n", - "74 10 281 PIE TYPE BALTIMORE 1 1/9 bushel cartons 15.0 \n", - "\n", - " High Price Price \n", - "70 15.0 13.636364 \n", - "71 18.0 16.363636 \n", - "72 18.0 16.363636 \n", - "73 17.0 15.454545 \n", - "74 15.0 13.636364 " - ] - }, - "execution_count": 168, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pumpkins = pumpkins[pumpkins['Package'].str.contains('bushel', case=True, regex=True)]\n", - "\n", - "new_columns = ['Package', 'Variety', 'City Name', 'Month', 'Low Price', 'High Price', 'Date']\n", - "pumpkins = pumpkins.drop([c for c in pumpkins.columns if c not in new_columns], axis=1)\n", - "\n", - "price = (pumpkins['Low Price'] + pumpkins['High Price']) / 2\n", - "\n", - "month = pd.DatetimeIndex(pumpkins['Date']).month\n", - "day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days)\n", - "\n", - "new_pumpkins = pd.DataFrame(\n", - " {'Month': month, \n", - " 'DayOfYear' : day_of_year, \n", - " 'Variety': pumpkins['Variety'], \n", - " 'City': pumpkins['City Name'], \n", - " 'Package': pumpkins['Package'], \n", - " 'Low Price': pumpkins['Low Price'],\n", - " 'High Price': pumpkins['High Price'], \n", - " 'Price': price})\n", - "\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1 1/9'), 'Price'] = price/1.1\n", - "new_pumpkins.loc[new_pumpkins['Package'].str.contains('1/2'), 'Price'] = price*2\n", - "\n", - "new_pumpkins.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Um gráfico de dispersão lembra-nos que só temos dados mensais de agosto a dezembro. Provavelmente precisamos de mais dados para conseguir tirar conclusões de forma linear.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 169, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 169, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "new_pumpkins.plot.scatter('Month','Price')" - ] - }, - { - "cell_type": "code", - "execution_count": 170, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 170, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "new_pumpkins.plot.scatter('DayOfYear','Price')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 171, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "-0.14878293554077535\n", - "-0.16673322492745407\n" - ] - } - ], - "source": [ - "print(new_pumpkins['Month'].corr(new_pumpkins['Price']))\n", - "print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price']))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Parece que a correlação é bastante pequena, mas existe alguma outra relação mais importante - porque os pontos de preço no gráfico acima parecem ter vários clusters distintos. Vamos criar um gráfico que mostre diferentes variedades de abóbora:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 172, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "ax=None\n", - "colors = ['red','blue','green','yellow']\n", - "for i,var in enumerate(new_pumpkins['Variety'].unique()):\n", - " ax = new_pumpkins[new_pumpkins['Variety']==var].plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var)" - ] - }, - { - "cell_type": "code", - "execution_count": 173, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 173, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXAAAAGKCAYAAAAVEBpAAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjQuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8rg+JYAAAACXBIWXMAAAsTAAALEwEAmpwYAAAcxklEQVR4nO3df5h3dV3n8ecrwEBEARm4bhW8UxEDfwDekqztpiiFmiGGCW5GZhduLRVpJaX5a7e9bP25musurAiRgqaopGEiF+TiKnrzQ4SQIEMSEG615BbzB/DeP8538sswv+c7c85n5vm4rrnm/PjOzIvx/r488znnfE6qCklSe36s7wCSpOWxwCWpURa4JDXKApekRlngktSoHdfyh+211161efPmtfyRktS8yy677BtVNTVz+5oW+ObNm9m6deta/khJal6Sr862fcEhlCQ7J/l8ki8muSbJ60bbX5vk5iRXjj6eNenQkqS5LeYI/PvAEVX1nSQ7AZckOX+0761V9abViydJmsuCBV7drZrfGa3uNPrw9k1J6tmirkJJskOSK4HbgQuq6tLRrpOSXJXk9CR7rFZISdJ9LarAq+ruqjoYeBhwWJLHAu8CHgkcDNwKvHm2r01yYpKtSbZu27ZtIqElSUu8Dryq/gW4GDiqqm4bFfs9wGnAYXN8zalVtaWqtkxN3ecqGEnSMi3mKpSpJLuPlncBngF8OcmmsZcdA1y9KgklSbNazFUom4Azk+xAV/gfqKqPJTkrycF0JzRvBF66aiklSfexmKtQrgIOmWX7i1YlkSRpUdb0TkwN3+ZTPt53hAXd+IZn9x1BGgQns5KkRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1KjmH6nWwiPAwMeASZo8j8AlqVEWuCQ1asECT7Jzks8n+WKSa5K8brR9zyQXJLl+9HmP1Y8rSZq2mCPw7wNHVNUTgIOBo5I8GTgFuLCq9gcuHK1LktbIggVene+MVncafRRwNHDmaPuZwHNXI6AkaXaLGgNPskOSK4HbgQuq6lJgn6q6FWD0ee85vvbEJFuTbN22bduEYkuSFlXgVXV3VR0MPAw4LMljF/sDqurUqtpSVVumpqaWGVOSNNOSrkKpqn8BLgaOAm5Lsglg9Pn2SYeTJM1tMVehTCXZfbS8C/AM4MvAecAJo5edAHx0lTJKkmaxmDsxNwFnJtmBrvA/UFUfS/JZ4ANJXgLcBDx/FXNKkmZYsMCr6irgkFm2fxN4+mqEkiQtzDsxJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhq1YIEn2TfJRUmuTXJNkt8ZbX9tkpuTXDn6eNbqx5UkTdtxEa+5C3h5VV2eZDfgsiQXjPa9taretHrxJElzWbDAq+pW4NbR8vYk1wIPXe1gkqT5LWkMPMlm4BDg0tGmk5JcleT0JHvM8TUnJtmaZOu2bdtWllaS9G8WXeBJHgB8CDi5qu4A3gU8EjiY7gj9zbN9XVWdWlVbqmrL1NTUyhNLkoBFFniSnejK+71VdS5AVd1WVXdX1T3AacBhqxdTkjTTYq5CCfBu4NqqesvY9k1jLzsGuHry8SRJc1nMVShPAV4EfCnJlaNtfwQcn+RgoIAbgZeuQj5J0hwWcxXKJUBm2fXXk48jSVos78SUpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJatSCBZ5k3yQXJbk2yTVJfme0fc8kFyS5fvR5j9WPK0matpgj8LuAl1fVTwJPBv5zkgOBU4ALq2p/4MLRuiRpjSxY4FV1a1VdPlreDlwLPBQ4Gjhz9LIzgeeuUkZJ0iyWNAaeZDNwCHApsE9V3QpdyQN7TzydJGlOiy7wJA8APgScXFV3LOHrTkyyNcnWbdu2LSejJGkWiyrwJDvRlfd7q+rc0ebbkmwa7d8E3D7b11bVqVW1paq2TE1NTSKzJInFXYUS4N3AtVX1lrFd5wEnjJZPAD46+XiSpLnsuIjXPAV4EfClJFeOtv0R8AbgA0leAtwEPH9VEkqSZrVggVfVJUDm2P30ycaRJC2Wd2JKUqMscElqlAUuSY2ywCWpURa4JDXKApekRi3mOnBJy7D5lI/3HWFRbnzDs/uOoGXyCFySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjXIyK0lNcHKw+/IIXJIaZYFLUqMWLPAkpye5PcnVY9tem+TmJFeOPp61ujElSTMt5gj8DOCoWba/taoOHn389WRjSZIWsmCBV9WngW+tQRZJ0hKsZAz8pCRXjYZY9pjrRUlOTLI1ydZt27at4MdJksYtt8DfBTwSOBi4FXjzXC+sqlOraktVbZmamlrmj5MkzbSsAq+q26rq7qq6BzgNOGyysSRJC1lWgSfZNLZ6DHD1XK+VJK2OBe/ETHI28FRgryRfA14DPDXJwUABNwIvXb2IkqTZLFjgVXX8LJvfvQpZJElL4J2YktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY1asMCTnJ7k9iRXj23bM8kFSa4ffd5jdWNKkmZazBH4GcBRM7adAlxYVfsDF47WJUlraMECr6pPA9+asflo4MzR8pnAcycbS5K0kOWOge9TVbcCjD7vPdcLk5yYZGuSrdu2bVvmj5MkzbTqJzGr6tSq2lJVW6amplb7x0nShrHcAr8tySaA0efbJxdJkrQYyy3w84ATRssnAB+dTBxJ0mIt5jLCs4HPAgck+VqSlwBvAI5Mcj1w5GhdkrSGdlzoBVV1/By7nj7hLJKkJfBOTElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1ygKXpEZZ4JLUKAtckhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGLfhU+vkkuRHYDtwN3FVVWyYRSpK0sBUV+MjTquobE/g+kqQlcAhFkhq10gIv4JNJLkty4iQCSZIWZ6VDKE+pqluS7A1ckOTLVfXp8ReMiv1EgP3222+FP06SNG1FR+BVdcvo8+3Ah4HDZnnNqVW1paq2TE1NreTHSZLGLLvAk+yaZLfpZeBngasnFUySNL+VDKHsA3w4yfT3eV9VfWIiqSRJC1p2gVfVV4AnTDCLJGkJvIxQkhplgUtSoyxwSWqUBS5JjbLAJalRFrgkNcoCl6RGWeCS1CgLXJIaZYFLUqMscElqlAUuSY2ywCWpURa4JDXKApekRlngktQoC1ySGmWBS1KjLHBJapQFLkmNssAlqVEWuCQ1akUFnuSoJNcluSHJKZMKJUla2LILPMkOwDuBZwIHAscnOXBSwSRJ81vJEfhhwA1V9ZWq+gFwDnD0ZGJJkhaSqlreFybHAkdV1a+P1l8E/FRVnTTjdScCJ45WDwCuW37cNbMX8I2+Q6wj/j4nx9/lZLXy+3x4VU3N3LjjCr5hZtl2n/83qKpTgVNX8HPWXJKtVbWl7xzrhb/PyfF3OVmt/z5XMoTyNWDfsfWHAbesLI4kabFWUuBfAPZP8hNJ7gccB5w3mViSpIUsewilqu5KchLwN8AOwOlVdc3EkvWrqSGfBvj7nBx/l5PV9O9z2ScxJUn98k5MSWqUBS5JjbLAJalRG77Akzxwnn37rWUWaS5JHpzkmCRP7DtLi5J8YGz5T2fs++TaJ5qMDV/gwMXTC0kunLHvI2uapHHr9U3ShyQfS/LY0fIm4Grg14CzkpzcZ7ZG7T+2fOSMffe5w7EVFvi97yjdc559Wti6fJP05Ceq6urR8ouBC6rqOcBP0RW5lma+y+2avRRvJbfSrxc1x/Js65rfunyT9OSHY8tPB04DqKrtSe7pJ1LT7p/kELqD1l1Gyxl97NJrshWwwGHvJC+j+x9yepnRukeNS7Mu3yQ9+ackv0U3ZcWhwCcAkuwC7NRnsEZ9HXjLLMvT603a8DfyJHnNfPur6nVrlaV1SS6ab39VPW2tsrQuyd7A64FNwDur6pOj7U8DnlhVb+ozn4Zhwxf4fJKcXFVv6zuHNC7JjlV1V985WpJkf+CNwKOALwG/V1U395tq5TyJOb+XLfwSLSTJkUku6DtHS5JcMrZ81ozdn1/jOOvB6cDHgV8ELgfe0W+cybDA5+dVKEuQ5Igkf5/kO0n+IsmBSbYCbwDe1Xe+xuw6tnzQjH3+u1y63arqtKq6rqreCGzuO9AkeBJzfo4vLc2b6Z6+9Fm6Z6V+DvjjqvofvaZqk1f0TNbOYyfV4d4n2amqy3tLtgIbvsCTbGf2N0SA+69xnNZVVV08Wv5Ikm2W97LtnuQYur+Sd0/yvNH2AA/qL1azZrvyZHq9gCPWPNEEeBJTE5PkK8DvjW160/h6VZ275qEaleQ98+2vqhevVZb1IMkDq+qOvnNMmgU+iyS7As8FXlhVz+45TjMWKJ2qKu8gVC+S/APwyqo6p+8sk2SBj4weC/cs4IXAUcCHgHOr6q96DaYNaeyGsllV1Vvm2697S/Jw4G3AA4DfqKob+k00GY6BJ0cCxwM/B1wEnAUc5p+oSzdL6RTwDeCSqvrHHiK1bLe+A6wnVfVV4JgkRwGfSfIF4J6x/b/QW7gV2PAFTvdMz/8L/PR0ySTxxNvyzFY6m4FXJnntevvzdZV9s6r+rO8Q60mSA4A/oHu/v5OxAm/Vhh9CGV1KdBxwLPAV4Bzg1VX18F6DrSNJ9gQ+VVWH9p2lFUku9/c1OUneAPwC8PKqOr/vPJOy4W/kqaorquoVVfVI4LXAIcD9kpyf5MR+060PVfUtvPlE/doCHLqeyhss8Hs9aKCqPlNVJwEPpTvhcXhfudaTJEcA/9x3jsY8Pskds3xsT7LuLodbA3tW1ff6DjFpjoHPMmVsVd1DNzb+N2sfp11JvsR9b4raE7gF+JW1T9S0L1XVIX2H0LBZ4PCgsbvc7sObT5bkecAPxtaL7mTcnT3lkaY9Isl5c+30KpR2PQj4eWYfoy3AAl+893vibWL+su8A68w2url61hULHG7yDsGJ8UTl5Bw8vZDkT6vqFWPrn6yqn+0lVbu2V9Xf9h1i0ixwZ3abpKn57iD07sEledTY8pHAK8bWfdTf0t3Yd4DVYIHDt9brRDc92IHuVmWPxFeXBx1LVFVznudqmQUOnwQuS/Kaqnpf32Ead2tVvb7vEOuED4jWgjb8nZgASR5KNzfwXnRPjhmfI8GTmIuU5IrZLn1Lsi9w3OhJKFqEJBczz5G2D4gWeAQOQFXdnOTjwJ8Az+FHBe5VKEvz9OmFJHsBz6ebKOxh+Htckqp6at8Z1pMkv1xVfzFafkpVfWZs30mtzjuz4Y/AkxxEd9R9C/C7VXVrz5GalWQ34Bi6KXkfDXwYeEFVPazXYA2a794E8C/DpRqfW2bmPDMtzzvjETh8EDi5qu5z12WSXb0JZUlup3ti+qvoppCt0WPBtHTPmWeffxkuXeZYnm29GRZ4d73tXkm2AFdV1Q+S7A2cDPwq8JD+ojXnj+hmdnwX8L4k7+85T7Ocj37iao7l2dabseEnswL+E3Al8A7gc0lOAK6lO9P/xB5zNaeq3lpVP0U3bWeAjwAPSfKKJI/uNVyDkuwwOpcwvX6/JCcmubbPXI16TJKrRvP1TC9Prx/Qd7jlcgw8+Tu6hzl8K8l+wA3Af6iqz/UcbV1I8ji6MfFfGk3Zq0VIchzwv4E7gevppjo+C/gC8F+q6vL+0rVn9Ei1OY2e2NMcC/y+JzSurqrH9plJSnI18NyquiHJocBn6S7F/HDP0TQgFnhyO91TeKYdN75eVb+95qEalWQ7s48nhu6p9A9c40jNmuXA4stV9Zg+M7Vs7N/m9AnL6X+nTf/b9CQm/P6M9ct6SbEOVJUP4p2cvWfMK/OA8XXnlVma9fpvc8MfgUtDlOQ18+wupyxYmiQ7012w8CjgKuD0qrqr31Qrt+ELPMlfMf8ty01O9N6HWf5MZbS+I3C/qvIvvglI8qSq+kLfOVoyuqT1h3RPpH8m8NWq+p1+U62cbyh4U98B1ouZf6aO7sz8TeCldHdlapmSHEh3fuZ44Nt0D+nV4h1YVY8DSPJuuhvOmrfhC3yuSd6nJ2AC1t0k8Kstye50N0L9CvA+4ElV9c0+M7VodOnb8aOPu4CHA1uq6sY+czXqh9MLVXVX0uzNl/ey4Qt83IwJmB6KR41LMvr9vRx4AXA6cEhVfbvfVG1K8v/oHvd3DnBsVV2f5B8t72V7QpLpOf9DN0XvHXgVStvmmIDpEU7AtCxfpXv24HuA7wIvGT/S8cqJJdlGN4vjPnRP4Lmehm/57ltV7dB3htWw4QscJ2CapDfyo5JZl5dtrZWqOjrJg4BfBF6X5FHA7kkOq6p1MX6rlfMqlOR36ca6d6Ubr30/cEFVPaLXYNrQkuxUVT8cW9+bbmjqeGDfqtq3t3AajA1f4NOSPILuzXEcsD/wGuDDVfX3vQZrSJK3z7ffu1oXb3SH8EeBs4GLauyNmuThrc7docna8AWeZL+qumnGtsfRlfkLnIBp8UYzOc6pqs5cqyytS/Jg4Fh+dEDxQeDsqrq012AaFAv83k/q+FBV/WLfmaRxSR5Cd3XUccDewDlV9cp+U2kILPCxB/HO9VBeLU6S8+bb712ty5fkAcDzgJcBm6pqn54jaQC8CmX+J3VoaQ4H/olu3PZSGn5U1RCM5u94Dt1w3lOATwB/CHyyz1waDo/Ak7vpJs0P3VN4vju9i4Yv8O9Dkh2AI+kK5/HAx+nGba/pNViDkrwPeAbwabqbeT5WVd/rN5WGZsMXuFZHkh+nK/I3Aq+vqnf0HKkpoxPC51bV9r6zaLgscE3UqLifTVfem4Hz6KbuvLnPXNJ6ZIFrYpKcCTwWOJ/uSomre44krWsWuCYmyT105xPg3ieEPZ8grQILXBqgJM+bb39VnbtWWTRcFrg0QKO/Zq4cfcCMpxxV1a+tdSYNjwUuDdBoRswX0D3D8aN0l2Pe0G8qDY0FLg1Ykl2Bo+nK/MHAK+d6ipQ2nh/rO4CkeX2P7hmYd9BNebxzv3E0JB6BSwOU5Gl019IfBnyK7rLMrf2m0tBY4NIAjU5iXgVcQndJ5r3eqM6tLnAyK2moXtx3AA2fR+DSwI2mkq2qunPBF2tD8SSmNFBJfiPJTcBXgZuSfDXJb/adS8NhgUsDlORVdHOBP7WqHlxVDwaeBjxztE9yCEUaoiTXAU+YOQd4kl2AL1bVo/tJpiHxCFwaqNke4FBV/wrc00McDZAFLg3T15I8febGJEcAt/aQRwPkEIo0QEkOopsD5RLgMrrrwJ9E92zMo31MncAClwZr9FDjFwIH0c1GeA3wXp+NqWneyCMNVFV9L8lFwO10R+DXWt4a5xG4NEBJHgj8H+CJdHOC/xjwBLrhlJdU1R39pdNQWODSACU5A7gReH1V3TPaFuCPgUdV1a/0l05DYYFLA5Tk+qraf6n7tLF4GaE0TFn4JdroLHBpmD6T5NWjYZN/k+SPgc/1lEkD4xCKNECjk5jvBg6lO4lZwCHAFXQnMb/dXzoNhQUuDViSRwIHMroOvKr+IcnJVfW2fpNpCCxwqTFJbqqq/frOof45Bi61xxOcAixwqUX+2SzAW+mlQUqyndmLOsAuaxxHA+UYuCQ1yiEUqSFJdk/yyr5zaBgscGmAkuyb5NQkH0vy60nun+TNwPXA3n3n0zA4Bi4N058Dfwt8CDiK7u7La4DHVdXX+wym4XAMXBqgJF+sqieMrd8G7FdV3+8xlgbGI3BpoJLswY+u+f46cP8kuwJU1bd6C6bB8AhcGqAkN9I9fX62m3aqqh6xtok0RBa4JDXKIRRpgJIcOt/+qrp8rbJouDwClwZo9DDjuVRVHbFmYTRYFrgkNcobeaQBSvIHY8vPn7Hvv619Ig2RBS4N03Fjy384Y99RaxlEw2WBS8OUOZZnW9cGZYFLw1RzLM+2rg3Kk5jSACW5G7iTH83//d3pXcDOVbVTX9k0HBa4JDXKG3mkAUqy53z7nQtF4BG4NEhJ/pFurDvAJuAWfnTy0rlQBFjg0uAluaKqDuk7h4bHq1Ck4fMoS7OywCWpUZ7ElAYoycvGVveesU5VvWWNI2mALHBpmHYbWz5txroEeBJTkprlGLgkNcoCl6RGWeCS1ChPYkoDleQA4ETgMaNN1wKnVdV1/aXSkHgELg1QksOBi4HtwKl0V6LcCVyU5Mk9RtOAeBWKNEBJzgf+tKounrH9Z4BTquqZvQTToFjg0gAl+fuqevQc+66rqgPWOpOGxyEUaZi2z7PvzjVLoUHzJKY0TPsmefss2wM8dK3DaJgscGmYfn+efVvXLIUGzTFwqTFJdqyqu/rOof45Bi4NUJJLxpbPmrH782scRwNlgUvDtOvY8kEz9gUJC1waqvnGNh33FOBJTGmodk9yDN1B1u5JnjfaHuBB/cXSkHgSUxqgJGcwz5F2Vb147dJoqCxwSWqUY+DSACV5R5L7PEYtyWOSfKqPTBoeC1wapq8DVyZ5IUCS+yf578B5wDt7TabBcAhFGqgkPwH8Gd0DjR8CfAD4r1X13V6DaTA8ApeGa/roake69+q1lrfGWeDSACV5FfAp4M+r6t8B/x44OsnfJjmw33QaCq8Dl4ZpCjikqrYDVNXNwLFJngl8CPjJPsNpGBwDlxqT5Mer6vt951D/PAKXBmiOucDH/faaBNGgWeDSMF3WdwANn0MoktQoj8ClAUpy3nz7q+oX1iqLhssCl4bpcOCfgLOBS3EOcM3CIRRpgJLsABwJHA88Hvg4cHZVXdNrMA2KN/JIA1RVd1fVJ6rqBODJwA3AxUl+q+doGhCHUKSBSvLjwLPpjsI3A28Hzu0zk4bFIRRpgJKcCTwWOB84p6qu7jmSBsgClwYoyT3AnaPV8TdpgKqqB659Kg2NBS5JjfIkpiQ1ygKXpEZZ4JLUKAtczUtycZKfm7Ht5CT/c5Ff//okz1jgNb+a5CErySlNmgWu9eBs4LgZ244bbZ9Xkh2q6tVVtdCT3n+V7rmU0mBY4FoPPgj8/OjGF5JspivbFybZmuSaJK+bfnGSG5O8OsklwPOTnJHk2NG+J44eW3ZZkr9Jsmm0bwvw3iRXJnl2kg+Pfb8jk3iDjdacBa7mVdU3gc8DR402HQe8H3hlVW2hm0vkZ5I8fuzLvldVP11V50xvSLIT8A7g2Kp6InA68CdV9UFgK/Afq+pg4K+Bn0wyNfrSFwPvWbX/QGkOFrjWi/FhlOnhk19KcjlwBXAQMP4w4PfP8j0OoLv78YIkVwKvAh4280XV3TxxFvDLSXanmznw/In8V0hL4FwoWi8+ArwlyaHALsA/A78HPKmq/jnJGcDOY6+/8z7fobvL8ZqqOnwRP+89wF8B3wP+sqruWkF2aVk8Ate6UFXfAS6mG/Y4G3ggXUl/O8k+wDMX8W2uA6aSHA7dkEqSg0b7tgO7jf28W4Bb6I7Sz5jMf4W0NB6Baz05m262vuOq6stJrgCuAb4CfGahL66qH4xOWL49yYPo3h9vG32PM4D/leRfgcOr6l+B9wJTVfV3q/EfIy3EuVCkZUryZ8AVVfXuvrNoY7LApWVIchndEM2RVfX9vvNoY7LAJalRnsSUpEZZ4JLUKAtckhplgUtSoyxwSWrU/wdO32Yxjk19aAAAAABJRU5ErkJggg==", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 174, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "-0.2669192282197318\n" - ] - }, - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 174, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX4AAAEGCAYAAABiq/5QAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjQuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8rg+JYAAAACXBIWXMAAAsTAAALEwEAmpwYAAAcL0lEQVR4nO3df5RcZZ3n8fenSduJJJDQCTEnPwxOhFkWYpSWhYkogsPiHA5wNuiZOSK4OpOVHT3i6iaic3D1zHpMMqszLu4ZGWUJLMMsQxAcZjiQBZTBJUCTyQ9+KdlBSCKE0CRDtyZth/7uH3U7qW6qOl3Vdavurft5ndMnVU9Vfe/zVFe+dfu5z/1eRQRmZlYcHa3ugJmZNZcTv5lZwTjxm5kVjBO/mVnBOPGbmRXMlFZ3YCJmz54dixcvbnU3zMxy5Yknnng1IuaMbc9F4l+8eDG9vb2t7oaZWa5IeqFSu6d6zMwKxonfzKxgnPjNzArGid/MrGCc+M3MCia1xC9poaQHJT0j6SlJn0va10l6VtI2ST+UNDOtPtjk9A0MsnXnfvoGBjMZz8zqk+ZyzkPAFyJis6QZwBOSNgIbgWsi4pCkNcA1wOoU+2F1uGvLblZv2EZnRwdDw8OsXbGUi5fNz0w8M6tfanv8EfFSRGxObvcDzwDzI+K+iDiUPG0TsCCtPlh9+gYGWb1hGweHhukfPMTBoWFWbdhW9556o+OZ2eQ0ZY5f0mLg3cCjYx76JHBPldeslNQrqXfv3r0p99DK7dp3gM6O0R+Nzo4Odu07kIl4ZjY5qSd+SdOBDcDVEfF6WftXKE0H3VLpdRFxfUT0RETPnDlvOuPYUrRg1jSGhodHtQ0ND7Ng1rRMxDOzyUk18UvqpJT0b4mIO8rarwQuAj4WvgRY5nRP72LtiqVM7exgRtcUpnZ2sHbFUrqnd2UinplNjtLKu5IErAdei4iry9ovBL4FfCAiJjSH09PTE67V03x9A4Ps2neABbOmNSRJNzqemY1P0hMR0TO2Pc1VPcuBjwPbJW1J2r4MfAfoAjaWvhvYFBGfTrEfVqfu6V0NTdCNjmdm9Ukt8UfEw4AqPPQPaW3TzMyOzmfumpkVjBO/mVnBOPGbmRWME7+ZWcE48ZuZFYwTv5lZwTjxm5kVjBO/mVnBOPGbmRWME7+ZWcE48ZuZFYwTv5lZwTjxm5kVjBO/mVnBOPGbmRWME7+ZWcE48ZuZFYwTv5lZwTjxm5kVjBO/tZW+gUG27txP38Cg4zle7uOlJbWLrZs1211bdrN6wzY6OzoYGh5m7YqlXLxsvuM5Xi7jpcl7/NYW+gYGWb1hGweHhukfPMTBoWFWbdhW956X4zleK+OlzYnf2sKufQfo7Bj9ce7s6GDXvgOO53i5i5c2J35rCwtmTWNoeHhU29DwMAtmTXM8x8tdvLQ58Vtb6J7exdoVS5na2cGMrilM7exg7YqldE/vcjzHy128tCkiWt2Ho+rp6Yne3t5Wd8NyoG9gkF37DrBg1rSG/KdzPMdrZbzJkvRERPS8qd2J38ysPVVL/KlN9UhaKOlBSc9IekrS55L2EyRtlPRc8u+stPqQdVlfQ5yXNclmVps01/EfAr4QEZslzQCekLQR+ARwf0R8U9KXgC8Bq1PsRyZlfQ1xntYkm1ltUtvjj4iXImJzcrsfeAaYD1wCrE+eth64NK0+ZFXW1xDnbU2ymdWmKat6JC0G3g08CsyNiJeg9OUAnFjlNSsl9Urq3bt3bzO62TRZX0OctzXJZlab1BO/pOnABuDqiHh9oq+LiOsjoicieubMmZNeB1sg62uI87Ym2cxqk2ril9RJKenfEhF3JM17JM1LHp8HvJJmH7Io62uI87Ym2cxqk9pyTkmiNIf/WkRcXda+DugrO7h7QkSsGi9Wuy7nzPoa4qytSTaz2lRbzpnmqp7lwMeB7ZK2JG1fBr4J3CbpU8CLwEdS7EOmdU/vamhCzXo8M8uG1BJ/RDwMqMrD56e1XTMzG59r9ZiZFYwTv5lZwTjxm5kVjBO/mVnBOPGbmRWME7+ZWcE48ZuZFYwTv5lZwTjxm5kVjBN/C2X9ilnV4tW7nUqvy+t74HiWZ2nW6rFxZP2KWdXi1budSq8LyOV74HiWd77Yegv0DQyyfM0DHBw6UvN+amcHP119Xl1F0ZoV7+7PvI+Lrnu45u1Uitc1pQMIBg8d+fzl4T1wPMuTpl9s3arL+hWzqsXbsnN/XdupFO+YDnGM8vceOJ61A0/1tEDWr5hVLd6yhTPr2k6leG8MBzD6r808vAeOZ+3Ae/wtkPUrZlWLt2TujLq2UyneusuWsu6yd+XuPXA8awee42+hrF8xq1q8erdT6XV5fQ8cz/Kg2hy/E7+ZWZvywV0zMwOc+M3MCseJ38ysYJz4zcwKxonfzKxgnPjNzAqmrRN/1isXOp6ZtULblmzIeuVCx3PlR7NWacs9/r6BQVZv2MbBoWH6Bw9xcGiYVRu21b2n6XjZimdmk5Na4pd0g6RXJD1Z1rZM0iZJWyT1SjozjW1nvXKh47nyo1krpbnHfyNw4Zi2tcDXImIZcG1yv+GyXrnQ8Vz50ayVUkv8EfEQ8NrYZuC45PbxwC/T2HbWKxc6nis/mrVSqkXaJC0G7o6I05L7/wq4FxClL53fiYgXjhan3iJtWa9c6HhmlqaWVOeskPi/A/wkIjZI+iiwMiI+VOW1K4GVAIsWLTrjhReO+v1gZmZlslKd80rgjuT23wJVD+5GxPUR0RMRPXPmzGlK58zMiqDZif+XwAeS2+cBzzV5+2ZmhZfaCVySbgXOBWZL2gV8Ffgj4C8kTQEOkkzlmJlZ86SW+CPiD6o8dEZa2zQzs6NryzN3zcysOid+M7OCceI3MysYJ34zs4Jp68RftPrvWa+fX7Tfh1lWuR5/m8h6/fyi/T7Msqwt9/iLVv896/Xzi/b7MMu6tkz8Rav/nvX6+UX7fZhlXVsm/qLVf896/fyi/T7Msq4tE3/R6r9nvX5+nn8fWT/AXbR41hiplmVulKzU48+6rNfPz9vvI+sHuIsWz2rXknr8jVJv4jerV9/AIMvXPMDBoSNTVFM7O/jp6vPq+tJyvMnFs/pkpR6/WS5k/QB30eJZY00o8Us6WdL9kp5M7i+V9Cfpds2sdbJ+gLto8ayxJrrH/1fANcAQQERsA34/rU6ZtVrWD3AXLZ411oTm+CU9HhHvlfRPEfHupG1LRCxLu4PgOX5rnawf4C5aPKtNtTn+iZZseFXSbwGRBLsMeKmB/TPLpO7pXQ1NWI5nWTDRxP/HwPXAb0vaDTwPXJ5ar8zMLDUTSvwR8c/AhyQdC3RERH+63TIzs7RMdFXPNyTNjIhfRUS/pFmS/jTtzpmZWeNNdFXPhyNi/8idiNgH/F4qPTIzs1RNNPEfI+nwERpJ04DCHbHJeh2T3uf7+NZ9P6P3+b6GxNuxp5/be3eyY8/omb16+13pdVl/T83a0UQP7v4v4H5J/5PSyp5PAutT61UGZb2OyeXf38TDO0oJ/zsP7OCcJd3c/Idn1R3v2ju3c9OmFw/fv+LsRXz9ktPr7nel1wVk+j01a1cTrtUj6cPA+YCA+yLi3jQ7Vq7V6/izXsek9/k+Lvvepje13/4fzqLnpO6a4+3Y08+Hvv1QxXiX3/BYzf2uNN6uKR1AMHjoyOcvS++pWTuYdK2eiLgnIr4YEV9oZtLPgqzXMXnouVdraj+aLTv3V41XT78rjfeYDnGMsvuemrWzcRO/pIeTf/slvV720y/p9eZ0sfWyXsfk/e+cXVP70SxbOLNqvHr6XWm8bwwHb0R239MRPgZh7WjcxB8R70v+nRERx5X9zIiI45rTxdbLeh2TnpO6OWfJ6Cmdc5Z01zXNA7Bk7gyuOHvRqLYrzl5Ez0nddfW70njXXbaUdZe9q6Hv6UfPWDCq7aM9CyY1zXPXlt0sX/MAl3//UZaveYAfbdldd6w04pnV66hz/JI6gG0RcVpNgaUbgIuAV8pfK+mzwGeAQ8DfR8Sqo8Vq9Rz/iKzXMel9vo+HnnuV979zdt1Jv9yOPf1s2bmfZQtnsmTujMPt9fa70usa9R5k/TiMj0FYK9RdqycihiVtlbQoIl482vPL3AhcB9xU1okPApcASyNiUNKJNcRruazXMek5qf69/EqWzJ0xKuGPqLfflV7XqPdgZI7/IEcS68gcfz3xsx7PbDImupxzHvCUpMeAX400RsTF1V4QEQ9JWjym+SrgmxExmDznldq6a81UbW+8kX+pNOqvlKwfh3F9esuSiSb+rzVoeycD50j6r8BB4IsR8XilJ0paCawEWLRoUaWnWIqqrYlv5Fr5Rp570D29i0UnTOPnew7vl/D2E+r/Ykoj3toVS1k15r3z3r61wriJX9JU4NPAEmA78IOIODTJ7c0CzgLeC9wm6R1R4UBDRFxPqSIoPT092b8wcBvpGxhk9YZtHBwaPjw1sWrDNk6dd1zF9uVLZtecwHqf7zuc9Ef8444+ep/vq2vPv/f5vlFJGuBne36VmXgAFy+bz/Ils12f3lruaOv41wM9lJL+h4H/Nsnt7QLuiJLHgGGgvjWHlppqa+K37NzfsLXyjT73IOvxRnRP7+JdC2c66VtLHS3xnxoRl0fE94DLgHMmub07gfOgdB1f4C3A5P4nWcNVm49etnBmw+apG33uQdbjmWXJ0RL/0MiNWqd4JN0KPAKcImmXpE8BNwDvSC7a/jfAlZWmeay1qp1nsGTujIadf9Docw+yHs8sS8Zdxy/pDY6s4hEwDfh1cjuadRJXVtbxF02eVvXkJZ5ZM1Vbxz/hIm2t5MRvZla7SRdpMxvRyLr/1Wr+t2u8Ozfv5A/XP86dm3dmMt79T7/M6tu3cv/TLzckXqOvEdGsa060a7wR3uO3mpSvvQcmtfa+Ws3/emU93lnf2MjLr//m8P15x72FR778u5mJd8G3fzxqCespc4/l3s+fW3e8Rn5W0oiX9c9LI+J5j98mbby197Xasad/1Ica4KZHXqx7zybr8e7cvHNUkgZ46fXf1L2n3uh49z/9csXzFurd82/kZyWNeFn/vDQ63lhO/DZhjVzbXq3mf7X2vMe7e3vlBFqtvdnx7nt6T03tR5P18yqy/nlpdLyxnPhtwhq5tr1azf9q7XmPd9Hpb6upvdnxLjh1bk3tR5P18yqy/nlpdLyxnPhtwhq5tr1azf9K1UDbId6l71nIvOPeMqpt3nFv4dL3LMxEvPNPfRunzD12VNspc4/l/FPr+yLJ+nkVWf+8NDreWD64azVr5Nr2ajX/2zXenZt3cvf2l7no9LfVnaTTjHf/0y9z39N7uODUuXUn/XJZP68i65+XycbzOn4zs4Lxqh6zNuRr+Fo9JlqP38wyppHXRrBi8R6/WQ6VXzOhf/AQB4eGWbVhm/f8bUKc+M1yqNo1E+q5NoIVjxO/WQ75Gr42GU78ZjlU7ZoJvrKXTYQP7prllK/ha/Vy4jfLse7pXU74VjNP9VhVeaktbma18R6/VZTF2uJm1hje47c3yVttcTOrjRO/vUneaoubWW2c+O1N8lZb3Mxq48Rvb5K32uJmVhuXZbaqslZb3MxqU60ss1f1WFVL5s5oaIJudDwzq4+neqxmjVyPn/VzBRzP8VoZL63rLXiP32rSyPX4WT9XwPEcr5Xx0rzeQmp7/JJukPSKpCcrPPZFSSFpdlrbt8Zr5Hr8rJ8r4HiO18p4aV9vIc2pnhuBC8c2SloI/C7w4tjHLNsauR4/6+cKOJ7jtTJe2tdbSC3xR8RDwGsVHvo2sArI/nIiG6WR6/Gzfq6A4zleK+Olfb2Fph7clXQxsDsitk7guSsl9Urq3bt3bxN6Z0fTyPX4WT9XwPEcr5Xx0r7eQqrr+CUtBu6OiNMkvRV4ELggIv5F0i+Anoh49WhxvI4/Wxq5Hj/r5wo4nuO1Ml7fwOCkrrdQbR1/MxP/6cD9wK+ThxcAvwTOjIiXx4vjxG9mVrtqib9pUz0RsT0iToyIxRGxGNgFvOdoSd+yp961xWmtSU5zG0WLZ8WQ2jp+SbcC5wKzJe0CvhoRP0hre9Yc9a4tTnNNclrbKFo8Kw7X6rEJ6xsYZPmaBzg4dGS1wdTODn66+rxx5x/rfV0z+uZ41s5aPtVj+Vfv2uK01ySnsY2ixbNiceK3Cat3bXHaa5LT2EbR4o3I+jGIrMfLCyd+m7B61xanvSY5jW0ULR6UjhksX/MAl3//UZaveYAfbdldd6wixssTz/FbzepdWzzZNcmt2EZR4mX9GETW42WV6/Fbw3RP76rrP0e9r2vlNooSb+SYwUGOJMKRYwb1xC9avLzxVI+ZZf4YRNbj5Y0Tv5ll/hhE1uPljef4zeywrB6DyEu8rPEcv5kdVVaPQeQlXl54qsfMrGCc+M3MCsaJ38ysYJz4zcwKxonfzKxgnPjNzArGid/MrGCc+M3MCsaJ38ysYJz4zcwKxonfzKxgnPjNzArGid/MrGCc+M3MCsaJ38ysYJz4zcwKxonfzKxgUkv8km6Q9IqkJ8va1kl6VtI2ST+UNDOt7ZuZWWVp7vHfCFw4pm0jcFpELAV+DlyT4vbNzKyC1BJ/RDwEvDam7b6IOJTc3QQsSGv7ZmZWWSvn+D8J3FPtQUkrJfVK6t27d28Tu2Vm1t5akvglfQU4BNxS7TkRcX1E9EREz5w5c5rXObMyfQODbN25n76BwVZ3xaxhpjR7g5KuBC4Czo+IaPb2zSbqri27Wb1hG50dHQwND7N2xVIuXja/1d0ym7Sm7vFLuhBYDVwcEb9u5rbNatE3MMjqDds4ODRM/+AhDg4Ns2rDNu/5W1tIcznnrcAjwCmSdkn6FHAdMAPYKGmLpL9Ma/tmk7Fr3wE6O0b/9+js6GDXvgMt6pFZ46Q21RMRf1Ch+Qdpbc+skRbMmsbQ8PCotqHhYRbMmtaiHpk1js/cNauge3oXa1csZWpnBzO6pjC1s4O1K5bSPb2r1V0zm7SmH9w1y4uLl81n+ZLZ7Np3gAWzpjnpW9tw4jcbR/f0Lid8azue6jEzKxgnfjOzgnHiNzMrGCd+M7OCceI3MysYJ34zs4Jx4jczKxgnfjOzgnHiN2uiHXv6ub13Jzv29Gcynq8/UAw+c9esSa69czs3bXrx8P0rzl7E1y85PTPxfP2B4vAev1kT7NjTPypJA9z0yIt176k3Op6vP1AsTvxmTbBl5/6a2psdz9cfKBYnfrMmWLZwZk3tzY7n6w8UixO/WRMsmTuDK85eNKrtirMXsWTujEzE8/UHikV5uN55T09P9Pb2trobZpO2Y08/W3buZ9nCmXUn6TTj9Q0M+voDbUTSExHRM7bdq3rMmmjJ3BkNSdBpxfP1B4rBUz1mZgXjxG9mVjBO/GZmBePEb2ZWME78ZmYFk4vlnJL2Ai+kuInZwKspxs+Cdh9ju48PPMZ20cwxvj0i5oxtzEXiT5uk3kprXdtJu4+x3ccHHmO7yMIYPdVjZlYwTvxmZgXjxF9yfas70ATtPsZ2Hx94jO2i5WP0HL+ZWcF4j9/MrGCc+M3MCqbtE7+khZIelPSMpKckfW7M41+UFJJml7VdI2mHpJ9J+rfN73VtxhujpM8m43hK0tqy9rYYo6RlkjZJ2iKpV9KZZa/J2xinSnpM0tZkjF9L2k+QtFHSc8m/s8pek5sxjjO+dZKelbRN0g8lzSx7TW7GB9XHWPZ4NvJNRLT1DzAPeE9yewbwc+DU5P5C4F5KJ4fNTtpOBbYCXcBJwP8Djmn1OOoZI/BB4P8AXcljJ7bhGO8DPpy0/x7w4xyPUcD05HYn8ChwFrAW+FLS/iVgTR7HOM74LgCmJO1r8jq+8caY3M9Mvmn7Pf6IeCkiNie3+4FngPnJw98GVgHlR7gvAf4mIgYj4nlgB3AmGTbOGK8CvhkRg8ljryQvaacxBnBc8rTjgV8mt/M4xoiIgeRuZ/ITlMayPmlfD1ya3M7VGKuNLyLui4hDSfsmYEFyO1fjg3F/h5ChfNP2ib+cpMXAu4FHJV0M7I6IrWOeNh/YWXZ/F0e+KDKvfIzAycA5kh6V9BNJ702e1k5jvBpYJ2kn8GfANcnTcjlGScdI2gK8AmyMiEeBuRHxEpS+AIETk6fnboxVxlfuk8A9ye3cjQ8qjzFr+aYwiV/SdGADpURxCPgKcG2lp1Zoy8Wa1/IxRsTrlK6wNovSn9P/GbhNkmivMV4FfD4iFgKfB34w8tQKL8/8GCPijYhYRmmv90xJp43z9NyNcbzxSfoKpf+bt4w0VQqReicnqcIYl5KxfFOIxC+pk1KyuCUi7gB+i9J82lZJv6D0C9os6W2UvnEXlr18AUemDzKrwhihNJY7kj8/HwOGKRWIaqcxXgmM3P5bjvyZnMsxjoiI/cCPgQuBPZLmAST/jkzZ5XaMY8aHpCuBi4CPRTL5TY7HB6PGeAlZyzetPBDSjB9K36g3AX8+znN+wZGDLf+a0Qdb/pl8HFB60xiBTwNfT26fTOlPSrXZGJ8Bzk1unw88kePf4xxgZnJ7GvCPlJLhOkYf3F2bxzGOM74LgaeBOWOen6vxjTfGMc9peb4pwsXWlwMfB7Yn824AX46If6j05Ih4StJtlD6Ih4A/jog3mtLT+lUcI3ADcIOkJ4HfAFdG6dPWTmP8I+AvJE0BDgIrIbe/x3nAeknHUPpr/LaIuFvSI5Sm6T4FvAh8BHI5xmrj20Ep8W0szUSyKSI+ncPxQZUxVntyq8bokg1mZgVTiDl+MzM7wonfzKxgnPjNzArGid/MrGCc+M3MCsaJ39qWpDeSqp1PJdUS/5Okuj/zkt6XVF58NvlZWfbYnKQ0xj+pVEX0qrLH/k1SebIIy6ctB/xBtHZ2IEqnziPpROCvKRVy+2qtgZKzLP8auDQiNidlde+VtDsi/p7SyWPPRsSVkuYCj0i6HegDrgP+YxwpRFbrtkVp6fVwPa83G8vr+K1tSRqIiOll998BPE6pbMXbgZuBY5OHPxMR/1fSzcDtEXFX8ppbgP8NvJdS8cVry+KdD/wX4LPAjyidqbkbOBv498lrHgfOoHRi2TeBcymdrPTdiPheUnvoLko1lTqBP4mIu5JCdPcADybxLo2IFxr5/lhxOfFb2xqb+JO2fcBvA/3AcEQclPRO4NaI6JH0AUpF3y6VdDywBXgncBuwfuQLIYl1PPB8RJwg6RNAT0R8JnmsA3iEUiXNHmAFpesh/KmkLuCnlM7A3Qm8NSJeT/6K2JRs7+2UTt//nYjYlMobZIXlqR4rmpFqiJ3AdZKWAW9QqmVERPxE0neTqaF/B2yIiEPJdEulvaSKe04RMSzpe5S+DPokXQAslXRZ8pTjKSX4XcA3JL2fUhG9+cDc5DkvOOlbGpz4rTCSqZ43KFW3/CqwB3gXpUUOB8ueejPwMeD3KdWHB3iK0p77j8qedwalGivVDCc/UPrC+WxE3DumT5+gVNjrjIgYSqo3Tk0e/tXER2c2cV7VY4UgaQ7wl8B1SaG644GXkgOmHweOKXv6jZSu20BEPJW0fRf4RPIXApK6KV0mcC0Tcy9wVVJaGkknSzo26ccrSdL/IKUpHrNUeY/f2tm0pJJnJ6XKhzcD30oe+x/ABkkfoXQA9fDedUTskfQMcGdZ20uSLgf+StIMSnvwfx4RfzfBvnwfWEypDruAvZQuoXgL8HeSeikdT3i2noGa1cIHd83GkPRWYDuli7v/S6v7Y9ZonuoxKyPpQ5T2uv+7k761K+/xm5kVjPf4zcwKxonfzKxgnPjNzArGid/MrGCc+M3MCub/A2eoKqxqO9IQAAAAAElFTkSuQmCC", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE']\n", - "print(pie_pumpkins['DayOfYear'].corr(pie_pumpkins['Price']))\n", - "pie_pumpkins.plot.scatter('DayOfYear','Price')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Linear\n", - "\n", - "Vamos usar o Scikit Learn para treinar um modelo de regressão linear:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 175, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.linear_model import LinearRegression\n", - "from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error\n", - "from sklearn.model_selection import train_test_split" - ] - }, - { - "cell_type": "code", - "execution_count": 176, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.77 (17.2%)\n" - ] - } - ], - "source": [ - "X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1)\n", - "y = pie_pumpkins['Price']\n", - "\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n", - "lin_reg = LinearRegression()\n", - "lin_reg.fit(X_train,y_train)\n", - "\n", - "pred = lin_reg.predict(X_test)\n", - "\n", - "mse = np.sqrt(mean_squared_error(y_test,pred))\n", - "print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 177, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "[]" - ] - }, - "execution_count": 177, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.scatter(X_test,y_test)\n", - "plt.plot(X_test,pred)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "A inclinação da linha pode ser determinada a partir dos coeficientes de regressão linear:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 178, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "(array([-0.01751876]), 21.133734359909326)" - ] - }, - "execution_count": 178, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "lin_reg.coef_, lin_reg.intercept_" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 179, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array([16.64893156])" - ] - }, - "execution_count": 179, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Pumpkin price on programmer's day\n", - "\n", - "lin_reg.predict([[256]])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Polinomial\n", - "\n", - "Por vezes, a relação entre as características e os resultados é intrinsecamente não linear. Por exemplo, os preços das abóboras podem ser altos no inverno (meses=1,2), depois cair no verão (meses=5-7) e voltar a subir novamente. A regressão linear não consegue captar esta relação com precisão.\n", - "\n", - "Neste caso, podemos considerar adicionar características adicionais. Uma forma simples é usar polinómios das características de entrada, o que resultaria numa **regressão polinomial**. No Scikit Learn, podemos pré-computar automaticamente características polinomiais utilizando pipelines:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 180, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.73 (17.0%)\n", - "Model determination: 0.07639977655280217\n" - ] - }, - { - "data": { - "text/plain": [ - "[]" - ] - }, - "execution_count": 180, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "from sklearn.preprocessing import PolynomialFeatures\n", - "from sklearn.pipeline import make_pipeline\n", - "\n", - "pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression())\n", - "\n", - "pipeline.fit(X_train,y_train)\n", - "\n", - "pred = pipeline.predict(X_test)\n", - "\n", - "mse = np.sqrt(mean_squared_error(y_test,pred))\n", - "print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n", - "\n", - "score = pipeline.score(X_train,y_train)\n", - "print('Model determination: ', score)\n", - "\n", - "plt.scatter(X_test,y_test)\n", - "plt.plot(sorted(X_test),pipeline.predict(sorted(X_test)))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Codificação de variedades\n", - "\n", - "No mundo ideal, queremos ser capazes de prever os preços para diferentes variedades de abóbora usando o mesmo modelo. Para levar a variedade em consideração, primeiro precisamos convertê-la para uma forma numérica, ou **codificar**. Existem várias maneiras de fazer isso:\n", - "\n", - "* Codificação numérica simples que cria uma tabela com diferentes variedades e, em seguida, substitui o nome da variedade por um índice nessa tabela. Esta não é a melhor ideia para regressão linear, porque a regressão linear leva em conta o valor numérico do índice, e o valor numérico provavelmente não terá correlação numérica com o preço.\n", - "* Codificação one-hot, que substitui a coluna `Variety` por 4 colunas diferentes, uma para cada variedade, que conterão 1 se a linha correspondente for da variedade dada, e 0 caso contrário.\n", - "\n", - "O código abaixo mostra como podemos codificar uma variedade usando one-hot:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 181, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
FAIRYTALEMINIATUREMIXED HEIRLOOM VARIETIESPIE TYPE
700001
710001
720001
730001
740001
...............
17380100
17390100
17400100
17410100
17420100
\n", - "

415 rows × 4 columns

\n", - "
" - ], - "text/plain": [ - " FAIRYTALE MINIATURE MIXED HEIRLOOM VARIETIES PIE TYPE\n", - "70 0 0 0 1\n", - "71 0 0 0 1\n", - "72 0 0 0 1\n", - "73 0 0 0 1\n", - "74 0 0 0 1\n", - "... ... ... ... ...\n", - "1738 0 1 0 0\n", - "1739 0 1 0 0\n", - "1740 0 1 0 0\n", - "1741 0 1 0 0\n", - "1742 0 1 0 0\n", - "\n", - "[415 rows x 4 columns]" - ] - }, - "execution_count": 181, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "pd.get_dummies(new_pumpkins['Variety'])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Linear sobre Variedade\n", - "\n", - "Agora vamos usar o mesmo código mencionado acima, mas em vez de `DayOfYear`, utilizaremos a nossa variedade codificada em one-hot como entrada:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 182, - "metadata": {}, - "outputs": [], - "source": [ - "X = pd.get_dummies(new_pumpkins['Variety'])\n", - "y = new_pumpkins['Price']" - ] - }, - { - "cell_type": "code", - "execution_count": 183, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 5.24 (19.7%)\n", - "Model determination: 0.774085281105197\n" - ] - } - ], - "source": [ - "def run_linear_regression(X,y):\n", - " X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n", - " lin_reg = LinearRegression()\n", - " lin_reg.fit(X_train,y_train)\n", - "\n", - " pred = lin_reg.predict(X_test)\n", - "\n", - " mse = np.sqrt(mean_squared_error(y_test,pred))\n", - " print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n", - "\n", - " score = lin_reg.score(X_train,y_train)\n", - " print('Model determination: ', score)\n", - "\n", - "run_linear_regression(X,y)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Podemos também tentar usar outras funcionalidades da mesma maneira e combiná-las com funcionalidades numéricas, como `Month` ou `DayOfYear`:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 184, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.84 (10.5%)\n", - "Model determination: 0.9401096672643048\n" - ] - } - ], - "source": [ - "X = pd.get_dummies(new_pumpkins['Variety']) \\\n", - " .join(new_pumpkins['Month']) \\\n", - " .join(pd.get_dummies(new_pumpkins['City'])) \\\n", - " .join(pd.get_dummies(new_pumpkins['Package']))\n", - "y = new_pumpkins['Price']\n", - "\n", - "run_linear_regression(X,y)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Regressão Polinomial\n", - "\n", - "A regressão polinomial também pode ser utilizada com características categóricas que foram codificadas em one-hot. O código para treinar a regressão polinomial seria essencialmente o mesmo que vimos acima.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 185, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Mean error: 2.23 (8.25%)\n", - "Model determination: 0.9652870784724543\n" - ] - } - ], - "source": [ - "from sklearn.preprocessing import PolynomialFeatures\n", - "from sklearn.pipeline import make_pipeline\n", - "\n", - "pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression())\n", - "\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n", - "\n", - "pipeline.fit(X_train,y_train)\n", - "\n", - "pred = pipeline.predict(X_test)\n", - "\n", - "mse = np.sqrt(mean_squared_error(y_test,pred))\n", - "print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)')\n", - "\n", - "score = pipeline.score(X_train,y_train)\n", - "print('Model determination: ', score)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5" - }, - "kernelspec": { - "display_name": "Python 3.7.0 64-bit ('3.7')", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.9.5" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "d77bd89ae7e79780c68c58bab91f13f8", - "translation_date": "2025-09-03T19:17:56+00:00", - "source_file": "2-Regression/3-Linear/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/4-Logistic/README.md b/translations/pt/2-Regression/4-Logistic/README.md deleted file mode 100644 index d96d7ee75..000000000 --- a/translations/pt/2-Regression/4-Logistic/README.md +++ /dev/null @@ -1,415 +0,0 @@ - -# Regressão logística para prever categorias - -![Infográfico de regressão logística vs. regressão linear](../../../../2-Regression/4-Logistic/images/linear-vs-logistic.png) - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../2-Regression/4-Logistic/solution/R/lesson_4.html) - -## Introdução - -Nesta última lição sobre Regressão, uma das técnicas básicas _clássicas_ de ML, vamos explorar a Regressão Logística. Esta técnica é usada para descobrir padrões e prever categorias binárias. Este doce é chocolate ou não? Esta doença é contagiosa ou não? Este cliente vai escolher este produto ou não? - -Nesta lição, você aprenderá: - -- Uma nova biblioteca para visualização de dados -- Técnicas de regressão logística - -✅ Aprofunde seu entendimento sobre como trabalhar com este tipo de regressão neste [módulo de aprendizado](https://docs.microsoft.com/learn/modules/train-evaluate-classification-models?WT.mc_id=academic-77952-leestott) - -## Pré-requisito - -Depois de trabalhar com os dados de abóbora, já estamos suficientemente familiarizados para perceber que há uma categoria binária com a qual podemos trabalhar: `Color`. - -Vamos construir um modelo de regressão logística para prever, com base em algumas variáveis, _qual é a cor provável de uma abóbora_ (laranja 🎃 ou branca 👻). - -> Por que estamos falando de classificação binária em uma lição sobre regressão? Apenas por conveniência linguística, já que a regressão logística é [na verdade um método de classificação](https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression), embora baseado em linearidade. Aprenda sobre outras formas de classificar dados no próximo grupo de lições. - -## Definir a questão - -Para nossos propósitos, vamos expressar isso como um binário: 'Branca' ou 'Não Branca'. Há também uma categoria 'listrada' em nosso conjunto de dados, mas há poucos exemplos dela, então não a utilizaremos. Ela desaparece quando removemos os valores nulos do conjunto de dados, de qualquer forma. - -> 🎃 Curiosidade: às vezes chamamos as abóboras brancas de abóboras 'fantasma'. Elas não são muito fáceis de esculpir, então não são tão populares quanto as laranjas, mas têm um visual interessante! Assim, poderíamos reformular nossa questão como: 'Fantasma' ou 'Não Fantasma'. 👻 - -## Sobre regressão logística - -A regressão logística difere da regressão linear, que você aprendeu anteriormente, em alguns aspectos importantes. - -[![ML para iniciantes - Entendendo a Regressão Logística para Classificação de Machine Learning](https://img.youtube.com/vi/KpeCT6nEpBY/0.jpg)](https://youtu.be/KpeCT6nEpBY "ML para iniciantes - Entendendo a Regressão Logística para Classificação de Machine Learning") - -> 🎥 Clique na imagem acima para um breve vídeo sobre regressão logística. - -### Classificação binária - -A regressão logística não oferece os mesmos recursos que a regressão linear. A primeira oferece uma previsão sobre uma categoria binária ("branca ou não branca"), enquanto a segunda é capaz de prever valores contínuos, por exemplo, dado a origem de uma abóbora e o tempo de colheita, _quanto seu preço vai aumentar_. - -![Modelo de classificação de abóbora](../../../../2-Regression/4-Logistic/images/pumpkin-classifier.png) -> Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -### Outras classificações - -Existem outros tipos de regressão logística, incluindo multinomial e ordinal: - -- **Multinomial**, que envolve mais de uma categoria - "Laranja, Branca e Listrada". -- **Ordinal**, que envolve categorias ordenadas, útil se quisermos ordenar nossos resultados logicamente, como nossas abóboras que são ordenadas por um número finito de tamanhos (mini,pequeno,médio,grande,xl,xxl). - -![Regressão multinomial vs ordinal](../../../../2-Regression/4-Logistic/images/multinomial-vs-ordinal.png) - -### As variáveis NÃO precisam ser correlacionadas - -Lembra como a regressão linear funcionava melhor com variáveis mais correlacionadas? A regressão logística é o oposto - as variáveis não precisam estar alinhadas. Isso funciona para este conjunto de dados, que tem correlações relativamente fracas. - -### Você precisa de muitos dados limpos - -A regressão logística fornecerá resultados mais precisos se você usar mais dados; nosso pequeno conjunto de dados não é ideal para esta tarefa, então tenha isso em mente. - -[![ML para iniciantes - Análise e Preparação de Dados para Regressão Logística](https://img.youtube.com/vi/B2X4H9vcXTs/0.jpg)](https://youtu.be/B2X4H9vcXTs "ML para iniciantes - Análise e Preparação de Dados para Regressão Logística") - -> 🎥 Clique na imagem acima para um breve vídeo sobre preparação de dados para regressão linear. - -✅ Pense nos tipos de dados que se adaptariam bem à regressão logística. - -## Exercício - organizar os dados - -Primeiro, limpe os dados, removendo valores nulos e selecionando apenas algumas colunas: - -1. Adicione o seguinte código: - - ```python - - columns_to_select = ['City Name','Package','Variety', 'Origin','Item Size', 'Color'] - pumpkins = full_pumpkins.loc[:, columns_to_select] - - pumpkins.dropna(inplace=True) - ``` - - Você sempre pode dar uma olhada no seu novo dataframe: - - ```python - pumpkins.info - ``` - -### Visualização - gráfico categórico - -Agora que você carregou o [notebook inicial](../../../../2-Regression/4-Logistic/notebook.ipynb) com os dados de abóbora novamente e os limpou para preservar um conjunto de dados contendo algumas variáveis, incluindo `Color`, vamos visualizar o dataframe no notebook usando uma biblioteca diferente: [Seaborn](https://seaborn.pydata.org/index.html), que é construída sobre o Matplotlib que usamos anteriormente. - -Seaborn oferece algumas maneiras interessantes de visualizar seus dados. Por exemplo, você pode comparar distribuições dos dados para cada `Variety` e `Color` em um gráfico categórico. - -1. Crie tal gráfico usando a função `catplot`, com os dados de abóbora `pumpkins`, e especificando um mapeamento de cores para cada categoria de abóbora (laranja ou branca): - - ```python - import seaborn as sns - - palette = { - 'ORANGE': 'orange', - 'WHITE': 'wheat', - } - - sns.catplot( - data=pumpkins, y="Variety", hue="Color", kind="count", - palette=palette, - ) - ``` - - ![Uma grade de dados visualizados](../../../../2-Regression/4-Logistic/images/pumpkins_catplot_1.png) - - Observando os dados, você pode ver como os dados de `Color` se relacionam com `Variety`. - - ✅ Dado este gráfico categórico, quais são algumas explorações interessantes que você pode imaginar? - -### Pré-processamento de dados: codificação de características e rótulos - -Nosso conjunto de dados de abóboras contém valores de string em todas as suas colunas. Trabalhar com dados categóricos é intuitivo para humanos, mas não para máquinas. Algoritmos de aprendizado de máquina funcionam bem com números. Por isso, a codificação é uma etapa muito importante na fase de pré-processamento de dados, pois permite transformar dados categóricos em dados numéricos, sem perder informações. Uma boa codificação leva à construção de um bom modelo. - -Para codificação de características, existem dois tipos principais de codificadores: - -1. Codificador ordinal: é adequado para variáveis ordinais, que são variáveis categóricas cujos dados seguem uma ordem lógica, como a coluna `Item Size` em nosso conjunto de dados. Ele cria um mapeamento em que cada categoria é representada por um número, que é a ordem da categoria na coluna. - - ```python - from sklearn.preprocessing import OrdinalEncoder - - item_size_categories = [['sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo']] - ordinal_features = ['Item Size'] - ordinal_encoder = OrdinalEncoder(categories=item_size_categories) - ``` - -2. Codificador categórico: é adequado para variáveis nominais, que são variáveis categóricas cujos dados não seguem uma ordem lógica, como todas as características diferentes de `Item Size` em nosso conjunto de dados. É uma codificação one-hot, o que significa que cada categoria é representada por uma coluna binária: a variável codificada é igual a 1 se a abóbora pertence àquela `Variety` e 0 caso contrário. - - ```python - from sklearn.preprocessing import OneHotEncoder - - categorical_features = ['City Name', 'Package', 'Variety', 'Origin'] - categorical_encoder = OneHotEncoder(sparse_output=False) - ``` - -Então, `ColumnTransformer` é usado para combinar múltiplos codificadores em uma única etapa e aplicá-los às colunas apropriadas. - -```python - from sklearn.compose import ColumnTransformer - - ct = ColumnTransformer(transformers=[ - ('ord', ordinal_encoder, ordinal_features), - ('cat', categorical_encoder, categorical_features) - ]) - - ct.set_output(transform='pandas') - encoded_features = ct.fit_transform(pumpkins) -``` - -Por outro lado, para codificar o rótulo, usamos a classe `LabelEncoder` do scikit-learn, que é uma classe utilitária para ajudar a normalizar rótulos de forma que contenham apenas valores entre 0 e n_classes-1 (aqui, 0 e 1). - -```python - from sklearn.preprocessing import LabelEncoder - - label_encoder = LabelEncoder() - encoded_label = label_encoder.fit_transform(pumpkins['Color']) -``` - -Depois de codificar as características e o rótulo, podemos mesclá-los em um novo dataframe `encoded_pumpkins`. - -```python - encoded_pumpkins = encoded_features.assign(Color=encoded_label) -``` - -✅ Quais são as vantagens de usar um codificador ordinal para a coluna `Item Size`? - -### Analisar relações entre variáveis - -Agora que pré-processamos nossos dados, podemos analisar as relações entre as características e o rótulo para ter uma ideia de quão bem o modelo será capaz de prever o rótulo com base nas características. - -A melhor maneira de realizar esse tipo de análise é plotando os dados. Usaremos novamente a função `catplot` do Seaborn para visualizar as relações entre `Item Size`, `Variety` e `Color` em um gráfico categórico. Para melhor plotar os dados, usaremos a coluna codificada `Item Size` e a coluna não codificada `Variety`. - -```python - palette = { - 'ORANGE': 'orange', - 'WHITE': 'wheat', - } - pumpkins['Item Size'] = encoded_pumpkins['ord__Item Size'] - - g = sns.catplot( - data=pumpkins, - x="Item Size", y="Color", row='Variety', - kind="box", orient="h", - sharex=False, margin_titles=True, - height=1.8, aspect=4, palette=palette, - ) - g.set(xlabel="Item Size", ylabel="").set(xlim=(0,6)) - g.set_titles(row_template="{row_name}") -``` - -![Um gráfico categórico de dados visualizados](../../../../2-Regression/4-Logistic/images/pumpkins_catplot_2.png) - -### Usar um gráfico de dispersão - -Como `Color` é uma categoria binária (Branca ou Não), ela precisa de '[uma abordagem especializada](https://seaborn.pydata.org/tutorial/categorical.html?highlight=bar) para visualização'. Existem outras maneiras de visualizar a relação dessa categoria com outras variáveis. - -Você pode visualizar variáveis lado a lado com gráficos do Seaborn. - -1. Experimente um gráfico de dispersão ('swarm') para mostrar a distribuição de valores: - - ```python - palette = { - 0: 'orange', - 1: 'wheat' - } - sns.swarmplot(x="Color", y="ord__Item Size", data=encoded_pumpkins, palette=palette) - ``` - - ![Um gráfico de dispersão de dados visualizados](../../../../2-Regression/4-Logistic/images/swarm_2.png) - -**Atenção**: o código acima pode gerar um aviso, já que o Seaborn pode falhar ao representar uma quantidade tão grande de pontos de dados em um gráfico de dispersão. Uma solução possível é diminuir o tamanho do marcador, usando o parâmetro 'size'. No entanto, esteja ciente de que isso afeta a legibilidade do gráfico. - -> **🧮 Mostre-me a Matemática** -> -> A regressão logística baseia-se no conceito de 'máxima verossimilhança' usando [funções sigmoides](https://wikipedia.org/wiki/Sigmoid_function). Uma 'Função Sigmoide' em um gráfico tem a forma de um 'S'. Ela pega um valor e o mapeia para algo entre 0 e 1. Sua curva também é chamada de 'curva logística'. Sua fórmula é assim: -> -> ![função logística](../../../../2-Regression/4-Logistic/images/sigmoid.png) -> -> onde o ponto médio da sigmoide encontra-se no ponto 0 de x, L é o valor máximo da curva, e k é a inclinação da curva. Se o resultado da função for maior que 0.5, o rótulo em questão será atribuído à classe '1' da escolha binária. Caso contrário, será classificado como '0'. - -## Construir seu modelo - -Construir um modelo para encontrar essas classificações binárias é surpreendentemente simples no Scikit-learn. - -[![ML para iniciantes - Regressão Logística para classificação de dados](https://img.youtube.com/vi/MmZS2otPrQ8/0.jpg)](https://youtu.be/MmZS2otPrQ8 "ML para iniciantes - Regressão Logística para classificação de dados") - -> 🎥 Clique na imagem acima para um breve vídeo sobre construção de um modelo de regressão linear. - -1. Selecione as variáveis que deseja usar em seu modelo de classificação e divida os conjuntos de treinamento e teste chamando `train_test_split()`: - - ```python - from sklearn.model_selection import train_test_split - - X = encoded_pumpkins[encoded_pumpkins.columns.difference(['Color'])] - y = encoded_pumpkins['Color'] - - X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) - - ``` - -2. Agora você pode treinar seu modelo, chamando `fit()` com seus dados de treinamento, e imprimir o resultado: - - ```python - from sklearn.metrics import f1_score, classification_report - from sklearn.linear_model import LogisticRegression - - model = LogisticRegression() - model.fit(X_train, y_train) - predictions = model.predict(X_test) - - print(classification_report(y_test, predictions)) - print('Predicted labels: ', predictions) - print('F1-score: ', f1_score(y_test, predictions)) - ``` - - Veja o desempenho do seu modelo. Não está ruim, considerando que você tem apenas cerca de 1000 linhas de dados: - - ```output - precision recall f1-score support - - 0 0.94 0.98 0.96 166 - 1 0.85 0.67 0.75 33 - - accuracy 0.92 199 - macro avg 0.89 0.82 0.85 199 - weighted avg 0.92 0.92 0.92 199 - - Predicted labels: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 - 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 - 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 - 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 - 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 - 0 0 0 1 0 0 0 0 0 0 0 0 1 1] - F1-score: 0.7457627118644068 - ``` - -## Melhor compreensão via uma matriz de confusão - -Embora você possa obter um relatório de desempenho [termos](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html?highlight=classification_report#sklearn.metrics.classification_report) imprimindo os itens acima, talvez consiga entender melhor seu modelo usando uma [matriz de confusão](https://scikit-learn.org/stable/modules/model_evaluation.html#confusion-matrix) para ajudar a avaliar como o modelo está se saindo. - -> 🎓 Uma '[matriz de confusão](https://wikipedia.org/wiki/Confusion_matrix)' (ou 'matriz de erro') é uma tabela que expressa os verdadeiros vs. falsos positivos e negativos do seu modelo, avaliando assim a precisão das previsões. - -1. Para usar uma matriz de confusão, chame `confusion_matrix()`: - - ```python - from sklearn.metrics import confusion_matrix - confusion_matrix(y_test, predictions) - ``` - - Veja a matriz de confusão do seu modelo: - - ```output - array([[162, 4], - [ 11, 22]]) - ``` - -No Scikit-learn, as linhas (eixo 0) são os rótulos reais e as colunas (eixo 1) são os rótulos previstos. - -| | 0 | 1 | -| :---: | :---: | :---: | -| 0 | TN | FP | -| 1 | FN | TP | - -O que está acontecendo aqui? Digamos que nosso modelo seja solicitado a classificar abóboras entre duas categorias binárias, categoria 'branca' e categoria 'não branca'. - -- Se o modelo prevê uma abóbora como não branca e ela realmente pertence à categoria 'não branca', chamamos isso de verdadeiro negativo, mostrado pelo número no canto superior esquerdo. -- Se o modelo prevê uma abóbora como branca e ela realmente pertence à categoria 'não branca', chamamos isso de falso negativo, mostrado pelo número no canto inferior esquerdo. -- Se o modelo prevê uma abóbora como não branca e ela realmente pertence à categoria 'branca', chamamos isso de falso positivo, mostrado pelo número no canto superior direito. -- Se o modelo prevê uma abóbora como branca e ela realmente pertence à categoria 'branca', chamamos isso de verdadeiro positivo, mostrado pelo número no canto inferior direito. - -Como você deve ter imaginado, é preferível ter um número maior de verdadeiros positivos e verdadeiros negativos e um número menor de falsos positivos e falsos negativos, o que implica que o modelo está se saindo melhor. -Como é que a matriz de confusão se relaciona com a precisão e o recall? Lembra-te, o relatório de classificação impresso acima mostrou precisão (0,85) e recall (0,67). - -Precisão = tp / (tp + fp) = 22 / (22 + 4) = 0,8461538461538461 - -Recall = tp / (tp + fn) = 22 / (22 + 11) = 0,6666666666666666 - -✅ P: De acordo com a matriz de confusão, como se saiu o modelo? R: Não foi mau; há um bom número de verdadeiros negativos, mas também alguns falsos negativos. - -Vamos rever os termos que vimos anteriormente com a ajuda do mapeamento TP/TN e FP/FN da matriz de confusão: - -🎓 Precisão: TP/(TP + FP) A fração de instâncias relevantes entre as instâncias recuperadas (ex.: quais etiquetas foram bem classificadas) - -🎓 Recall: TP/(TP + FN) A fração de instâncias relevantes que foram recuperadas, independentemente de terem sido bem classificadas ou não - -🎓 f1-score: (2 * precisão * recall)/(precisão + recall) Uma média ponderada da precisão e do recall, sendo o melhor 1 e o pior 0 - -🎓 Suporte: O número de ocorrências de cada etiqueta recuperada - -🎓 Precisão (Accuracy): (TP + TN)/(TP + TN + FP + FN) A percentagem de etiquetas previstas corretamente para uma amostra. - -🎓 Macro Avg: O cálculo da média não ponderada das métricas para cada etiqueta, sem considerar o desequilíbrio entre etiquetas. - -🎓 Weighted Avg: O cálculo da média das métricas para cada etiqueta, considerando o desequilíbrio entre etiquetas ao ponderá-las pelo seu suporte (o número de instâncias verdadeiras para cada etiqueta). - -✅ Consegues pensar em qual métrica deves prestar atenção se quiseres que o teu modelo reduza o número de falsos negativos? - -## Visualizar a curva ROC deste modelo - -[![ML para principiantes - Análise do Desempenho da Regressão Logística com Curvas ROC](https://img.youtube.com/vi/GApO575jTA0/0.jpg)](https://youtu.be/GApO575jTA0 "ML para principiantes - Análise do Desempenho da Regressão Logística com Curvas ROC") - - -> 🎥 Clica na imagem acima para uma breve explicação sobre curvas ROC - -Vamos fazer mais uma visualização para ver a chamada curva 'ROC': - -```python -from sklearn.metrics import roc_curve, roc_auc_score -import matplotlib -import matplotlib.pyplot as plt -%matplotlib inline - -y_scores = model.predict_proba(X_test) -fpr, tpr, thresholds = roc_curve(y_test, y_scores[:,1]) - -fig = plt.figure(figsize=(6, 6)) -plt.plot([0, 1], [0, 1], 'k--') -plt.plot(fpr, tpr) -plt.xlabel('False Positive Rate') -plt.ylabel('True Positive Rate') -plt.title('ROC Curve') -plt.show() -``` - -Usando Matplotlib, desenha a [Curva Característica de Operação do Recetor](https://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html?highlight=roc) ou ROC do modelo. As curvas ROC são frequentemente usadas para obter uma visão do desempenho de um classificador em termos de verdadeiros positivos vs. falsos positivos. "As curvas ROC geralmente apresentam a taxa de verdadeiros positivos no eixo Y e a taxa de falsos positivos no eixo X." Assim, a inclinação da curva e o espaço entre a linha do meio e a curva são importantes: queres uma curva que rapidamente suba e ultrapasse a linha. No nosso caso, há falsos positivos no início, e depois a linha sobe e ultrapassa corretamente: - -![ROC](../../../../2-Regression/4-Logistic/images/ROC_2.png) - -Por fim, usa a API [`roc_auc_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html?highlight=roc_auc#sklearn.metrics.roc_auc_score) do Scikit-learn para calcular a 'Área Sob a Curva' (AUC): - -```python -auc = roc_auc_score(y_test,y_scores[:,1]) -print(auc) -``` -O resultado é `0.9749908725812341`. Dado que o AUC varia de 0 a 1, queres um valor elevado, já que um modelo que acerta 100% nas suas previsões terá um AUC de 1; neste caso, o modelo é _bastante bom_. - -Em futuras lições sobre classificações, vais aprender como iterar para melhorar os resultados do teu modelo. Mas, por agora, parabéns! Completaste estas lições sobre regressão! - ---- -## 🚀Desafio - -Há muito mais para explorar sobre regressão logística! Mas a melhor forma de aprender é experimentar. Encontra um conjunto de dados que se preste a este tipo de análise e constrói um modelo com ele. O que aprendes? dica: experimenta [Kaggle](https://www.kaggle.com/search?q=logistic+regression+datasets) para conjuntos de dados interessantes. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Individual - -Lê as primeiras páginas [deste artigo de Stanford](https://web.stanford.edu/~jurafsky/slp3/5.pdf) sobre alguns usos práticos da regressão logística. Pensa em tarefas que sejam mais adequadas para um ou outro tipo de regressão entre as que estudámos até agora. O que funcionaria melhor? - -## Tarefa - -[Repetir esta regressão](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/4-Logistic/assignment.md b/translations/pt/2-Regression/4-Logistic/assignment.md deleted file mode 100644 index 614c08678..000000000 --- a/translations/pt/2-Regression/4-Logistic/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Repetir uma Regressão - -## Instruções - -Na aula, utilizaste um subconjunto dos dados de abóbora. Agora, volta aos dados originais e tenta usar todos eles, limpos e padronizados, para construir um modelo de Regressão Logística. - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita Melhorias | -| --------- | ---------------------------------------------------------------------- | ------------------------------------------------------------ | ----------------------------------------------------------- | -| | Um notebook é apresentado com um modelo bem explicado e com bom desempenho | Um notebook é apresentado com um modelo que tem desempenho mínimo | Um notebook é apresentado com um modelo de baixo desempenho ou nenhum | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/4-Logistic/notebook.ipynb b/translations/pt/2-Regression/4-Logistic/notebook.ipynb deleted file mode 100644 index d8881903b..000000000 --- a/translations/pt/2-Regression/4-Logistic/notebook.ipynb +++ /dev/null @@ -1,269 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Variedades de Abóbora e Cor\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n", - "\n", - "Vamos analisar a relação entre a cor e a variedade\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
0BALTIMORENaN24 inch binsNaNNaNNaN4/29/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
1BALTIMORENaN24 inch binsNaNNaNNaN5/6/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
2BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
3BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
4BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN11/5/1690.0100.090.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade Date \\\n", - "0 BALTIMORE NaN 24 inch bins NaN NaN NaN 4/29/17 \n", - "1 BALTIMORE NaN 24 inch bins NaN NaN NaN 5/6/17 \n", - "2 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "3 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "4 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 11/5/16 \n", - "\n", - " Low Price High Price Mostly Low ... Unit of Sale Quality Condition \\\n", - "0 270.0 280.0 270.0 ... NaN NaN NaN \n", - "1 270.0 280.0 270.0 ... NaN NaN NaN \n", - "2 160.0 160.0 160.0 ... NaN NaN NaN \n", - "3 160.0 160.0 160.0 ... NaN NaN NaN \n", - "4 90.0 100.0 90.0 ... NaN NaN NaN \n", - "\n", - " Appearance Storage Crop Repack Trans Mode Unnamed: 24 Unnamed: 25 \n", - "0 NaN NaN NaN E NaN NaN NaN \n", - "1 NaN NaN NaN E NaN NaN NaN \n", - "2 NaN NaN NaN N NaN NaN NaN \n", - "3 NaN NaN NaN N NaN NaN NaN \n", - "4 NaN NaN NaN N NaN NaN NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 1, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "\n", - "full_pumpkins = pd.read_csv('../data/US-pumpkins.csv')\n", - "\n", - "full_pumpkins.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.1" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "dee08c2b49057b0de8b6752c4dbca368", - "translation_date": "2025-09-03T19:30:02+00:00", - "source_file": "2-Regression/4-Logistic/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/4-Logistic/solution/Julia/README.md b/translations/pt/2-Regression/4-Logistic/solution/Julia/README.md deleted file mode 100644 index c7fa31380..000000000 --- a/translations/pt/2-Regression/4-Logistic/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb b/translations/pt/2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb deleted file mode 100644 index 9d6e3139d..000000000 --- a/translations/pt/2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb +++ /dev/null @@ -1,686 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Construir um modelo de regressão logística - Aula 4\n", - "\n", - "![Infográfico de regressão logística vs. regressão linear](../../../../../../translated_images/pt-PT/linear-vs-logistic.ba180bf95e7ee667.webp)\n", - "\n", - "#### **[Questionário pré-aula](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/15/)**\n", - "\n", - "#### Introdução\n", - "\n", - "Nesta última aula sobre Regressão, uma das técnicas básicas *clássicas* de ML, vamos explorar a Regressão Logística. Esta técnica é usada para descobrir padrões e prever categorias binárias. Este doce é chocolate ou não? Esta doença é contagiosa ou não? Este cliente vai escolher este produto ou não?\n", - "\n", - "Nesta aula, irá aprender:\n", - "\n", - "- Técnicas para regressão logística\n", - "\n", - "✅ Aprofunde o seu entendimento sobre como trabalhar com este tipo de regressão neste [módulo de aprendizagem](https://learn.microsoft.com/training/modules/introduction-classification-models/?WT.mc_id=academic-77952-leestott)\n", - "\n", - "## Pré-requisito\n", - "\n", - "Depois de trabalhar com os dados das abóboras, já estamos suficientemente familiarizados para perceber que há uma categoria binária com a qual podemos trabalhar: `Color`.\n", - "\n", - "Vamos construir um modelo de regressão logística para prever, com base em algumas variáveis, *qual é a cor provável de uma determinada abóbora* (laranja 🎃 ou branca 👻).\n", - "\n", - "> Por que estamos a falar de classificação binária numa aula sobre regressão? Apenas por conveniência linguística, já que a regressão logística é [na verdade um método de classificação](https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression), embora baseado em métodos lineares. Aprenda sobre outras formas de classificar dados no próximo grupo de aulas.\n", - "\n", - "Para esta aula, vamos precisar dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizagem automática.\n", - "\n", - "- `janitor`: O pacote [janitor](https://github.com/sfirke/janitor) oferece ferramentas simples para examinar e limpar dados desorganizados.\n", - "\n", - "- `ggbeeswarm`: O pacote [ggbeeswarm](https://github.com/eclarke/ggbeeswarm) fornece métodos para criar gráficos estilo \"beeswarm\" usando ggplot2.\n", - "\n", - "Pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"janitor\", \"ggbeeswarm\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se tem os pacotes necessários para completar este módulo e instala-os caso estejam em falta.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load(tidyverse, tidymodels, janitor, ggbeeswarm)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## **Definir a pergunta**\n", - "\n", - "Para os nossos propósitos, vamos expressar isto como um binário: 'Branco' ou 'Não Branco'. Existe também uma categoria 'listado' no nosso conjunto de dados, mas há poucos exemplos dela, por isso não a utilizaremos. De qualquer forma, ela desaparece quando removemos os valores nulos do conjunto de dados.\n", - "\n", - "> 🎃 Curiosidade: às vezes chamamos as abóboras brancas de abóboras 'fantasma'. Elas não são muito fáceis de esculpir, por isso não são tão populares quanto as laranjas, mas têm um visual interessante! Assim, poderíamos reformular a nossa pergunta como: 'Fantasma' ou 'Não Fantasma'. 👻\n", - "\n", - "## **Sobre regressão logística**\n", - "\n", - "A regressão logística difere da regressão linear, que você aprendeu anteriormente, em alguns aspectos importantes.\n", - "\n", - "#### **Classificação binária**\n", - "\n", - "A regressão logística não oferece as mesmas funcionalidades que a regressão linear. A primeira fornece uma previsão sobre uma `categoria binária` (\"laranja ou não laranja\"), enquanto a segunda é capaz de prever `valores contínuos`, por exemplo, dado a origem de uma abóbora e o momento da colheita, *quanto o seu preço irá aumentar*.\n", - "\n", - "![Infográfico por Dasani Madipalli](../../../../../../translated_images/pt-PT/pumpkin-classifier.562771f104ad5436.webp)\n", - "\n", - "### Outras classificações\n", - "\n", - "Existem outros tipos de regressão logística, incluindo multinomial e ordinal:\n", - "\n", - "- **Multinomial**, que envolve mais de uma categoria - \"Laranja, Branco e Listado\".\n", - "\n", - "- **Ordinal**, que envolve categorias ordenadas, útil se quisermos organizar os resultados logicamente, como as nossas abóboras que são ordenadas por um número finito de tamanhos (mini,pequeno,médio,grande,xl,xxl).\n", - "\n", - "![Regressão multinomial vs ordinal](../../../../../../translated_images/pt-PT/multinomial-vs-ordinal.36701b4850e37d86.webp)\n", - "\n", - "#### **As variáveis NÃO precisam estar correlacionadas**\n", - "\n", - "Lembra como a regressão linear funcionava melhor com variáveis mais correlacionadas? A regressão logística é o oposto - as variáveis não precisam estar alinhadas. Isso funciona para este conjunto de dados, que tem correlações relativamente fracas.\n", - "\n", - "#### **Você precisa de muitos dados limpos**\n", - "\n", - "A regressão logística fornecerá resultados mais precisos se você usar mais dados; nosso pequeno conjunto de dados não é ideal para esta tarefa, então tenha isso em mente.\n", - "\n", - "✅ Pense nos tipos de dados que seriam adequados para regressão logística\n", - "\n", - "## Exercício - organizar os dados\n", - "\n", - "Primeiro, limpe os dados um pouco, removendo valores nulos e selecionando apenas algumas das colunas:\n", - "\n", - "1. Adicione o seguinte código:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Load the core tidyverse packages\n", - "library(tidyverse)\n", - "\n", - "# Import the data and clean column names\n", - "pumpkins <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/2-Regression/data/US-pumpkins.csv\") %>% \n", - " clean_names()\n", - "\n", - "# Select desired columns\n", - "pumpkins_select <- pumpkins %>% \n", - " select(c(city_name, package, variety, origin, item_size, color)) \n", - "\n", - "# Drop rows containing missing values and encode color as factor (category)\n", - "pumpkins_select <- pumpkins_select %>% \n", - " drop_na() %>% \n", - " mutate(color = factor(color))\n", - "\n", - "# View the first few rows\n", - "pumpkins_select %>% \n", - " slice_head(n = 5)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Pode sempre dar uma olhadela ao seu novo dataframe utilizando a função [*glimpse()*](https://pillar.r-lib.org/reference/glimpse.html), como mostrado abaixo:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "pumpkins_select %>% \n", - " glimpse()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Vamos confirmar que, de facto, estaremos a resolver um problema de classificação binária:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Subset distinct observations in outcome column\n", - "pumpkins_select %>% \n", - " distinct(color)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Visualização - gráfico categórico\n", - "Neste momento, já carregaste novamente os dados das abóboras e limpaste-os para preservar um conjunto de dados contendo algumas variáveis, incluindo Cor. Vamos visualizar o dataframe no notebook utilizando a biblioteca ggplot.\n", - "\n", - "A biblioteca ggplot oferece algumas formas interessantes de visualizar os teus dados. Por exemplo, podes comparar as distribuições dos dados para cada Variedade e Cor num gráfico categórico.\n", - "\n", - "1. Cria um gráfico deste tipo utilizando a função geombar, com os dados das abóboras, e especifica um mapeamento de cores para cada categoria de abóbora (laranja ou branca):\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "python" - } - }, - "outputs": [], - "source": [ - "# Specify colors for each value of the hue variable\n", - "palette <- c(ORANGE = \"orange\", WHITE = \"wheat\")\n", - "\n", - "# Create the bar plot\n", - "ggplot(pumpkins_select, aes(y = variety, fill = color)) +\n", - " geom_bar(position = \"dodge\") +\n", - " scale_fill_manual(values = palette) +\n", - " labs(y = \"Variety\", fill = \"Color\") +\n", - " theme_minimal()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Ao observar os dados, pode ver como os dados de Cor se relacionam com a Variedade.\n", - "\n", - "✅ Dado este gráfico categórico, que explorações interessantes consegue imaginar?\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### Pré-processamento de dados: codificação de características\n", - "\n", - "O nosso conjunto de dados de abóboras contém valores em formato de texto para todas as suas colunas. Trabalhar com dados categóricos é intuitivo para humanos, mas não para máquinas. Os algoritmos de aprendizagem automática funcionam bem com números. É por isso que a codificação é um passo muito importante na fase de pré-processamento de dados, pois permite transformar dados categóricos em dados numéricos, sem perder nenhuma informação. Uma boa codificação contribui para a construção de um bom modelo.\n", - "\n", - "Para a codificação de características, existem dois tipos principais de codificadores:\n", - "\n", - "1. Codificador ordinal: é adequado para variáveis ordinais, que são variáveis categóricas cujos dados seguem uma ordem lógica, como a coluna `item_size` no nosso conjunto de dados. Ele cria um mapeamento em que cada categoria é representada por um número, que corresponde à ordem da categoria na coluna.\n", - "\n", - "2. Codificador categórico: é adequado para variáveis nominais, que são variáveis categóricas cujos dados não seguem uma ordem lógica, como todas as características diferentes de `item_size` no nosso conjunto de dados. Trata-se de uma codificação one-hot, o que significa que cada categoria é representada por uma coluna binária: a variável codificada é igual a 1 se a abóbora pertence àquela variedade e 0 caso contrário.\n", - "\n", - "O Tidymodels oferece mais uma ferramenta interessante: [recipes](https://recipes.tidymodels.org/) - um pacote para pré-processamento de dados. Vamos definir uma `recipe` que especifica que todas as colunas preditoras devem ser codificadas em um conjunto de números inteiros, `prep` para estimar as quantidades e estatísticas necessárias para qualquer operação e, finalmente, `bake` para aplicar os cálculos a novos dados.\n", - "\n", - "> Normalmente, o recipes é usado como um pré-processador para modelagem, onde define quais passos devem ser aplicados a um conjunto de dados para prepará-lo para a modelagem. Nesse caso, é **altamente recomendado** que utilize um `workflow()` em vez de estimar manualmente uma receita usando prep e bake. Veremos tudo isso em breve.\n", - ">\n", - "> No entanto, por agora, estamos a usar recipes + prep + bake para especificar quais passos devem ser aplicados a um conjunto de dados para prepará-lo para análise de dados e, em seguida, extrair os dados pré-processados com os passos aplicados.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Preprocess and extract data to allow some data analysis\n", - "baked_pumpkins <- recipe(color ~ ., data = pumpkins_select) %>%\n", - " # Define ordering for item_size column\n", - " step_mutate(item_size = ordered(item_size, levels = c('sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo'))) %>%\n", - " # Convert factors to numbers using the order defined above (Ordinal encoding)\n", - " step_integer(item_size, zero_based = F) %>%\n", - " # Encode all other predictors using one hot encoding\n", - " step_dummy(all_nominal(), -all_outcomes(), one_hot = TRUE) %>%\n", - " prep(data = pumpkin_select) %>%\n", - " bake(new_data = NULL)\n", - "\n", - "# Display the first few rows of preprocessed data\n", - "baked_pumpkins %>% \n", - " slice_head(n = 5)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "✅ Quais são as vantagens de usar um codificador ordinal para a coluna Item Size?\n", - "\n", - "### Analisar relações entre variáveis\n", - "\n", - "Agora que pré-processámos os nossos dados, podemos analisar as relações entre as características e o rótulo para ter uma ideia de quão bem o modelo será capaz de prever o rótulo com base nas características. A melhor forma de realizar este tipo de análise é através da visualização dos dados. \n", - "Vamos utilizar novamente a função ggplot geom_boxplot_ para visualizar as relações entre Item Size, Variety e Color num gráfico categórico. Para representar melhor os dados, utilizaremos a coluna codificada Item Size e a coluna não codificada Variety.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Define the color palette\n", - "palette <- c(ORANGE = \"orange\", WHITE = \"wheat\")\n", - "\n", - "# We need the encoded Item Size column to use it as the x-axis values in the plot\n", - "pumpkins_select_plot<-pumpkins_select\n", - "pumpkins_select_plot$item_size <- baked_pumpkins$item_size\n", - "\n", - "# Create the grouped box plot\n", - "ggplot(pumpkins_select_plot, aes(x = `item_size`, y = color, fill = color)) +\n", - " geom_boxplot() +\n", - " facet_grid(variety ~ ., scales = \"free_x\") +\n", - " scale_fill_manual(values = palette) +\n", - " labs(x = \"Item Size\", y = \"\") +\n", - " theme_minimal() +\n", - " theme(strip.text = element_text(size = 12)) +\n", - " theme(axis.text.x = element_text(size = 10)) +\n", - " theme(axis.title.x = element_text(size = 12)) +\n", - " theme(axis.title.y = element_blank()) +\n", - " theme(legend.position = \"bottom\") +\n", - " guides(fill = guide_legend(title = \"Color\")) +\n", - " theme(panel.spacing = unit(0.5, \"lines\"))+\n", - " theme(strip.text.y = element_text(size = 4, hjust = 0)) \n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "#### Usar um gráfico de enxame\n", - "\n", - "Como a cor é uma categoria binária (Branco ou Não), é necessário 'uma [abordagem especializada](https://github.com/rstudio/cheatsheets/blob/main/data-visualization.pdf) para visualização'.\n", - "\n", - "Experimente um `gráfico de enxame` para mostrar a distribuição da cor em relação ao tamanho do item.\n", - "\n", - "Vamos usar o [pacote ggbeeswarm](https://github.com/eclarke/ggbeeswarm), que fornece métodos para criar gráficos no estilo enxame usando ggplot2. Gráficos de enxame são uma forma de plotar pontos que normalmente se sobreporiam, posicionando-os lado a lado.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Create beeswarm plots of color and item_size\n", - "baked_pumpkins %>% \n", - " mutate(color = factor(color)) %>% \n", - " ggplot(mapping = aes(x = color, y = item_size, color = color)) +\n", - " geom_quasirandom() +\n", - " scale_color_brewer(palette = \"Dark2\", direction = -1) +\n", - " theme(legend.position = \"none\")\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora que temos uma ideia da relação entre as categorias binárias de cor e o grupo maior de tamanhos, vamos explorar a regressão logística para determinar a provável cor de uma abóbora.\n", - "\n", - "## Construir o seu modelo\n", - "\n", - "Selecione as variáveis que deseja usar no seu modelo de classificação e divida os dados em conjuntos de treino e teste. [rsample](https://rsample.tidymodels.org/), um pacote do Tidymodels, fornece infraestrutura para uma divisão e reamostragem de dados eficiente:\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Split data into 80% for training and 20% for testing\n", - "set.seed(2056)\n", - "pumpkins_split <- pumpkins_select %>% \n", - " initial_split(prop = 0.8)\n", - "\n", - "# Extract the data in each split\n", - "pumpkins_train <- training(pumpkins_split)\n", - "pumpkins_test <- testing(pumpkins_split)\n", - "\n", - "# Print out the first 5 rows of the training set\n", - "pumpkins_train %>% \n", - " slice_head(n = 5)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "🙌 Estamos prontos para treinar um modelo ajustando as características de treino ao rótulo de treino (cor).\n", - "\n", - "Vamos começar por criar uma receita que especifica os passos de pré-processamento que devem ser realizados nos nossos dados para os preparar para a modelação, ou seja: codificar variáveis categóricas em um conjunto de inteiros. Tal como `baked_pumpkins`, criamos uma `pumpkins_recipe`, mas não usamos `prep` e `bake`, já que isso será incorporado num fluxo de trabalho, como verá em apenas alguns passos.\n", - "\n", - "Existem várias formas de especificar um modelo de regressão logística no Tidymodels. Consulte `?logistic_reg()`. Por agora, vamos especificar um modelo de regressão logística através do motor padrão `stats::glm()`.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Create a recipe that specifies preprocessing steps for modelling\n", - "pumpkins_recipe <- recipe(color ~ ., data = pumpkins_train) %>% \n", - " step_mutate(item_size = ordered(item_size, levels = c('sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo'))) %>%\n", - " step_integer(item_size, zero_based = F) %>% \n", - " step_dummy(all_nominal(), -all_outcomes(), one_hot = TRUE)\n", - "\n", - "# Create a logistic model specification\n", - "log_reg <- logistic_reg() %>% \n", - " set_engine(\"glm\") %>% \n", - " set_mode(\"classification\")\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora que temos uma receita e uma especificação do modelo, precisamos encontrar uma forma de combiná-las num único objeto que, primeiro, pré-processe os dados (prep+bake nos bastidores), ajuste o modelo aos dados pré-processados e também permita possíveis atividades de pós-processamento.\n", - "\n", - "No Tidymodels, este objeto prático é chamado de [`workflow`](https://workflows.tidymodels.org/) e armazena convenientemente os seus componentes de modelação.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Bundle modelling components in a workflow\n", - "log_reg_wf <- workflow() %>% \n", - " add_recipe(pumpkins_recipe) %>% \n", - " add_model(log_reg)\n", - "\n", - "# Print out the workflow\n", - "log_reg_wf\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Depois de um fluxo de trabalho ter sido *especificado*, um modelo pode ser `treinado` utilizando a função [`fit()`](https://tidymodels.github.io/parsnip/reference/fit.html). O fluxo de trabalho irá estimar uma receita e pré-processar os dados antes do treino, por isso não será necessário fazer isso manualmente utilizando prep e bake.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Train the model\n", - "wf_fit <- log_reg_wf %>% \n", - " fit(data = pumpkins_train)\n", - "\n", - "# Print the trained workflow\n", - "wf_fit\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "O modelo imprime os coeficientes aprendidos durante o treino.\n", - "\n", - "Agora que treinámos o modelo utilizando os dados de treino, podemos fazer previsões nos dados de teste usando [parsnip::predict()](https://parsnip.tidymodels.org/reference/predict.model_fit.html). Vamos começar por usar o modelo para prever etiquetas para o nosso conjunto de teste e as probabilidades para cada etiqueta. Quando a probabilidade é superior a 0.5, a classe prevista é `WHITE`, caso contrário, é `ORANGE`.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Make predictions for color and corresponding probabilities\n", - "results <- pumpkins_test %>% select(color) %>% \n", - " bind_cols(wf_fit %>% \n", - " predict(new_data = pumpkins_test)) %>%\n", - " bind_cols(wf_fit %>%\n", - " predict(new_data = pumpkins_test, type = \"prob\"))\n", - "\n", - "# Compare predictions\n", - "results %>% \n", - " slice_head(n = 10)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Muito bom! Isto fornece mais detalhes sobre como funciona a regressão logística.\n", - "\n", - "### Melhor compreensão através de uma matriz de confusão\n", - "\n", - "Comparar cada previsão com o respetivo valor real (\"ground truth\") não é uma forma muito eficiente de determinar o quão bem o modelo está a prever. Felizmente, o Tidymodels tem mais algumas ferramentas úteis: [`yardstick`](https://yardstick.tidymodels.org/) - um pacote utilizado para medir a eficácia dos modelos através de métricas de desempenho.\n", - "\n", - "Uma métrica de desempenho associada a problemas de classificação é a [`matriz de confusão`](https://wikipedia.org/wiki/Confusion_matrix). Uma matriz de confusão descreve o desempenho de um modelo de classificação. Ela tabula quantos exemplos de cada classe foram corretamente classificados por um modelo. No nosso caso, mostrará quantas abóboras laranjas foram classificadas como laranjas e quantas abóboras brancas foram classificadas como brancas; a matriz de confusão também indica quantas foram classificadas nas categorias **erradas**.\n", - "\n", - "A função [**`conf_mat()`**](https://tidymodels.github.io/yardstick/reference/conf_mat.html) do yardstick calcula esta tabela cruzada de classes observadas e previstas.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Confusion matrix for prediction results\n", - "conf_mat(data = results, truth = color, estimate = .pred_class)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Vamos interpretar a matriz de confusão. O nosso modelo foi solicitado a classificar abóboras entre duas categorias binárias, categoria `branca` e categoria `não-branca`.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora é branca e ela pertence à categoria 'branca' na realidade, chamamos isso de um `verdadeiro positivo`, representado pelo número no canto superior esquerdo.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora não é branca e ela pertence à categoria 'branca' na realidade, chamamos isso de um `falso negativo`, representado pelo número no canto inferior esquerdo.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora é branca e ela pertence à categoria 'não-branca' na realidade, chamamos isso de um `falso positivo`, representado pelo número no canto superior direito.\n", - "\n", - "- Se o seu modelo prevê que uma abóbora não é branca e ela pertence à categoria 'não-branca' na realidade, chamamos isso de um `verdadeiro negativo`, representado pelo número no canto inferior direito.\n", - "\n", - "| Verdade |\n", - "|:-------:|\n", - "\n", - "\n", - "| | | |\n", - "|---------------|--------|-------|\n", - "| **Previsto** | BRANCA | LARANJA |\n", - "| BRANCA | VP | FP |\n", - "| LARANJA | FN | VN |\n", - "\n", - "Como pode imaginar, é preferível ter um número maior de verdadeiros positivos e verdadeiros negativos e um número menor de falsos positivos e falsos negativos, o que implica que o modelo tem um desempenho melhor.\n", - "\n", - "A matriz de confusão é útil porque dá origem a outras métricas que podem ajudar-nos a avaliar melhor o desempenho de um modelo de classificação. Vamos analisar algumas delas:\n", - "\n", - "🎓 Precisão: `VP/(VP + FP)` definida como a proporção de positivos previstos que são realmente positivos. Também chamada de [valor preditivo positivo](https://en.wikipedia.org/wiki/Positive_predictive_value \"Positive predictive value\").\n", - "\n", - "🎓 Recall: `VP/(VP + FN)` definida como a proporção de resultados positivos em relação ao número de amostras que eram realmente positivas. Também conhecida como `sensibilidade`.\n", - "\n", - "🎓 Especificidade: `VN/(VN + FP)` definida como a proporção de resultados negativos em relação ao número de amostras que eram realmente negativas.\n", - "\n", - "🎓 Exatidão: `(VP + VN)/(VP + VN + FP + FN)` A percentagem de etiquetas previstas corretamente para uma amostra.\n", - "\n", - "🎓 Medida F: Uma média ponderada da precisão e do recall, sendo o melhor valor 1 e o pior valor 0.\n", - "\n", - "Vamos calcular estas métricas!\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Combine metric functions and calculate them all at once\n", - "eval_metrics <- metric_set(ppv, recall, spec, f_meas, accuracy)\n", - "eval_metrics(data = results, truth = color, estimate = .pred_class)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Visualizar a curva ROC deste modelo\n", - "\n", - "Vamos fazer mais uma visualização para observar a chamada [`curva ROC`](https://en.wikipedia.org/wiki/Receiver_operating_characteristic):\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Make a roc_curve\n", - "results %>% \n", - " roc_curve(color, .pred_ORANGE) %>% \n", - " autoplot()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "As curvas ROC são frequentemente utilizadas para obter uma visão do desempenho de um classificador em termos de verdadeiros positivos vs. falsos positivos. As curvas ROC geralmente apresentam a `Taxa de Verdadeiros Positivos`/Sensibilidade no eixo Y e a `Taxa de Falsos Positivos`/1-Especificidade no eixo X. Assim, a inclinação da curva e o espaço entre a linha do meio e a curva são importantes: o ideal é ter uma curva que rapidamente suba e ultrapasse a linha. No nosso caso, há falsos positivos no início, e depois a linha sobe e ultrapassa adequadamente.\n", - "\n", - "Por fim, vamos usar `yardstick::roc_auc()` para calcular a Área Sob a Curva. Uma forma de interpretar a AUC é como a probabilidade de o modelo classificar um exemplo positivo aleatório mais alto do que um exemplo negativo aleatório.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "vscode": { - "languageId": "r" - } - }, - "outputs": [], - "source": [ - "# Calculate area under curve\n", - "results %>% \n", - " roc_auc(color, .pred_ORANGE)\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "O resultado é cerca de `0.975`. Dado que o AUC varia de 0 a 1, é desejável um valor elevado, já que um modelo que acerta 100% das suas previsões terá um AUC de 1; neste caso, o modelo é *bastante bom*.\n", - "\n", - "Nas próximas lições sobre classificações, aprenderás como melhorar os resultados do teu modelo (como lidar com dados desequilibrados neste caso).\n", - "\n", - "## 🚀Desafio\n", - "\n", - "Há muito mais para explorar sobre regressão logística! Mas a melhor forma de aprender é experimentar. Encontra um conjunto de dados que se preste a este tipo de análise e constrói um modelo com ele. O que aprendes? dica: experimenta [Kaggle](https://www.kaggle.com/search?q=logistic+regression+datasets) para conjuntos de dados interessantes.\n", - "\n", - "## Revisão & Estudo Individual\n", - "\n", - "Lê as primeiras páginas [deste artigo de Stanford](https://web.stanford.edu/~jurafsky/slp3/5.pdf) sobre algumas utilizações práticas da regressão logística. Reflete sobre tarefas que são mais adequadas para um ou outro tipo de regressão entre as que estudámos até agora. O que funcionaria melhor?\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos pela precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.\n" - ] - } - ], - "metadata": { - "anaconda-cloud": "", - "kernelspec": { - "display_name": "R", - "langauge": "R", - "name": "ir" - }, - "language_info": { - "codemirror_mode": "r", - "file_extension": ".r", - "mimetype": "text/x-r-source", - "name": "R", - "pygments_lexer": "r", - "version": "3.4.1" - }, - "coopTranslator": { - "original_hash": "feaf125f481a89c468fa115bf2aed580", - "translation_date": "2025-09-03T19:35:13+00:00", - "source_file": "2-Regression/4-Logistic/solution/R/lesson_4-R.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/4-Logistic/solution/notebook.ipynb b/translations/pt/2-Regression/4-Logistic/solution/notebook.ipynb deleted file mode 100644 index db181f04c..000000000 --- a/translations/pt/2-Regression/4-Logistic/solution/notebook.ipynb +++ /dev/null @@ -1,1255 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Regressão Logística - Aula 4\n", - "\n", - "Carregue as bibliotecas necessárias e o conjunto de dados. Converta os dados para um dataframe contendo um subconjunto dos dados:\n" - ] - }, - { - "cell_type": "code", - "execution_count": 63, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NameTypePackageVarietySub VarietyGradeDateLow PriceHigh PriceMostly Low...Unit of SaleQualityConditionAppearanceStorageCropRepackTrans ModeUnnamed: 24Unnamed: 25
0BALTIMORENaN24 inch binsNaNNaNNaN4/29/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
1BALTIMORENaN24 inch binsNaNNaNNaN5/6/17270.0280.0270.0...NaNNaNNaNNaNNaNNaNENaNNaNNaN
2BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
3BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN9/24/16160.0160.0160.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
4BALTIMORENaN24 inch binsHOWDEN TYPENaNNaN11/5/1690.0100.090.0...NaNNaNNaNNaNNaNNaNNNaNNaNNaN
\n", - "

5 rows × 26 columns

\n", - "
" - ], - "text/plain": [ - " City Name Type Package Variety Sub Variety Grade Date \n", - "0 BALTIMORE NaN 24 inch bins NaN NaN NaN 4/29/17 \\\n", - "1 BALTIMORE NaN 24 inch bins NaN NaN NaN 5/6/17 \n", - "2 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "3 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 9/24/16 \n", - "4 BALTIMORE NaN 24 inch bins HOWDEN TYPE NaN NaN 11/5/16 \n", - "\n", - " Low Price High Price Mostly Low ... Unit of Sale Quality Condition \n", - "0 270.0 280.0 270.0 ... NaN NaN NaN \\\n", - "1 270.0 280.0 270.0 ... NaN NaN NaN \n", - "2 160.0 160.0 160.0 ... NaN NaN NaN \n", - "3 160.0 160.0 160.0 ... NaN NaN NaN \n", - "4 90.0 100.0 90.0 ... NaN NaN NaN \n", - "\n", - " Appearance Storage Crop Repack Trans Mode Unnamed: 24 Unnamed: 25 \n", - "0 NaN NaN NaN E NaN NaN NaN \n", - "1 NaN NaN NaN E NaN NaN NaN \n", - "2 NaN NaN NaN N NaN NaN NaN \n", - "3 NaN NaN NaN N NaN NaN NaN \n", - "4 NaN NaN NaN N NaN NaN NaN \n", - "\n", - "[5 rows x 26 columns]" - ] - }, - "execution_count": 63, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "\n", - "full_pumpkins = pd.read_csv('../../data/US-pumpkins.csv')\n", - "\n", - "full_pumpkins.head()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 64, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
City NamePackageVarietyOriginItem SizeColor
2BALTIMORE24 inch binsHOWDEN TYPEDELAWAREmedORANGE
3BALTIMORE24 inch binsHOWDEN TYPEVIRGINIAmedORANGE
4BALTIMORE24 inch binsHOWDEN TYPEMARYLANDlgeORANGE
5BALTIMORE24 inch binsHOWDEN TYPEMARYLANDlgeORANGE
6BALTIMORE36 inch binsHOWDEN TYPEMARYLANDmedORANGE
\n", - "
" - ], - "text/plain": [ - " City Name Package Variety Origin Item Size Color\n", - "2 BALTIMORE 24 inch bins HOWDEN TYPE DELAWARE med ORANGE\n", - "3 BALTIMORE 24 inch bins HOWDEN TYPE VIRGINIA med ORANGE\n", - "4 BALTIMORE 24 inch bins HOWDEN TYPE MARYLAND lge ORANGE\n", - "5 BALTIMORE 24 inch bins HOWDEN TYPE MARYLAND lge ORANGE\n", - "6 BALTIMORE 36 inch bins HOWDEN TYPE MARYLAND med ORANGE" - ] - }, - "execution_count": 64, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Select the columns we want to use\n", - "columns_to_select = ['City Name','Package','Variety', 'Origin','Item Size', 'Color']\n", - "pumpkins = full_pumpkins.loc[:, columns_to_select]\n", - "\n", - "# Drop rows with missing values\n", - "pumpkins.dropna(inplace=True)\n", - "\n", - "pumpkins.head()" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Vamos dar uma olhada nos nossos dados!\n", - "\n", - "Visualizando-os com Seaborn\n" - ] - }, - { - "cell_type": "code", - "execution_count": 65, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 65, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAjQAAAHpCAYAAACVw6ZvAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/bCgiHAAAACXBIWXMAAA9hAAAPYQGoP6dpAABU3klEQVR4nO3deVRU5f8H8PeFkQFZZXNQ2RQBwy3NNRVGMTCz3JW0JJcyjdwXLJcwBSszTcU0wKxccl9KyoVxS0VTEhXXRM1A+7qwmOz394eH+/M6A7IKV9+vc+7Jee6zfO7IkXfP3JkRRFEUQURERKRgRlVdABEREVF5MdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdDQc0sURaSnp4MfxUREpHwMNPTcysjIgLW1NTIyMqq6FCIiKicGGiIiIlI8BhoiIiJSPAYaIiIiUjwGGiIiIlI8VVUXQFTVrq5qAkszZnsipXIbdqWqS6BqgP+KExERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdCUU3BwMHr27KnXrtPpIAgC7t27J7Xl5+djwYIFaNKkCUxNTVGrVi1069YNhw4dkvqcO3cOgiDgyJEjsvnatm0LU1NTZGVlSW1ZWVkwNTVFVFSUVIsgCBAEATVq1EDt2rXRtWtXREdHo6CgQDafm5ub1PfRIyIiAgCQnJwMQRDg6OiIjIwM2djmzZtj1qxZBp8PPz8/g/MWHo0bN4ZGo8HcuXP1xvbv3x9t27ZFfn4+Zs2aJY1RqVRwc3PDuHHjkJmZKavP0PH4c0dERM8+BpqnRBRFDBw4EGFhYRgzZgySkpKg0+ng7OwMPz8/bNmyBQDg7e0NjUYDnU4njc3IyMCJEyfg4OAg+2V9+PBhZGdno3PnzlJbYGAgUlJSkJycjJ07d0Kr1WLMmDF47bXXkJeXJ6spLCwMKSkpsiMkJETWJyMjA1988UWJr3PTpk3SXPHx8QCA3bt3S2379+/H8uXL8cknnyAxMVEat379euzYsQPfffcdjI2NAQA+Pj7StcybNw/Lly/HhAkTZOs9Onfh0bJlyxLXS0REzwZVVRfwvPjpp5+wYcMGbNu2DT169JDaly9fjtu3b2P48OHo2rUrzM3NodVqodPpMHXqVADAwYMH4enpiU6dOkGn08HPzw/Aw10gV1dXuLu7S/Op1WpoNBoAQN26ddGiRQu0bdsWXbp0wcqVKzF8+HCpr6WlpdS3KCEhIfjyyy8xevRoODo6PvE6bW1tpT8X7ibZ2dnJ1nn99dfx5ptvYsiQITh69Cju3buH0aNHIyIiAl5eXlI/lUoljRswYAD27NmDbdu24ZtvvpH6PD43ERE9n7hD85SsXr0anp6esjBTaMKECbh9+zZ27doFANBqtTh48KC0oxIXFwc/Pz/4+voiLi5OGhcXFwetVvvEtTt37oxmzZph06ZNpa47KCgIHh4eCAsLK/XY4ixcuBC3b9/G7NmzMWrUKDRu3Fhvd+hxZmZmyMnJKfOa2dnZSE9Plx1ERPRs4A5NBdixYwcsLCxkbfn5+bLHFy5cQKNGjQyOL2y/cOECgIeB5v79+zh27BjatWsHnU6HSZMmoUOHDhgyZAiysrIgiiLi4+NlOy7F8fb2xqlTp2RtU6ZMwccffyxr27lzJzp27Cg9LryvpkePHhg3bhwaNGhQovWexMrKCjExMXjllVdgbm6OU6dOQRCEIvv/8ccfWL16tezlNQBo3749jIzkubzwPpvHhYeH45NPPtFrd307EVZWVmW4CiIiqi4YaCqAVqtFZGSkrO3o0aMYPHiwrE0UxRLN5+HhgXr16kGn08HHxwcnT56Er68vHB0d4eLigsOHD0MURWRnZ5doh6Zw7ccDw6RJkxAcHCxrq1u3rt7YgIAAdOjQAdOnT8fq1atLtF5JdO7cGW3btkXz5s3h6uqqdz4xMREWFhbIz89HTk4OunfvjsWLF8v6rFu3rsig+LjQ0FCMHz9eepyeng5nZ+fyXQQREVULDDQVwNzcHB4eHrK2v//+W/bY09MTSUlJBscXtnt6ekptfn5+iIuLQ9OmTdGwYUPp/pXCl51EUYSHh0eJfyEnJSXJ7rUBAHt7e726ixIREYF27dph0qRJJepfUiqVCiqV4R9DLy8vbNu2DSqVCnXq1IGJiYleH2dn5xJfg1qthlqtLle9RERUPfEemqdk4MCBuHjxIrZv3653bv78+bCzs0PXrl2lNq1Wi99//x27du2SbgIGIN0YrNPpSrw7s3fvXiQmJqJPnz5lrr9169bo3bu3dKPy02BiYgIPDw+4ubkZDDNERESFuEPzlAwcOBDr16/HkCFD8Pnnn6NLly5IT0/HkiVLsG3bNqxfvx7m5uZS/8L7aKKjo7FixQqp3dfXV7pvZtSoUXrrZGdnIzU1Ffn5+bh58yZiY2MRHh6O1157DW+//basb0ZGBlJTU2VtNWvWLPJ+kjlz5sDHx6fIHZWqcPv2bb1rsLGxgampaRVVREREVYE7NE+JIAj46aefMG3aNCxYsABeXl7o2LEjrl69Cp1Op/fhfO7u7nB1dUVGRgZ8fX2ldhcXF9SpUwc5OTmynZtCsbGxcHJygpubGwIDAxEXF4dFixZh69at0ue7FJoxYwacnJxkx+TJk4u8Bk9PTwwdOlT24X5Vzd/fX+8aCj/Th4iInh+CWNI7VYmeMenp6bC2tkZaWhrf5UREpHDcoSEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVTVXUBRFXt6qomsDRjtq8obsOuVHUJRPQc4r/iREREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0z5ng4GAIggBBEGBiYgIPDw+EhYUhLy8PAKDT6SAIAu7duyd7bOhITU3Vm3/WrFlF9i88/P39ERAQoDd26dKlsLGxwd9//623bu3atdGnTx/89ddfUn83NzeD80dERFTOk0dERNWWqqoLoKcvMDAQMTExyM7Oxi+//ILRo0ejRo0aCA0NLXLM+fPnYWVlJWtzdHTU6zdx4kSMHDlSetyqVSu8++67GDFihNSWm5uLJk2a4JtvvsF7770HALhy5QomT56MyMhI1KtXD5cuXZLWtbS0xMWLF/Huu++iR48eOHXqFIyNjQEAYWFhsrkBwNLSspTPCBERKR0DzXNIrVZDo9EAAN5//31s3rwZ27ZtKzbQODo6wsbG5olzW1hYwMLCQnpsbGwMS0tLab1CCxcuxAcffIBXXnkFbm5uGDZsGF555RW89dZbBtd1cnLCjBkzMGjQIFy6dAleXl4AYHDuomRnZyM7O1t6nJ6eXqJxRERU/THQEMzMzHD79u2nuuaQIUOwefNmDB06FL1798bp06dx5syZYseYmZkBAHJycsq0Znh4OD755BO9dssOi2BlaQ7bBv5lmpeIiKoe76F5jomiiN27d+PXX39F586di+1br149affFwsICPj4+5V5/+fLlOH36NMaOHYvly5fDwcGhyL4pKSn44osvULduXWl3BgCmTJkiq8vCwgIHDhwwOEdoaCjS0tKk4/r16+W+BiIiqh64Q/Mc2rFjBywsLJCbm4uCggK8+eabmDVrVrFjDhw4ILs3pUaNGuWuw9HREe+99x62bNmCnj17GuxTr149iKKI//77D82aNcPGjRthYmIinZ80aRKCg4NlY+rWrWtwLrVaDbVaXe66iYio+mGgeQ5ptVpERkbCxMQEderUgUr15B8Dd3f3Et1DU1oqlarY9Q8cOAArKys4OjoavNnX3t4eHh4eFV4XEREpCwPNc8jc3FwxIaCyghQRET1bGGioRG7duoWsrCxZm52dXYW89FQeGRkZep+HU7NmTb23mBMR0bONNwVTiXh5ecHJyUl2/PHHH1VdFmbMmKFX1+TJk6u6LCIiesoEURTFqi6CqCqkp6fD2toaV05u4du2iYgUjjs0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/LZteu7Z1tfy27mJiBSOOzRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/KRgeu5dXdUElmYlz/Zuw65UYjVERFQW3KEhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCml4OBgCIIgHXZ2dggMDMSpU6dk/QRBwJYtW2RtcXFxeO211+Dg4ABTU1M0aNAAAwYMwP79+4td083NDYIgYO3atXrnfHx8IAgCVq5cqXcuPDwcxsbG+Pzzzw3Om5qaipCQENSvXx9qtRrOzs7o0aMH9uzZI1v7q6++kh6LooiJEyfCysoKOp2uyFqLOt58803UrFkTq1evlo0rKChA+/bt0bdvXwDy59nExAQeHh4ICwtDXl4eAECn0xW5RmpqarHPJxERPXsYaMogMDAQKSkpSElJwZ49e6BSqfDaa68VO2bp0qXo0qUL7OzssG7dOpw/fx6bN29G+/btMW7cuCeu6ezsjJiYGFnbkSNHkJqaCnNzc4NjoqOjMXnyZERHR+udS05ORsuWLbF37158/vnnSExMRGxsLLRaLUaPHm1wvvz8fAwbNgyrVq1CXFwc/Pz89PocO3ZMem42btwIADh//rzUFhkZiYiICISEhCAlJUUaN3/+fPz1119YtmyZ1Fb4PF+8eBETJkzArFmz9MLZo3MXHo6OjoafRCIiemapqroAJVKr1dBoNAAAjUaDqVOnomPHjvj333/h4OCg1//atWsYO3Ysxo4diy+//FJ2rmnTpvjwww+fuOagQYOwYMECXL9+Hc7OzgAeBpZBgwZh1apVev337duHBw8eICwsDKtWrcLvv/+O9u3bS+dHjRoFQRAQHx8vC0Q+Pj4YOnSo3nzZ2dkICgrC8ePHceDAAXh5eRms89Hrt7W1BQA4OjrCxsZGag8JCcGWLVswYsQI7NixA+fOncOMGTOwbt062NvbS/0efZ7ff/99bN68Gdu2bUNoaKjU5/G5iYjo+cQdmnLKzMzEDz/8AA8PD9jZ2Rnss3HjRuTm5mLy5MkGzwuC8MR1ateujYCAAHz33XcAgP/++w/r1q0zGD4AICoqCkFBQahRowaCgoIQFRUlnbtz5w5iY2MxevRog7s7jweEzMxMdO/eHWfPnsWhQ4eKDDMlJQgCYmJicODAAaxYsQLBwcEYOHAgXn/99WLHmZmZIScnp8zrZmdnIz09XXYQEdGzgTs0ZbBjxw5YWFgAAO7fvw8nJyfs2LEDRkaG8+GFCxdgZWUl7TYAD0POkCFDpMeHDx9GkyZNil136NChmDBhAj766CNs2LABDRo0QPPmzfX6paenY8OGDTh8+DAAYPDgwejYsSMWLlwICwsLXLp0CaIowtvbu0TXO3v2bFhaWiIpKcngDlRZuLq64quvvsLw4cNRr149/Pbbb0X2FUURe/bswa+//oqQkBDZuXr16unNe+bMGYPzhIeH45NPPtFrt+ywCFaW+sHOtoF/SS6FiIiqAe7QlIFWq0VCQgISEhIQHx+PgIAAdOvWDVevXi1yzOO7MAEBAUhISMDPP/+M+/fvIz8//4nrdu/eHZmZmdi/fz+io6OL3J1Zs2YNGjRogGbNmgEAmjdvDldXV6xbtw7Aw4BQGq+88gru37+PuXPnlmrck7zzzjtwcnJCSEgIrKys9M4XBkdTU1N069YNAwYMwKxZs2R9Dhw4IP1dJCQk4JdffilyvdDQUKSlpUnH9evXK/R6iIio6nCHpgzMzc3h4eEhPf72229hbW2NFStW4NNPP9Xr37BhQ6SlpSE1NVXapbGwsICHhwdUqpL/FahUKrz11luYOXMmjh49is2bNxvsFxUVhTNnzsjmLigoQHR0NIYNG4aGDRtCEAScO3euROt26dIFISEheOONN1BQUICFCxeWuOYnUalURT4HWq0WkZGRMDExQZ06dQz2c3d3L/E9NGq1Gmq1ujzlEhFRNcUdmgogCAKMjIzw4MEDg+f79u2LGjVqYN68eeVea+jQodi3bx/eeOMN1KpVS+98YmIijh8/Dp1OJ9u50Ol0OHz4MM6dOwdbW1sEBARgyZIluH//vt4c9+7d02t75ZVXsH37dqxYsaJENzFXhMLg6OLiUqrgR0REzx/+liiD7Oxs6bNO7t69i8WLFyMzMxM9evQw2N/FxQXz58/HmDFjcOfOHQQHB8Pd3R137tzBDz/8AAAwNjYu0dqNGjXC//73P9SsWdPg+aioKLRu3RqdOnXSO9eqVStERUXh888/x5IlS/Dyyy+jdevWCAsLQ9OmTZGXl4ddu3YhMjISSUlJeuP9/f2xY8cO9OjRAwUFBVi8eHGJaq5Mt27dQlZWlqzNzs4ONWrUqKKKiIioKnCHpgxiY2Ph5OQEJycntGnTBseOHcP69esNfi5LoZCQEPz222/4999/0bdvXzRs2BCvvvoqrly5gtjY2CfeEPwoOzs7mJmZ6bXn5OTghx9+QJ8+fQyO69OnD1atWoXc3FzUr18fJ06cgFarxYQJE9C4cWN07doVe/bsQWRkZJFrd+7cGT///DNWrlyJ0aNHl/p+nIrm5eUl/V0UHn/88UeV1kRERE+fIFb1bySiKpKeng5ra2tcObmF73IiIlI47tAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeLx27bpuWdbXwsrK6uqLoOIiMqBOzRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/KRgeu5dXdUElmaVl+3dhl2ptLmJiOgh7tAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0ChMcHAwBEHAyJEj9c6NHj0agiAgODhY6tuzZ0+9sREREbJxW7ZsgSAI0mOdTgdBEHDv3j29Nby9vaFWq5GamirrW9yh0+kwa9YsNG/eXG++5ORkCIKAhIQEg/M5ODjg1VdfRWJiosHn4fEjMDCwBM8iERE9axhoFMjZ2Rlr167FgwcPpLasrCysXr0aLi4uxY41NTXFvHnzcPfu3VKve/DgQTx48AB9+/bFd999BwBo3749UlJSpKN///4IDAyUtbVv377Ua50/fx4pKSn49ddfkZ2dje7duyMnJ0fW5/F1UlJSsGbNmlKvRUREysdAo0AtWrSAs7MzNm3aJLVt2rQJLi4uePHFF4sd6+/vD41Gg/Dw8FKvGxUVhTfffBNvvfUWoqOjAQAmJibQaDTSYWZmBrVaLWszMTEp9VqOjo7QaDRo0aIFxo4di+vXr+PcuXOyPo+vo9FoUKtWrVKvRUREysdAo1BDhw5FTEyM9Dg6OhrvvPPOE8cZGxtj7ty5+Prrr/H333+XeL2MjAysX78egwcPRteuXZGWloYDBw6UqfbSSEtLw9q1awGgTMHoUdnZ2UhPT5cdRET0bFBVdQFUNoMHD0ZoaCiuXr0KADh06BDWrl0LnU73xLG9evVC8+bNMXPmTERFRZVovbVr16Jhw4bw8fEBAAwcOBBRUVHo2LFjma+hOPXq1QMA3L9/HwDw+uuvw9vbW9Znx44dsLCwkLVNmzYN06ZNMzhneHg4PvnkE712yw6LYGVpXhFlG3Tn8u4n9rFt4F9p6xMRPQ8YaBTKwcEB3bt3x8qVKyGKIrp37w57e/sSj583bx46d+6MiRMnlqh/dHQ0Bg8eLD0ePHgwfH198fXXX8PS0rLU9T/JgQMHULNmTRw5cgRz587FsmXL9PpotVpERkbK2mxtbYucMzQ0FOPHj5cep6enw9nZueKKJiKiKsNAo2BDhw7FBx98AABYsmRJqcZ26tQJAQEBCA0Nld4VVZSzZ8/iyJEjiI+Px5QpU6T2/Px8rF27FiNGjHjielZWVkhLS9NrL3wnlbW1tazd3d0dNjY28PLywq1btzBgwADs379f1sfc3BweHh5PXLuQWq2GWq0ucX8iIlIO3kOjYIGBgcjJyUFubi4CAgJKPT4iIgLbt2/H4cOHi+0XFRWFTp064c8//0RCQoJ0jB8/vsQvWXl5eeHvv//GzZs3Ze0nTpyAqalpse/OGj16NE6fPo3NmzeXaC0iInr+cIdGwYyNjZGUlCT9ubSaNGmCQYMGYdGiRUX2yc3Nxffff4+wsDA0btxYdm748OH48ssvcebMGenemqIEBATAy8sLQUFB+PTTT6HRaHDixAl8/PHHGDNmTLH116xZEyNGjMDMmTPRs2dP6TNzsrOzpc/DKaRSqUr10hsRET0buEOjcFZWVrCysirz+LCwMBQUFBR5ftu2bbh9+zZ69eqld65Ro0Zo1KhRiXZpVCoVfvvtN7i4uCAoKAiNGzfGzJkzMWbMGMyePfuJ4z/44AMkJSVh/fr1UltsbCycnJxkR4cOHZ44FxERPXsEURTFqi6CqCqkp6fD2toaV05uqdR3OZUE3+VERFQ+3KEhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFU1V1AURVzba+tlzfWE5ERFWPOzRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4pQ40cXFxlVEHERERUZmVOtAEBgaiQYMG+PTTT3H9+vXKqImIiIioVEodaG7cuIEPPvgAGzZsQP369REQEICffvoJOTk5lVEfUaW7uqoJkqPcq7oMIiIqh1IHGnt7e4wbNw4JCQk4evQoPD09MWrUKNSpUwcffvgh/vzzz8qok4iIiKhI5bopuEWLFggNDcUHH3yAzMxMREdHo2XLlujYsSPOnDlTUTUSERERFatMgSY3NxcbNmzAq6++CldXV/z6669YvHgxbt68iUuXLsHV1RX9+vWr6FqJiIiIDCr1l1OGhIRgzZo1EEURb731Fj777DM0btxYOm9ubo4vvvgCderUqdBCiYiIiIpS6kBz9uxZfP311+jduzfUarXBPvb29nx7NxERET01pX7JaebMmejXr59emMnLy8P+/fsBACqVCr6+vhVTIREREdETlDrQaLVa3LlzR689LS0NWq22QooiIiIiKo1SBxpRFCEIgl777du3YW5uXiFFEREREZVGie+h6d27NwBAEAQEBwfLXnLKz8/HqVOn0L59+4qvkIiIiOgJShxorK2tATzcobG0tISZmZl0zsTEBG3btsWIESMqvkIiIiKiJyhxoImJiQEAuLm5YeLEiXx5iYiIiKqNMr3LSa1WY/fu3fjmm2+QkZEBAPjnn3+QmZlZ4QUSERERPUmpP4fm6tWrCAwMxLVr15CdnY2uXbvC0tIS8+bNQ3Z2NpYtW1YZdRIREREVqdQ7NGPGjMFLL72Eu3fvyu6j6dWrF/bs2VOhxREREVHpzZo1C82bN6/qMp6qUgeaAwcO4OOPP4aJiYms3c3NDTdu3KiwwoiIiJ5XqampCAkJQf369aFWq+Hs7IwePXpw46AYpQ40BQUFyM/P12v/+++/YWlpWSFFPY+e9MPr5uaGr776Surv5uYGQRBw5MgR2Txjx46Fn5+f9HjWrFkQBAGCIEClUsHe3h6dOnXCV199hezsbNlYPz8/qe+jx8iRI6U+j7ZbWVmhVatW2Lp1q2yelStXGpzH1NRU6hMcHIyePXsW+Xw8fr1FWbNmDYyNjTF69Ogn9iUiUoLk5GS0bNkSe/fuxeeff47ExETExsZCq9U+1X/rcnNzn9paFaHUgeaVV16R/aIRBAGZmZmYOXMmXn311Yqs7blR1h9eU1NTTJky5Ynz+/j4ICUlBdeuXUNcXBz69euH8PBwtG/fXrqpu9CIESOQkpIiOz777DNZn5iYGKSkpOD48eN4+eWX0bdvXyQmJsr6WFlZ6c1z9erVUjwrJRMVFYXJkydjzZo1yMrKqvD5iYietlGjRkEQBMTHx6NPnz7w9PSEj48Pxo8fL/1P7LVr1/DGG2/AwsICVlZW6N+/P27evFnknAUFBQgLC0O9evWgVqvRvHlzxMbGSueTk5MhCALWrVsHX19fmJqa4scff6z0a61IpQ408+fPx6FDh/DCCy8gKysLb775pvRy07x58yqjxmdeSX54DXn33Xdx5MgR/PLLL8XOr1KpoNFoUKdOHTRp0gQhISHYt28fTp8+rfd3VrNmTWg0GtlhZWUl62NjYwONRgNPT0/Mnj0beXl5el9GKgiC3jy1a9cu5TNTvCtXruD333/H1KlT4enpiU2bNhXbPzs7G+np6bKDiKg6uXPnDmJjYzF69GiDH49iY2ODgoICvPHGG7hz5w727duHXbt24a+//sKAAQOKnHfhwoWYP38+vvjiC5w6dQoBAQF4/fXXcfHiRVm/qVOnYsyYMUhKSkJAQECFX19lKnWgqVevHv78809MmzYN48aNw4svvoiIiAicPHkSjo6OlVHjM60kP7xFcXd3x8iRIxEaGoqCgoJSrevt7Y1u3bo9MQQUJy8vD1FRUQCgd0/V0xATE4Pu3bvD2toagwcPlmopSnh4OKytraXD2dkZAGDZYRGs/FY8jZKJiIp16dIliKIIb2/vIvvs2bMHiYmJWL16NVq2bIk2bdpg1apV2LdvH44dO2ZwzBdffIEpU6Zg4MCB8PLywrx589C8eXO9l/bHjh2L3r17w93dHU5OThV5aZWu1IEGePh//IMHD8Znn32GpUuXYvjw4bJ3PFHJleSHtzgff/wxrly5UqatQW9vbyQnJ8vali5dCgsLC9nx+NxBQUGwsLCAWq3GuHHj4Obmhv79+8v6pKWl6c3TrVu3UtdYlIKCAqxcuRKDBw8GAAwcOBAHDx7ElStXihwTGhqKtLQ06bh+/XqF1UNEVBFEUXxin6SkJDg7O0v/UwYAL7zwAmxsbJCUlKTXPz09Hf/88w9efvllWfvLL7+s1/+ll14qY+VVr0SfQ7Nt2zZ069YNNWrUwLZt24rt+/rrr1dIYc+LkvzwFsfBwQETJ07EjBkzit1uLGrtx79odNCgQfjoo49kbY+/VLRgwQL4+/vjr7/+wrhx47Bo0SLY2trK+lhaWuLEiROytooMvbt27cL9+/el+7bs7e3RtWtXREdHY/bs2QbHqNVq2XeQERFVNw0bNoQgCDh37lyVrK/kbwEoUaDp2bMnUlNT4ejoWOw7UwRBMPgOKCpaRfzwjh8/HkuXLsXSpUtLNS4pKQnu7u6yNmtra3h4eBQ7TqPRwMPDAx4eHoiJicGrr76Ks2fPyl5yNDIyeuI85REVFYU7d+7IQlJBQQFOnTqFTz75BEZGZdp8JCKqUra2tggICMCSJUvw4Ycf6gWMe/fuoVGjRrh+/TquX78u7dKcPXsW9+7dwwsvvKA3p5WVFerUqYNDhw7B19dXaj906BBat25duRf0FJXoX/2CggLpl1VBQUGRB8NM6T36w3v//n298/fu3XviHBYWFpg+fTrmzJmj966lopw7dw6xsbHo06dPaUuWad26NVq2bIk5c+aUa57SuH37NrZu3Yq1a9ciISFBOk6ePIm7d+/it99+e2q1EBFVtCVLliA/Px+tW7fGxo0bcfHiRSQlJWHRokVo164d/P390aRJEwwaNAgnTpxAfHw83n77bfj6+hb5ktGkSZMwb948rFu3DufPn8fUqVORkJCAMWPGPOWrqzyl+uqD3NxcBAYGYtmyZWjYsGFl1fTcWbJkCV5++WW0bt0aYWFhaNq0KfLy8rBr1y5ERkYafE30ce+++y4WLFiA1atXo02bNrJzeXl5SE1NRUFBAW7fvg2dTodPP/0UzZs3x6RJk2R9//vvP6Smpsra1Go1atWqVeTaY8eORa9evTB58mTUrVsXwMOXsx6fBwAcHR2l3ZO0tDQkJCTIztvZ2Un/x3Hjxg29866urvj+++9hZ2eH/v37671k9uqrryIqKgqBgYFF1ktEVJ3Vr18fJ06cwJw5czBhwgSkpKTAwcEBLVu2RGRkJARBwNatWxESEoJOnTrByMgIgYGB+Prrr4uc88MPP0RaWhomTJiAW7du4YUXXsC2bduerd/lYinZ29uLFy5cKO0weoJ//vlHHD16tOjq6iqamJiIdevWFV9//XUxLi5OFEVRdHV1FRcsWCD1f/yxKIri6tWrRQCir6+v1DZz5kwRgAhANDY2Fm1tbcUOHTqICxYsELOysmTjfX19pb6PHgEBAVIfAOLmzZtl4woKCkRvb2/x/fffF0VRFGNiYgzOA0BMSUkRRVEUhwwZYvD8sGHDpOszdP77778XmzRpIo4aNcrg87hu3TrRxMRE/Pfff5/4nKelpYkAxCsnt4i3L+16Yn8iIqq+BFEs3V2p48aNg1qtRkRERPmSFFEVS09Ph7W1Na6c3AIrS3PYNvCv6pKIiKiMSv1t23l5eYiOjsbu3bvRsmVLvRuWvvzyyworjoiIiKgkSh1oTp8+jRYtWgAALly4IDv3+P0MRERERE9DqQPN4x9xT0RERFTV+GEdREREpHil3qEBgOPHj+Onn37CtWvXkJOTIztXnu8GIiIiIiqLUu/QrF27Fu3bt0dSUhI2b96M3NxcnDlzBnv37oW1tXVl1EhERERUrFIHmrlz52LBggXYvn07TExMsHDhQpw7dw79+/eHi4tLZdRIREREVKxSB5rLly+je/fuAAATExPcv38fgiBg3LhxWL58eYUXSERERPQkpb6HplatWtL3BdWtWxenT59GkyZNcO/ePfz3338VXiAREdHTlBzl/uROFcRt2JWnttazrsQ7NKdPnwYAdOrUCbt27QIA9OvXD2PGjMGIESMQFBSELl26VE6VREREJLl+/TqGDh2KOnXqwMTEBK6urhgzZgxu374t9fHz84MgCBAEAaampvD09ER4eDgMfUHA4cOHYWxsLL0C86jk5GQIggBHR0e9L0Bu3rw5Zs2aJWu7dOkShg4dChcXF6jVatStWxddunTBjz/+iLy8PKlfYW2PH2vXri3Tc1LiQNO0aVO0adMGTZo0Qb9+/QAAH330EcaPH4+bN2+iT58+iIqKKlMRREREVDJ//fUXXnrpJVy8eBFr1qzBpUuXsGzZMuzZswft2rXDnTt3pL4jRoxASkoKzp8/j9DQUMyYMQPLli3TmzMqKgohISHYv38//vnnH4PrZmRk4Isvvii2tvj4eLRo0QJJSUlYsmQJTp8+DZ1Oh+HDhyMyMhJnzpyR9Y+JiUFKSors6NmzZ+mfFAAl/i6nAwcOICYmBhs2bEBBQQH69OmD4cOHo2PHjmVamKiqFX6XU1paGqysrKq6HCKqJqr7S07dunXD6dOnceHCBZiZmUntqampaNCgAd5++21ERkbCz88PzZs3x1dffSX1admyJVxdXWUfsZKZmQknJyccP34cM2fORNOmTTFt2jTpfHJyMtzd3TFp0iRERkbi8uXLcHR0BPBwh6Znz56YNWsWRFGEj48Patasifj4eBgZ6e+ZiKIofauAIAjYvHlzmQPM40q8Q9OxY0dER0cjJSUFX3/9NZKTk+Hr6wtPT0/MmzcPqampFVIQERERGXbnzh38+uuvGDVqlCzMAIBGo8GgQYOwbt06vZeVRFHEgQMHcO7cOZiYmMjO/fTTT/D29oaXlxcGDx6M6Ohogy9LBQUFwcPDA2FhYQZrS0hIQFJSEiZOnGgwzACV+xVJpX6Xk7m5Od555x3s27cPFy5cQL9+/bBkyRK4uLjg9ddfr4waiYiICMDFixchiiIaNWpk8HyjRo1w9+5d/PvvvwCApUuXwsLCAmq1Gp06dUJBQQE+/PBD2ZioqCgMHjwYABAYGIi0tDTs27dPb25BEBAREYHly5fj8uXLeucLv9/Ry8tLart16xYsLCykY+nSpbIxQUFBsvMWFha4du1aKZ6R/1eurz7w8PDAtGnT8PHHH8PS0hI///xzeaYjIiKiEijh3SIYNGgQEhIScOjQIXTr1g0fffQR2rdvL50/f/484uPjERQUBABQqVQYMGBAkffEBgQEoEOHDpg+fXqJ1rezs0NCQgISEhJgY2Oj9+0CCxYskM4XHnXq1CnR3I8r01cfAMD+/fsRHR2NjRs3wsjICP3798ewYcPKOh0RERE9gYeHBwRBQFJSEnr16qV3PikpCbVq1YKDgwMAwNraGh4eHgAevrTk4eGBtm3bwt/fH8DD3Zm8vDxZiBBFEWq1GosXLzb4DQARERFo164dJk2aJGtv2LAhgIch6cUXXwQAGBsbS+urVPqRQ6PRSOfLq1Q7NP/88w/mzp0LT09P+Pn54dKlS1i0aBH++ecfrFixAm3btq2QooiIiEifnZ0dunbtiqVLl+LBgweyc6mpqfjxxx8xYMAAg/eqWFhYYMyYMZg4cSJEUUReXh5WrVqF+fPny3ZI/vzzT9SpUwdr1qwxWEPr1q3Ru3dvTJ06Vdb+4osvwtvbG1988QUKCgoq7qJLqMQ7NN26dcPu3bthb2+Pt99+G0OHDpW9TkZERESVb/HixWjfvj0CAgLw6aefwt3dHWfOnMGkSZNQt25dzJkzp8ix7733HmbPno2NGzdCpVLh7t27GDZsmN5OTOFHsYwcOdLgPHPmzIGPj49s10UQBMTExKBr1654+eWXERoaikaNGiE3Nxf79+/Hv//+C2NjY9k89+7d03tTkaWlJczNzUv7tABiCfXo0UPcsmWLmJeXV9IhRNVaWlqaCEBMS0ur6lKIiEolOTlZHDJkiFi7dm2xRo0aorOzsxgSEiL+73//k/r4+vqKY8aM0Rv73nvviT4+PuJrr70mvvrqqwbnP3r0qAhA/PPPP8UrV66IAMSTJ0/K+rz77rsiAHHmzJmy9vPnz4tDhgwR69WrJ6pUKtHa2lrs1KmT+M0334i5ublSPwAGj/Dw8DI9JyX+HBqiZw0/h4aI6NlRrnc5EREREVUHZX6XE9Gz4uqqJrA008/2/NI4IiLl4A4NERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4/h4aIiOgRdy7vfmpr2Tbwf2prPeu4Q0NERKQQy5Ytg6WlJfLy8qS2zMxM1KhRA35+frK+Op0OgiDg8uXLcHNzw1dffaU336xZs9C8eXODj93c3CAIQpFHcHAwABR5fu3atRV89cXjDg0REZFCaLVaZGZm4vjx42jbti0A4MCBA9BoNDh69CiysrJgamoKAIiLi4OLiwsaNGhQprWOHTuG/Px8AMDvv/+OPn364Pz589J335mZmUl9Y2JiEBgYKBtvY2NTpnXLioGGiIhIIby8vODk5ASdTicFGp1OhzfeeAN79+7FkSNHpJ0anU4HrVZb5rUcHBykP9va2gIAHB0dDQYVGxsbaDSaMq9VEfiSExERkYJotVrExcVJj+Pi4uDn5wdfX1+p/cGDBzh69Gi5Ao3SMNAQEREpiFarxaFDh5CXl4eMjAycPHkSvr6+6NSpE3Q6HQDg8OHDyM7OlgWaKVOmwMLCQnbMnTu3QmoKCgrSm/vatWsVMndJ8SUnIiIiBfHz88P9+/dx7Ngx3L17F56ennBwcICvry/eeecdZGVlQafToX79+nBxcZHGTZo0SbqRt9CiRYuwf//+cte0YMEC+PvL37FVp06dcs9bGtyheQYEBwcbvMP80qVLAIDw8HAYGxvj888/1xu7cuVK2euhK1eulMYbGRnByckJAwYMwLVr1yCKIvz9/REQEKA3z9KlS2FjYwN/f/9i74p3c3OTxpSmrpJe8+M3pRERPWs8PDxQr149xMXFIS4uDr6+vgAeBghnZ2f8/vvviIuLQ+fOnWXj7O3t4eHhITsK740pL41Goze3SvV090wYaJ4RgYGBSElJkR3u7u4AgOjoaEyePBnR0dElmsvKygopKSm4ceMGNm7ciPPnz6Nfv34QBAExMTE4evQovvnmG6n/lStXMHnyZHz99dfYuHGjrAbg4d3vhY+PHTsmjSttXSW55jVr1pRpLiIiJdFqtdDpdNDpdLK3a3fq1Ak7d+5EfHz8c3X/DMBA88xQq9XQaDSyw9jYGPv27cODBw8QFhaG9PR0/P7770+cSxAEaDQaODk5oX379hg2bBji4+ORnp4OZ2dnLFy4EBMnTsSVK1cgiiKGDRuGV155BW+99Rasra1lNQD/f/e7RqOR7povS10lueZatWqVeh4iIqXRarU4ePAgEhISpB0aAPD19cU333yDnJycpxpo7t27h9TUVNlx//79p7Y+wHtonnlRUVEICgpCjRo1EBQUhKioKLRv377E42/duoXNmzfD2NgYxsbGAIAhQ4Zg8+bNGDp0KHr37o3Tp0/jzJkzT7WussjOzkZ2drb0OD09vVLXIyJlUsKn92q1Wjx48ADe3t6oXbu21O7r64uMjAzp7d1PyzvvvKPXFh4ejqlTpz61GiCS4g0ZMkQ0NjYWzc3NpaNv375iWlqaaGZmJiYkJIiiKIonT54ULSwsxIyMDGlsTEyMaG1tLXsMQDQ3Nxdr1qwpAhABiB9++KFszZs3b4r29vaikZGRuHnz5iJrA6B3vix1leSazc3NxTlz5hQ5ZubMmdL1PHpcOblFvH1pV5HjiIio+uMOzTNCq9UiMjJSemxubo41a9agQYMGaNasGQCgefPmcHV1xbp16zBs2LAi57K0tMSJEyeQm5uLnTt34scff8ScOXNkfRwdHfHee+9hy5Yt6NmzZ6lqLWtdj3v8mgEUe4NbaGgoxo8fLz0ufAmNiIiUj4HmGWFubg4PDw9ZW1RUFM6cOSO707ygoADR0dHFBgcjIyNprkaNGuHy5ct4//338f3338v6qVSqMt3FXta6HmfomoujVquhVqtLVSsRESkDA80zKjExEcePH4dOp5PtWty5cwd+fn44d+4cvL29SzTX1KlT0aBBA4wbNw4tWrSoNnUREREVYqB5RkVFRaF169bo1KmT3rlWrVohKirK4Oe/GOLs7IxevXphxowZ2LFjx1OrKz8/HwkJCbI+arUajRo1AvDwJt/U1FTZeZVKBXt7+3LVSEREysO3bT+DcnJy8MMPP6BPnz4Gz/fp0werVq1Cbm5uieccN24cfv75Z8THxz+1ujIzM/Hiiy/Kjh49ekj9Y2Nj4eTkJDs6dOhQ5vqIiEi5BFEUxaougqgqpKenw9raGldOboGVpbki3qpJRESGcYeGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUT1XVBRBVNdv6WlhZWVV1GUREVA7coSEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgISIiIsVjoCEiIiLFY6AhIiIixWOgoefe1VVNkBzlXtVlEBFROTDQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQEBERkeIx0BAREZHiMdAQERGR4jHQKFRwcDAEQZAOOzs7BAYG4tSpU7J+giBgy5YteuOTk5MhCAISEhL0zvn5+WHs2LHSYzc3N9lahUdERESR8xZ3zJ49G+bm5rh06ZJs7D///INatWph8eLFeuuam5ujRYsWWL9+vdR/1qxZBuf39vYuxTNJRETPAgYaBQsMDERKSgpSUlKwZ88eqFQqvPbaa5WyVlhYmLRW4RESEqLXz9nZWdZnwoQJ8PHxkbVNnDgRAQEBCA4ORkFBgTR2xIgRaNmyJUaPHq237smTJ9GqVSsMGDAAv//+u3T+8blTUlJw8ODBSnkOiIio+lJVdQFUdmq1GhqNBgCg0WgwdepUdOzYEf/++y8cHBwqdC1LS0tpreIYGxvL+llYWEClUumN/eabb+Dj44Mvv/wSEydOxMqVK3Ho0CEkJiZCEAS9dTUaDZYsWYIffvgB27dvR/v27QHA4NxFyc7ORnZ2tvQ4PT29ROOIiKj6Y6B5RmRmZuKHH36Ah4cH7OzsqrqcJ3JwcMDy5csRFBSEZs2aYdy4cVi4cCGcnZ2LHKNSqVCjRg3k5OSUac3w8HB88skneu2ubyfCysqqTHMSEVH1wJecFGzHjh2wsLCAhYUFLC0tsW3bNqxbtw5GRhX/1zplyhRprcLjwIED5ZqzZ8+e6N+/PwIDA+Hr64shQ4YU2TcnJwfh4eFIS0tD586dpfbExES9ukaOHGlwjtDQUKSlpUnH9evXy1U/ERFVH9yhUTCtVovIyEgAwN27d7F06VJ069YN8fHxcHV1rdC1Jk2ahODgYFlb3bp1yz3v9OnTsWrVKnz88ccGz0+ZMgUff/wxsrKyYGFhgYiICHTv3l067+XlhW3btsnGFLXbolaroVary10zERFVPww0CmZubg4PDw/p8bfffgtra2usWLECn376abFjC3/pp6Wl6Z27d+8erK2tZW329vaytSqKSqWS/fdxhUHKwsICtWvXlt1fAwAmJiaVUhcRESkLX3J6hgiCACMjIzx48OCJfW1tbWFvb48//vhD1p6eno5Lly7B09OzssoslcIgpdFo9MIMERFRIe7QKFh2djZSU1MBPHzJafHixcjMzESPHj1k/a5cuaL3eTMNGzbE+PHjMXfuXNSuXRtt27bF7du3MXv2bDg4OKB3796y/hkZGdJahWrWrFnlN9Pm5eXp1SUIAmrXrl1FFRERUVVgoFGw2NhYODk5AXj49mZvb2+sX78efn5+sn7jx4/XG3vgwAFMnjwZFhYWmDdvHi5fvgxbW1u8/PLLiIuLg5mZmaz/jBkzMGPGDFnbe++9h2XLllXsRZXSmTNnpOegkFqtRlZWVhVVREREVUEQRVGs6iKIqkJ6ejqsra2RlpZW5TtNRERUPryHhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+Bhp57V1c1QXKUe1WXQURE5cBAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BDREREisdAQ0RERIrHQENERESKx0BTCsHBwejZs6esbcOGDTA1NcX8+fOlPoIgICIiQtZvy5YtEARBerxy5UrY2NgYXEcQBGzZskXWtnHjRvj5+cHa2hoWFhZo2rQpwsLCcOfOnSLnS0pKgrOzM/r164ecnJxi13y09sePwMDAIsfMmjULzZs312tPTk6GIAhISEiQPTZ0HDlyRDb2wYMHsLW1hb29PbKzs/XmdnNzk8aamZnBzc0N/fv3x969e4usk4iInm0MNOXw7bffYtCgQYiMjMSECROkdlNTU8ybNw93796tkHU++ugjDBgwAK1atcLOnTtx+vRpzJ8/H3/++Se+//57g2OOHTuGjh07IjAwEOvWrYOJiUmJ1goMDERKSorsWLNmTYVcBwDs3r1bb/6WLVvK+mzcuBE+Pj7w9vbWC3aFwsLCkJKSgvPnz2PVqlWwsbGBv78/5syZU2G1EhGRcqiqugCl+uyzzzBz5kysXbsWvXr1kp3z9/fHpUuXEB4ejs8++6xc68THx2Pu3Ln46quvMGbMGKndzc0NXbt2xb179/TG7N27F2+88QZGjRqFefPmlWo9tVoNjUZTrpqLY2dn98T5o6KiMHjwYIiiiKioKAwYMECvj6WlpTSPi4sLOnXqBCcnJ8yYMQN9+/aFl5dXpdRPRETVE3doymDKlCmYPXs2duzYoRdmAMDY2Bhz587F119/jb///rtca/3444+wsLDAqFGjDJ5//CWkzZs3o3v37vj4449LHWaqg8uXL+Pw4cPo378/+vfvjwMHDuDq1aslGjtmzBiIooitW7caPJ+dnY309HTZQUREzwYGmlLauXMnPvvsM2zduhVdunQpsl+vXr3QvHlzzJw5s1zrXbx4EfXr10eNGjWe2DczMxP9+vXDpEmTMGXKlDKtt2PHDlhYWMiOuXPnFjsmMTFRb4yPj4/Bvu3bt9fr+6jo6Gh069YNtWrVgq2tLQICAhATE1Oi2m1tbeHo6Ijk5GSD58PDw2FtbS0dzs7OAADXtxPhNuxKidYgIqLqiS85lVLTpk3xv//9DzNnzkTr1q31fiE/at68eejcuTMmTpxY5vVEUSxxXzMzM3To0AErVqxAUFAQGjVqVOr1tFotIiMjZW22trbFjvHy8sK2bdtkbTdu3ICfn59e33Xr1hVZV35+Pr777jssXLhQahs8eDAmTpyIGTNmwMjoyflbFEXZzdePCg0Nxfjx46XH6enpUqghIiJlY6Appbp162LDhg3QarUIDAzEzp07YWlpabBvp06dEBAQgNDQUAQHB8vOWVlZ4f79+ygoKJD9oi68J8ba2hoA4OnpiYMHDyI3N/eJuzTGxsbYsmULevfuDa1Wi7i4uFKHGnNzc3h4eJRqjImJid4Ylcrwj5azs3OR8//666+4ceOG3j0z+fn52LNnD7p27VpsHbdv38a///4Ld3d3g+fVajXUanWxcxARkTLxJacycHV1xb59+5CamorAwEBkZGQU2TciIgLbt2/H4cOHZe1eXl7Iy8uT3tZc6MSJEwAeBhkAePPNN5GZmYmlS5canP/xm4LVajU2bdqEVq1aQavV4uzZs6W8uqoTFRWFgQMHIiEhQXYMHDgQUVFRTxy/cOFCGBkZ6b21noiInn3coSkjZ2dn6HQ6aLVaBAQEIDY2FlZWVnr9mjRpgkGDBmHRokWydh8fH7zyyisYOnQo5s+fj/r16+P8+fMYO3YsBgwYgLp16wIA2rRpg8mTJ2PChAm4ceMGevXqhTp16uDSpUtYtmwZOnToIHv3E/Aw1GzcuBH9+vWDVqvF3r17pXta8vPz9UKUWq2WdnKys7ORmpoqO69SqWBvb1+u56vQ7du39ea3sbFBRkYGtm/fjm3btqFx48ay82+//TZ69eqFO3fuSC9/ZWRkIDU1Fbm5ubhy5Qp++OEHfPvttwgPDy/1DhMRESkfA0051KtXTxZqfv31V4P9wsLCsG7dOr32devWYebMmXjvvffwzz//oF69eujVqxemT58u6zdv3jy0bNkSS5YswbJly1BQUIAGDRqgb9++GDJkiME1TUxMsGHDBvTv318KNcDDG4dffPFFWd8GDRrg0qVLAIDY2Fg4OTnJznt5eeHcuXMle1KewN/fX69tzZo1uHHjBszNzQ3eaN2lSxeYmZnhhx9+wIcffggAmDFjBmbMmAETExNoNBq0bdsWe/bsgVarrZA6iYhIWQSxNHedEj1D0tPTYW1tjbS0NIO7a0REpBy8h4aIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUr0oDTXBwMHr27KnXrtPpIAgC7t27J7Xl5+djwYIFaNKkCUxNTVGrVi1069YNhw4dkvqcO3cOgiDgyJEjsvnatm0LU1NTZGVlSW1ZWVkwNTVFVFSUVIsgCBAEATVq1EDt2rXRtWtXREdHo6CgQDafm5ub1PfRIyIiAgCQnJwMQRDg6OiIjIwM2djmzZtj1qxZBp+P8tZfkufy0cePXrOhw83NDQDg5+dn8PzIkSMNXkdxcwqCAK1Wixo1auDgwYOycffv30f9+vUxceJEvXVNTU3xwgsvYOnSpVL/lStXGpzf1NTUYF1ERPTsUsQOjSiKGDhwIMLCwjBmzBgkJSVBp9PB2dkZfn5+2LJlCwDA29sbGo0GOp1OGpuRkYETJ07AwcFBFhQOHz6M7OxsdO7cWWoLDAxESkoKkpOTsXPnTmi1WowZMwavvfYa8vLyZDWFhYUhJSVFdoSEhMj6ZGRk4IsvvijxdZa3/tJauHChrH4AiImJkR4fO3ZM6jtixAi96/3ss88Mzvton6+++gpWVlaytu3btyMkJATBwcG4f/++NG7y5MkwMzPDp59+qrfu2bNn0b9/f4wePRpr1qyRzj8+d0pKCq5evVrm54SIiJRJEYHmp59+woYNG7Bq1SoMHz4c7u7uaNasGZYvX47XX38dw4cPl34xarVaWSA4ePAgPD090aNHD1m7TqeDq6sr3N3dpTa1Wg2NRoO6deuiRYsWmDZtGrZu3YqdO3di5cqVsposLS2h0Whkh7m5uaxPSEgIvvzyS9y6davE11qe+kvL2tpaVj8A2NjYSI8dHBykvjVr1tS7XisrK4PzPtrH2toagiDI2iwsLDB37lyYmJhgypQpAIC4uDh8++23WLVqlWyHpXDd+vXrY9asWWjYsCG2bdsmnX98bo1Gg9q1axusKzs7G+np6bKDiIieDYoINKtXr5Z+qT9uwoQJuH37Nnbt2gXgYSA4ePCgtKMSFxcHPz8/+Pr6Ii4uThoXFxcHrVb7xLU7d+6MZs2aYdOmTaWuOygoCB4eHggLCyvxmIquv7oyNTXFqlWrsHz5cmzduhVDhw7FtGnT0LJly2LHmZmZIScnp0xrhoeHw9raWjqcnZ0BAHf+isOdy7sr9CAioqerygPNjh07YGFhITu6desm63PhwgU0atTI4PjC9gsXLgB4GAju378vvVyi0+ng6+uLTp064ejRo8jKysKDBw8QHx9f4kDg7e2N5ORkWduUKVP06j5w4ICsT+F9NcuXL8fly5dLtFZ56i/Jc1lWS5cu1Zv7xx9/LNecL730EkJDQ9G7d2/Y2dnho48+KrJvfn4+fvjhB5w6dUr2MltaWlqJrzk0NBRpaWnScf369XLVT0RE1YeqqgvQarWIjIyUtR09ehSDBw+WtYmiWKL5PDw8UK9ePeh0Ovj4+ODkyZPw9fWFo6MjXFxccPjwYYiiiOzs7BIHGlEUIQiCrG3SpEkIDg6WtdWtW1dvbEBAADp06IDp06dj9erVlVp/SZ/Lshg0aJBe4CjqpZ3SmD59OsLCwjB16lSoVPo/jkuXLsW3336LnJwcGBsbY9y4cXj//fel85aWljhx4oRsjJmZmcG11Go11Gp1uWsmIqLqp8oDjbm5OTw8PGRtf//9t+yxp6cnkpKSDI4vbPf09JTa/Pz8EBcXh6ZNm6Jhw4ZwdHQEAOllG1EU4eHhIb3k8CRJSUl696rY29vr1V2UiIgItGvXDpMmTSpR/7LWX5Lnsqysra1LfL2lURhiDIUZ4P+DlJmZGZycnGBkJN9UNDIyqpS6iIhIWar8JaeSGDhwIC5evIjt27frnZs/fz7s7OzQtWtXqU2r1eL333/Hrl274OfnJ7V36tQJOp0OOp2uxLsze/fuRWJiIvr06VPm+lu3bo3evXtj6tSpJepfkfUrXWGQqlu3rl6YISIiKlTlOzQlMXDgQKxfvx5DhgzB559/ji5duiA9PR1LlizBtm3bsH79etk7jArvQ4mOjsaKFSukdl9fXwwfPhwAMGrUKL11srOzkZqaivz8fNy8eROxsbEIDw/Ha6+9hrffflvWNyMjA6mpqbK2mjVrFvnOnzlz5sDHx6fInYhHlbX+yvTff//pXa9arUatWrWeah2PE0VRry4AcHR0ZAAiInqOKOJffEEQ8NNPP2HatGlYsGABvLy80LFjR1y9ehU6nU7vA+Xc3d3h6uqKjIwM+Pr6Su0uLi6oU6cOcnJyZDsfhWJjY+Hk5AQ3NzcEBgYiLi4OixYtwtatW2FsbCzrO2PGDDg5OcmOyZMnF3kNnp6eGDp0qOzD8YpS1vor04oVK/SuNygo6KnWYEh6erpeXU5OTqV6qzwRESmfIJb0bluiZ0x6ejqsra1x5eQWWFmaP3lAKdg28K/Q+YiIqHiK2KEhIiIiKg4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESkeAw0REREpHgMNERERKR4DDRERESmeIr5tm6gy2dbXFvkt6UREpAzcoSEiIiLFY6AhIiIixWOgISIiIsXjPTT03BJFEQCQnp5exZUQ0dNmaWkJQRCqugyqQAw09Ny6ffs2AMDZ2bmKKyGipy0tLY1vBnjGMNDQc8vW1hYAcO3aNVhbW1dxNSWXnp4OZ2dnXL9+XTH/ICuxZkCZdSuxZuDp121paVnpa9DTxUBDzy0jo4e3kFlbWyvqH/5CVlZWiqtbiTUDyqxbiTUDyq2bqh5vCiYiIiLFY6AhIiIixWOgoeeWWq3GzJkzoVarq7qUUlFi3UqsGVBm3UqsGVBu3VR9CGLhe1eJiIiIFIo7NERERKR4DDRERESkeAw0REREpHgMNERERKR4DDT03FqyZAnc3NxgamqKNm3aID4+vspq2b9/P3r06IE6depAEARs2bJFdl4URcyYMQNOTk4wMzODv78/Ll68KOtz584dDBo0CFZWVrCxscGwYcOQmZlZaTWHh4ejVatWsLS0hKOjI3r27Inz58/L+mRlZWH06NGws7ODhYUF+vTpg5s3b8r6XLt2Dd27d0fNmjXh6OiISZMmIS8vr9LqjoyMRNOmTaUPcGvXrh127txZrWt+XEREBARBwNixY6t13bNmzYIgCLLD29u7WtdMCiYSPYfWrl0rmpiYiNHR0eKZM2fEESNGiDY2NuLNmzerpJ5ffvlF/Oijj8RNmzaJAMTNmzfLzkdERIjW1tbili1bxD///FN8/fXXRXd3d/HBgwdSn8DAQLFZs2bikSNHxAMHDogeHh5iUFBQpdUcEBAgxsTEiKdPnxYTEhLEV199VXRxcREzMzOlPiNHjhSdnZ3FPXv2iMePHxfbtm0rtm/fXjqfl5cnNm7cWPT39xdPnjwp/vLLL6K9vb0YGhpaaXVv27ZN/Pnnn8ULFy6I58+fF6dNmybWqFFDPH36dLWt+VHx8fGim5ub2LRpU3HMmDFSe3Wse+bMmaKPj4+YkpIiHf/++2+1rpmUi4GGnkutW7cWR48eLT3Oz88X69SpI4aHh1dhVQ89HmgKCgpEjUYjfv7551LbvXv3RLVaLa5Zs0YURVE8e/asCEA8duyY1Gfnzp2iIAjijRs3nkrdt27dEgGI+/btk2qsUaOGuH79eqlPUlKSCEA8fPiwKIoPg5yRkZGYmpoq9YmMjBStrKzE7Ozsp1K3KIpirVq1xG+//bba15yRkSE2bNhQ3LVrl+jr6ysFmupa98yZM8VmzZoZPFddaybl4ktO9NzJycnBH3/8AX9/f6nNyMgI/v7+OHz4cBVWZtiVK1eQmpoqq9fa2hpt2rSR6j18+DBsbGzw0ksvSX38/f1hZGSEo0ePPpU609LSAPz/l37+8ccfyM3NldXt7e0NFxcXWd1NmjRB7dq1pT4BAQFIT0/HmTNnKr3m/Px8rF27Fvfv30e7du2qfc2jR49G9+7dZfUB1fu5vnjxIurUqYP69etj0KBBuHbtWrWvmZSJX05Jz53//e9/yM/Pl/0jCQC1a9fGuXPnqqiqoqWmpgKAwXoLz6WmpsLR0VF2XqVSwdbWVupTmQoKCjB27Fi8/PLLaNy4sVSTiYkJbGxsiq3b0HUVnqssiYmJaNeuHbKysmBhYYHNmzfjhRdeQEJCQrWtee3atThx4gSOHTumd666Ptdt2rTBypUr4eXlhZSUFHzyySfo2LEjTp8+XW1rJuVioCGichs9ejROnz6NgwcPVnUpJeLl5YWEhASkpaVhw4YNGDJkCPbt21fVZRXp+vXrGDNmDHbt2gVTU9OqLqfEunXrJv25adOmaNOmDVxdXfHTTz/BzMysCiujZxFfcqLnjr29PYyNjfXeTXHz5k1oNJoqqqpohTUVV69Go8GtW7dk5/Py8nDnzp1Kv6YPPvgAO3bsQFxcHOrVqyerOycnB/fu3Su2bkPXVXiuspiYmMDDwwMtW7ZEeHg4mjVrhoULF1bbmv/44w/cunULLVq0gEqlgkqlwr59+7Bo0SKoVCrUrl27Wtb9OBsbG3h6euLSpUvV9rkm5WKgoeeOiYkJWrZsiT179khtBQUF2LNnD9q1a1eFlRnm7u4OjUYjqzc9PR1Hjx6V6m3Xrh3u3buHP/74Q+qzd+9eFBQUoE2bNpVSlyiK+OCDD7B582bs3bsX7u7usvMtW7ZEjRo1ZHWfP38e165dk9WdmJgoC2O7du2ClZUVXnjhhUqp25CCggJkZ2dX25q7dOmCxMREJCQkSMdLL72EQYMGSX+ujnU/LjMzE5cvX4aTk1O1fa5Jwar6rmSiqrB27VpRrVaLK1euFM+ePSu+++67oo2NjezdFE9TRkaGePLkSfHkyZMiAPHLL78UT548KV69elUUxYdv27axsRG3bt0qnjp1SnzjjTcMvm37xRdfFI8ePSoePHhQbNiwYaW+bfv9998Xra2tRZ1OJ3tb7n///Sf1GTlypOji4iLu3btXPH78uNiuXTuxXbt20vnCt+W+8sorYkJCghgbGys6ODhU6ttyp06dKu7bt0+8cuWKeOrUKXHq1KmiIAjib7/9Vm1rNuTRdzlV17onTJgg6nQ68cqVK+KhQ4dEf39/0d7eXrx161a1rZmUi4GGnltff/216OLiIpqYmIitW7cWjxw5UmW1xMXFiQD0jiFDhoii+PCt29OnTxdr164tqtVqsUuXLuL58+dlc9y+fVsMCgoSLSwsRCsrK/Gdd94RMzIyKq1mQ/UCEGNiYqQ+Dx48EEeNGiXWqlVLrFmzptirVy8xJSVFNk9ycrLYrVs30czMTLS3txcnTJgg5ubmVlrdQ4cOFV1dXUUTExPRwcFB7NKlixRmqmvNhjweaKpj3QMGDBCdnJxEExMTsW7duuKAAQPES5cuVeuaSbkEURTFqtkbIiIiIqoYvIeGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiIiIFI+BhoiIiBSPgYaIiIgUj4GGiKgUkpOTIQgCEhISqroUInoEAw0REREpHgMNESlKQUEBPvvsM3h4eECtVsPFxQVz5swBACQmJqJz584wMzODnZ0d3n33XWRmZkpj/fz8MHbsWNl8PXv2RHBwsPTYzc0Nc+fOxdChQ2FpaQkXFxcsX75cOu/u7g4AePHFFyEIAvz8/CrtWomo5BhoiEhRQkNDERERgenTp+Ps2bNYvXo1ateujfv37yMgIAC1atXCsWPHsH79euzevRsffPBBqdeYP38+XnrpJZw8eRKjRo3C+++/j/PnzwMA4uPjAQC7d+9GSkoKNm3aVKHXR0Rlo6rqAoiISiojIwMLFy7E4sWLMWTIEABAgwYN0KFDB6xYsQJZWVlYtWoVzM3NAQCLFy9Gjx49MG/ePNSuXbvE67z66qsYNWoUAGDKlClYsGAB4uLi4OXlBQcHBwCAnZ0dNBpNBV8hEZUVd2iISDGSkpKQnZ2NLl26GDzXrFkzKcwAwMsvv4yCggJpd6WkmjZtKv1ZEARoNBrcunWr7IUTUaVjoCEixTAzMyvXeCMjI4iiKGvLzc3V61ejRg3ZY0EQUFBQUK61iahyMdAQkWI0bNgQZmZm2LNnj965Ro0a4c8//8T9+/eltkOHDsHIyAheXl4AAAcHB6SkpEjn8/Pzcfr06VLVYGJiIo0louqDgYaIFMPU1BRTpkzB5MmTsWrVKly+fBlHjhxBVFQUBg0aBFNTUwwZMgSnT59GXFwcQkJC8NZbb0n3z3Tu3Bk///wzfv75Z5w7dw7vv/8+7t27V6oaHB0dYWZmhtjYWNy8eRNpaWmVcKVEVFoMNESkKNOnT8eECRMwY8YMNGrUCAMGDMCtW7dQs2ZN/Prrr7hz5w5atWqFvn37okuXLli8eLE0dujQoRgyZAjefvtt+Pr6on79+tBqtaVaX6VSYdGiRfjmm29Qp04dvPHGGxV9iURUBoL4+AvKRERERArDHRoiIiJSPAYaIiIiUjwGGiIiIlI8BhoiIiJSPAYaIiIiUjwGGiIiIlI8BhoiIiJSPAYaIiIiUjwGGiIiIlI8BhoiIiJSPAYaIiIiUrz/A+sUfVTiRBWAAAAAAElFTkSuQmCC", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "import seaborn as sns\n", - "# Specify colors for each values of the hue variable\n", - "palette = {\n", - " 'ORANGE': 'orange',\n", - " 'WHITE': 'wheat',\n", - "}\n", - "# Plot a bar plot to visualize how many pumpkins of each variety are orange or white\n", - "sns.catplot(\n", - " data=pumpkins, y=\"Variety\", hue=\"Color\", kind=\"count\",\n", - " palette=palette, \n", - ")" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Pré-processamento de dados\n", - "\n", - "Vamos codificar as características e os rótulos para representar melhor os dados e treinar o modelo\n" - ] - }, - { - "cell_type": "code", - "execution_count": 66, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array(['med', 'lge', 'sml', 'xlge', 'med-lge', 'jbo', 'exjbo'],\n", - " dtype=object)" - ] - }, - "execution_count": 66, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Let's look at the different values of the 'Item Size' column\n", - "pumpkins['Item Size'].unique()" - ] - }, - { - "cell_type": "code", - "execution_count": 67, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import OrdinalEncoder\n", - "# Encode the 'Item Size' column using ordinal encoding\n", - "item_size_categories = [['sml', 'med', 'med-lge', 'lge', 'xlge', 'jbo', 'exjbo']]\n", - "ordinal_features = ['Item Size']\n", - "ordinal_encoder = OrdinalEncoder(categories=item_size_categories)" - ] - }, - { - "cell_type": "code", - "execution_count": 68, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import OneHotEncoder\n", - "# Encode all the other features using one-hot encoding\n", - "categorical_features = ['City Name', 'Package', 'Variety', 'Origin']\n", - "categorical_encoder = OneHotEncoder(sparse_output=False)" - ] - }, - { - "cell_type": "code", - "execution_count": 69, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
ord__Item Sizecat__City Name_ATLANTAcat__City Name_BALTIMOREcat__City Name_BOSTONcat__City Name_CHICAGOcat__City Name_COLUMBIAcat__City Name_DALLAScat__City Name_DETROITcat__City Name_LOS ANGELEScat__City Name_MIAMI...cat__Origin_MICHIGANcat__Origin_NEW JERSEYcat__Origin_NEW YORKcat__Origin_NORTH CAROLINAcat__Origin_OHIOcat__Origin_PENNSYLVANIAcat__Origin_TENNESSEEcat__Origin_TEXAScat__Origin_VERMONTcat__Origin_VIRGINIA
21.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
31.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.01.0
43.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
53.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
61.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00.0
\n", - "

5 rows × 48 columns

\n", - "
" - ], - "text/plain": [ - " ord__Item Size cat__City Name_ATLANTA cat__City Name_BALTIMORE \n", - "2 1.0 0.0 1.0 \\\n", - "3 1.0 0.0 1.0 \n", - "4 3.0 0.0 1.0 \n", - "5 3.0 0.0 1.0 \n", - "6 1.0 0.0 1.0 \n", - "\n", - " cat__City Name_BOSTON cat__City Name_CHICAGO cat__City Name_COLUMBIA \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_DALLAS cat__City Name_DETROIT cat__City Name_LOS ANGELES \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_MIAMI ... cat__Origin_MICHIGAN cat__Origin_NEW JERSEY \n", - "2 0.0 ... 0.0 0.0 \\\n", - "3 0.0 ... 0.0 0.0 \n", - "4 0.0 ... 0.0 0.0 \n", - "5 0.0 ... 0.0 0.0 \n", - "6 0.0 ... 0.0 0.0 \n", - "\n", - " cat__Origin_NEW YORK cat__Origin_NORTH CAROLINA cat__Origin_OHIO \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_PENNSYLVANIA cat__Origin_TENNESSEE cat__Origin_TEXAS \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_VERMONT cat__Origin_VIRGINIA \n", - "2 0.0 0.0 \n", - "3 0.0 1.0 \n", - "4 0.0 0.0 \n", - "5 0.0 0.0 \n", - "6 0.0 0.0 \n", - "\n", - "[5 rows x 48 columns]" - ] - }, - "execution_count": 69, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from sklearn.compose import ColumnTransformer\n", - "ct = ColumnTransformer(transformers=[\n", - " ('ord', ordinal_encoder, ordinal_features),\n", - " ('cat', categorical_encoder, categorical_features)\n", - " ])\n", - "# Get the encoded features as a pandas DataFrame\n", - "ct.set_output(transform='pandas')\n", - "encoded_features = ct.fit_transform(pumpkins)\n", - "encoded_features.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 70, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
ord__Item Sizecat__City Name_ATLANTAcat__City Name_BALTIMOREcat__City Name_BOSTONcat__City Name_CHICAGOcat__City Name_COLUMBIAcat__City Name_DALLAScat__City Name_DETROITcat__City Name_LOS ANGELEScat__City Name_MIAMI...cat__Origin_NEW JERSEYcat__Origin_NEW YORKcat__Origin_NORTH CAROLINAcat__Origin_OHIOcat__Origin_PENNSYLVANIAcat__Origin_TENNESSEEcat__Origin_TEXAScat__Origin_VERMONTcat__Origin_VIRGINIAColor
21.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
31.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.01.00
43.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
53.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
61.00.01.00.00.00.00.00.00.00.0...0.00.00.00.00.00.00.00.00.00
\n", - "

5 rows × 49 columns

\n", - "
" - ], - "text/plain": [ - " ord__Item Size cat__City Name_ATLANTA cat__City Name_BALTIMORE \n", - "2 1.0 0.0 1.0 \\\n", - "3 1.0 0.0 1.0 \n", - "4 3.0 0.0 1.0 \n", - "5 3.0 0.0 1.0 \n", - "6 1.0 0.0 1.0 \n", - "\n", - " cat__City Name_BOSTON cat__City Name_CHICAGO cat__City Name_COLUMBIA \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_DALLAS cat__City Name_DETROIT cat__City Name_LOS ANGELES \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__City Name_MIAMI ... cat__Origin_NEW JERSEY cat__Origin_NEW YORK \n", - "2 0.0 ... 0.0 0.0 \\\n", - "3 0.0 ... 0.0 0.0 \n", - "4 0.0 ... 0.0 0.0 \n", - "5 0.0 ... 0.0 0.0 \n", - "6 0.0 ... 0.0 0.0 \n", - "\n", - " cat__Origin_NORTH CAROLINA cat__Origin_OHIO cat__Origin_PENNSYLVANIA \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_TENNESSEE cat__Origin_TEXAS cat__Origin_VERMONT \n", - "2 0.0 0.0 0.0 \\\n", - "3 0.0 0.0 0.0 \n", - "4 0.0 0.0 0.0 \n", - "5 0.0 0.0 0.0 \n", - "6 0.0 0.0 0.0 \n", - "\n", - " cat__Origin_VIRGINIA Color \n", - "2 0.0 0 \n", - "3 1.0 0 \n", - "4 0.0 0 \n", - "5 0.0 0 \n", - "6 0.0 0 \n", - "\n", - "[5 rows x 49 columns]" - ] - }, - "execution_count": 70, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from sklearn.preprocessing import LabelEncoder\n", - "# Encode the 'Color' column using label encoding\n", - "label_encoder = LabelEncoder()\n", - "encoded_label = label_encoder.fit_transform(pumpkins['Color'])\n", - "encoded_pumpkins = encoded_features.assign(Color=encoded_label)\n", - "encoded_pumpkins.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 71, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "['ORANGE', 'WHITE']" - ] - }, - "execution_count": 71, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Let's look at the mapping between the encoded values and the original values\n", - "list(label_encoder.inverse_transform([0, 1]))" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 81, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 81, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "palette = {\n", - " 'ORANGE': 'orange',\n", - " 'WHITE': 'wheat',\n", - "}\n", - "# We need the encoded Item Size column to use it as the x-axis values in the plot\n", - "pumpkins['Item Size'] = encoded_pumpkins['ord__Item Size']\n", - "\n", - "g = sns.catplot(\n", - " data=pumpkins,\n", - " x=\"Item Size\", y=\"Color\", row='Variety',\n", - " kind=\"box\", orient=\"h\",\n", - " sharex=False, margin_titles=True,\n", - " height=1.8, aspect=4, palette=palette,\n", - ")\n", - "# Defining axis labels \n", - "g.set(xlabel=\"Item Size\", ylabel=\"\").set(xlim=(0,6))\n", - "g.set_titles(row_template=\"{row_name}\")\n" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "import warnings\n", - "warnings.filterwarnings(action='ignore', category=UserWarning, module='seaborn')" - ] - }, - { - "cell_type": "code", - "execution_count": 37, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 37, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "# Suppressing warning message claiming that a portion of points cannot be placed into the plot due to the high number of data points\n", - "import warnings\n", - "warnings.filterwarnings(action='ignore', category=UserWarning, module='seaborn')\n", - "\n", - "palette = {\n", - " 0: 'orange',\n", - " 1: 'wheat'\n", - "}\n", - "sns.swarmplot(x=\"Color\", y=\"ord__Item Size\", hue=\"Color\", data=encoded_pumpkins, palette=palette)" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [ - "**Atenção**: Ignorar avisos NÃO é uma boa prática e deve ser evitado sempre que possível. Os avisos frequentemente contêm mensagens úteis que nos ajudam a melhorar o nosso código e resolver um problema. \n", - "A razão pela qual estamos a ignorar este aviso específico é para garantir a legibilidade do gráfico. Representar todos os pontos de dados com um tamanho reduzido de marcador, mantendo a consistência com a paleta de cores, gera uma visualização pouco clara.\n" - ] - }, - { - "attachments": {}, - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 74, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "# X is the encoded features\n", - "X = encoded_pumpkins[encoded_pumpkins.columns.difference(['Color'])]\n", - "# y is the encoded label\n", - "y = encoded_pumpkins['Color']\n", - "\n", - "# Split the data into training and test sets\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)" - ] - }, - { - "cell_type": "code", - "execution_count": 75, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - " precision recall f1-score support\n", - "\n", - " 0 0.94 0.98 0.96 166\n", - " 1 0.85 0.67 0.75 33\n", - "\n", - " accuracy 0.92 199\n", - " macro avg 0.89 0.82 0.85 199\n", - "weighted avg 0.92 0.92 0.92 199\n", - "\n", - "Predicted labels: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0\n", - " 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0\n", - " 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0\n", - " 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0\n", - " 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1\n", - " 0 0 0 1 0 0 0 0 0 0 0 0 1 1]\n", - "F1-score: 0.7457627118644068\n" - ] - } - ], - "source": [ - "from sklearn.metrics import f1_score, classification_report \n", - "from sklearn.linear_model import LogisticRegression\n", - "\n", - "# Train a logistic regression model on the pumpkin dataset\n", - "model = LogisticRegression()\n", - "model.fit(X_train, y_train)\n", - "predictions = model.predict(X_test)\n", - "\n", - "# Evaluate the model and print the results\n", - "print(classification_report(y_test, predictions))\n", - "print('Predicted labels: ', predictions)\n", - "print('F1-score: ', f1_score(y_test, predictions))" - ] - }, - { - "cell_type": "code", - "execution_count": 76, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "array([[162, 4],\n", - " [ 11, 22]])" - ] - }, - "execution_count": 76, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from sklearn.metrics import confusion_matrix\n", - "confusion_matrix(y_test, predictions)" - ] - }, - { - "cell_type": "code", - "execution_count": 77, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "from sklearn.metrics import roc_curve, roc_auc_score\n", - "import matplotlib\n", - "import matplotlib.pyplot as plt\n", - "%matplotlib inline\n", - "\n", - "y_scores = model.predict_proba(X_test)\n", - "# calculate ROC curve\n", - "fpr, tpr, thresholds = roc_curve(y_test, y_scores[:,1])\n", - "\n", - "# plot ROC curve\n", - "fig = plt.figure(figsize=(6, 6))\n", - "# Plot the diagonal 50% line\n", - "plt.plot([0, 1], [0, 1], 'k--')\n", - "# Plot the FPR and TPR achieved by our model\n", - "plt.plot(fpr, tpr)\n", - "plt.xlabel('False Positive Rate')\n", - "plt.ylabel('True Positive Rate')\n", - "plt.title('ROC Curve')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 78, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "0.9749908725812341\n" - ] - } - ], - "source": [ - "# Calculate AUC score\n", - "auc = roc_auc_score(y_test,y_scores[:,1])\n", - "print(auc)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.16" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "vscode": { - "interpreter": { - "hash": "949777d72b0d2535278d3dc13498b2535136f6dfe0678499012e853ee9abcab1" - } - }, - "coopTranslator": { - "original_hash": "ef50cc584e0b79412610cc7da15e1f86", - "translation_date": "2025-09-03T19:30:49+00:00", - "source_file": "2-Regression/4-Logistic/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/2-Regression/README.md b/translations/pt/2-Regression/README.md deleted file mode 100644 index 54c03f332..000000000 --- a/translations/pt/2-Regression/README.md +++ /dev/null @@ -1,54 +0,0 @@ - -# Modelos de regressão para aprendizagem automática -## Tema regional: Modelos de regressão para preços de abóboras na América do Norte 🎃 - -Na América do Norte, as abóboras são frequentemente esculpidas em rostos assustadores para o Halloween. Vamos descobrir mais sobre estes vegetais fascinantes! - -![jack-o-lanterns](../../../translated_images/pt-PT/jack-o-lanterns.181c661a9212457d.webp) -> Foto por Beth Teutschmann no Unsplash - -## O que irá aprender - -[![Introdução à Regressão](https://img.youtube.com/vi/5QnJtDad4iQ/0.jpg)](https://youtu.be/5QnJtDad4iQ "Vídeo de introdução à regressão - Clique para assistir!") -> 🎥 Clique na imagem acima para um vídeo rápido de introdução a esta lição - -As lições desta secção abordam os tipos de regressão no contexto da aprendizagem automática. Os modelos de regressão podem ajudar a determinar a _relação_ entre variáveis. Este tipo de modelo pode prever valores como comprimento, temperatura ou idade, revelando assim relações entre variáveis enquanto analisa pontos de dados. - -Nesta série de lições, irá descobrir as diferenças entre regressão linear e logística, e quando deve preferir uma em vez da outra. - -[![ML para principiantes - Introdução aos modelos de regressão para aprendizagem automática](https://img.youtube.com/vi/XA3OaoW86R8/0.jpg)](https://youtu.be/XA3OaoW86R8 "ML para principiantes - Introdução aos modelos de regressão para aprendizagem automática") - -> 🎥 Clique na imagem acima para um vídeo curto que introduz os modelos de regressão. - -Neste grupo de lições, irá preparar-se para começar tarefas de aprendizagem automática, incluindo configurar o Visual Studio Code para gerir notebooks, o ambiente comum para cientistas de dados. Irá descobrir o Scikit-learn, uma biblioteca para aprendizagem automática, e construir os seus primeiros modelos, focando-se nos modelos de regressão neste capítulo. - -> Existem ferramentas úteis de baixo código que podem ajudá-lo a aprender a trabalhar com modelos de regressão. Experimente [Azure ML para esta tarefa](https://docs.microsoft.com/learn/modules/create-regression-model-azure-machine-learning-designer/?WT.mc_id=academic-77952-leestott) - -### Lições - -1. [Ferramentas do ofício](1-Tools/README.md) -2. [Gestão de dados](2-Data/README.md) -3. [Regressão linear e polinomial](3-Linear/README.md) -4. [Regressão logística](4-Logistic/README.md) - ---- -### Créditos - -"ML com regressão" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper) - -♥️ Contribuidores do quiz incluem: [Muhammad Sakib Khan Inan](https://twitter.com/Sakibinan) e [Ornella Altunyan](https://twitter.com/ornelladotcom) - -O conjunto de dados de abóboras foi sugerido por [este projeto no Kaggle](https://www.kaggle.com/usda/a-year-of-pumpkin-prices) e os seus dados são provenientes dos [Relatórios Padrão dos Mercados Terminais de Culturas Especiais](https://www.marketnews.usda.gov/mnp/fv-report-config-step1?type=termPrice) distribuídos pelo Departamento de Agricultura dos Estados Unidos. Adicionámos alguns pontos relacionados com a cor com base na variedade para normalizar a distribuição. Estes dados estão em domínio público. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/3-Web-App/1-Web-App/README.md b/translations/pt/3-Web-App/1-Web-App/README.md deleted file mode 100644 index 744508841..000000000 --- a/translations/pt/3-Web-App/1-Web-App/README.md +++ /dev/null @@ -1,359 +0,0 @@ - -# Construir uma Aplicação Web para Utilizar um Modelo de ML - -Nesta lição, vais treinar um modelo de ML com um conjunto de dados fora do comum: _avistamentos de OVNIs ao longo do último século_, provenientes da base de dados do NUFORC. - -Vais aprender: - -- Como 'pickle' um modelo treinado -- Como usar esse modelo numa aplicação Flask - -Continuaremos a usar notebooks para limpar os dados e treinar o modelo, mas podes levar o processo um passo adiante ao explorar como usar um modelo "no mundo real", por assim dizer: numa aplicação web. - -Para isso, precisas de construir uma aplicação web utilizando Flask. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Construir uma aplicação - -Existem várias formas de construir aplicações web para consumir modelos de machine learning. A arquitetura da tua aplicação web pode influenciar a forma como o modelo é treinado. Imagina que estás a trabalhar numa empresa onde o grupo de ciência de dados treinou um modelo que querem que utilizes numa aplicação. - -### Considerações - -Há muitas perguntas que precisas de fazer: - -- **É uma aplicação web ou uma aplicação móvel?** Se estás a construir uma aplicação móvel ou precisas de usar o modelo num contexto de IoT, podes usar [TensorFlow Lite](https://www.tensorflow.org/lite/) e utilizar o modelo numa aplicação Android ou iOS. -- **Onde o modelo vai residir?** Na nuvem ou localmente? -- **Suporte offline.** A aplicação precisa de funcionar offline? -- **Que tecnologia foi usada para treinar o modelo?** A tecnologia escolhida pode influenciar as ferramentas que precisas de usar. - - **Usando TensorFlow.** Se estás a treinar um modelo com TensorFlow, por exemplo, esse ecossistema permite converter um modelo TensorFlow para uso numa aplicação web utilizando [TensorFlow.js](https://www.tensorflow.org/js/). - - **Usando PyTorch.** Se estás a construir um modelo com uma biblioteca como [PyTorch](https://pytorch.org/), tens a opção de exportá-lo no formato [ONNX](https://onnx.ai/) (Open Neural Network Exchange) para uso em aplicações web JavaScript que podem utilizar o [Onnx Runtime](https://www.onnxruntime.ai/). Esta opção será explorada numa lição futura para um modelo treinado com Scikit-learn. - - **Usando Lobe.ai ou Azure Custom Vision.** Se estás a usar um sistema ML SaaS (Software como Serviço) como [Lobe.ai](https://lobe.ai/) ou [Azure Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77952-leestott) para treinar um modelo, este tipo de software fornece formas de exportar o modelo para várias plataformas, incluindo construir uma API personalizada para ser consultada na nuvem pela tua aplicação online. - -Também tens a oportunidade de construir uma aplicação web Flask completa que seria capaz de treinar o modelo diretamente no navegador. Isso também pode ser feito utilizando TensorFlow.js num contexto JavaScript. - -Para os nossos propósitos, como temos trabalhado com notebooks baseados em Python, vamos explorar os passos necessários para exportar um modelo treinado de um notebook para um formato legível por uma aplicação web construída em Python. - -## Ferramenta - -Para esta tarefa, precisas de duas ferramentas: Flask e Pickle, ambas executadas em Python. - -✅ O que é [Flask](https://palletsprojects.com/p/flask/)? Definido como um 'micro-framework' pelos seus criadores, Flask fornece as funcionalidades básicas de frameworks web utilizando Python e um motor de templates para construir páginas web. Dá uma olhada neste [módulo de aprendizagem](https://docs.microsoft.com/learn/modules/python-flask-build-ai-web-app?WT.mc_id=academic-77952-leestott) para praticar a construção com Flask. - -✅ O que é [Pickle](https://docs.python.org/3/library/pickle.html)? Pickle 🥒 é um módulo Python que serializa e desserializa uma estrutura de objetos Python. Quando 'pickle' um modelo, estás a serializar ou achatar a sua estrutura para uso na web. Atenção: pickle não é intrinsecamente seguro, por isso tem cuidado se fores solicitado a 'des-picklar' um ficheiro. Um ficheiro pickled tem o sufixo `.pkl`. - -## Exercício - limpar os dados - -Nesta lição vais usar dados de 80.000 avistamentos de OVNIs, recolhidos pelo [NUFORC](https://nuforc.org) (Centro Nacional de Relatórios de OVNIs). Estes dados têm descrições interessantes de avistamentos de OVNIs, por exemplo: - -- **Descrição longa de exemplo.** "Um homem emerge de um feixe de luz que brilha num campo de relva à noite e corre em direção ao estacionamento da Texas Instruments". -- **Descrição curta de exemplo.** "as luzes perseguiram-nos". - -A folha de cálculo [ufos.csv](../../../../3-Web-App/1-Web-App/data/ufos.csv) inclui colunas sobre a `cidade`, `estado` e `país` onde o avistamento ocorreu, a `forma` do objeto e a sua `latitude` e `longitude`. - -No [notebook](../../../../3-Web-App/1-Web-App/notebook.ipynb) em branco incluído nesta lição: - -1. Importa `pandas`, `matplotlib` e `numpy` como fizeste nas lições anteriores e importa a folha de cálculo de OVNIs. Podes dar uma olhada num conjunto de dados de exemplo: - - ```python - import pandas as pd - import numpy as np - - ufos = pd.read_csv('./data/ufos.csv') - ufos.head() - ``` - -1. Converte os dados de OVNIs para um pequeno dataframe com títulos novos. Verifica os valores únicos no campo `Country`. - - ```python - ufos = pd.DataFrame({'Seconds': ufos['duration (seconds)'], 'Country': ufos['country'],'Latitude': ufos['latitude'],'Longitude': ufos['longitude']}) - - ufos.Country.unique() - ``` - -1. Agora, podes reduzir a quantidade de dados com que precisas de lidar ao eliminar valores nulos e importar apenas avistamentos entre 1-60 segundos: - - ```python - ufos.dropna(inplace=True) - - ufos = ufos[(ufos['Seconds'] >= 1) & (ufos['Seconds'] <= 60)] - - ufos.info() - ``` - -1. Importa a biblioteca `LabelEncoder` do Scikit-learn para converter os valores de texto dos países para números: - - ✅ LabelEncoder codifica os dados alfabeticamente - - ```python - from sklearn.preprocessing import LabelEncoder - - ufos['Country'] = LabelEncoder().fit_transform(ufos['Country']) - - ufos.head() - ``` - - Os teus dados devem parecer-se com isto: - - ```output - Seconds Country Latitude Longitude - 2 20.0 3 53.200000 -2.916667 - 3 20.0 4 28.978333 -96.645833 - 14 30.0 4 35.823889 -80.253611 - 23 60.0 4 45.582778 -122.352222 - 24 3.0 3 51.783333 -0.783333 - ``` - -## Exercício - construir o modelo - -Agora podes preparar-te para treinar um modelo dividindo os dados em grupos de treino e teste. - -1. Seleciona as três características que queres treinar como o teu vetor X, e o vetor y será o `Country`. Queres ser capaz de inserir `Seconds`, `Latitude` e `Longitude` e obter um id de país como retorno. - - ```python - from sklearn.model_selection import train_test_split - - Selected_features = ['Seconds','Latitude','Longitude'] - - X = ufos[Selected_features] - y = ufos['Country'] - - X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) - ``` - -1. Treina o modelo utilizando regressão logística: - - ```python - from sklearn.metrics import accuracy_score, classification_report - from sklearn.linear_model import LogisticRegression - model = LogisticRegression() - model.fit(X_train, y_train) - predictions = model.predict(X_test) - - print(classification_report(y_test, predictions)) - print('Predicted labels: ', predictions) - print('Accuracy: ', accuracy_score(y_test, predictions)) - ``` - -A precisão não é má **(cerca de 95%)**, o que não é surpreendente, já que `Country` e `Latitude/Longitude` estão correlacionados. - -O modelo que criaste não é muito revolucionário, pois deverias ser capaz de inferir um `Country` a partir da sua `Latitude` e `Longitude`, mas é um bom exercício para tentar treinar a partir de dados brutos que limpaste, exportaste e depois usaste este modelo numa aplicação web. - -## Exercício - 'pickle' o modelo - -Agora, é hora de _picklar_ o modelo! Podes fazer isso em algumas linhas de código. Uma vez _pickled_, carrega o modelo pickled e testa-o contra um array de dados de exemplo contendo valores para segundos, latitude e longitude. - -```python -import pickle -model_filename = 'ufo-model.pkl' -pickle.dump(model, open(model_filename,'wb')) - -model = pickle.load(open('ufo-model.pkl','rb')) -print(model.predict([[50,44,-12]])) -``` - -O modelo retorna **'3'**, que é o código de país para o Reino Unido. Incrível! 👽 - -## Exercício - construir uma aplicação Flask - -Agora podes construir uma aplicação Flask para chamar o modelo e retornar resultados semelhantes, mas de uma forma mais visualmente agradável. - -1. Começa por criar uma pasta chamada **web-app** ao lado do ficheiro _notebook.ipynb_ onde o teu ficheiro _ufo-model.pkl_ reside. - -1. Nessa pasta, cria mais três pastas: **static**, com uma pasta **css** dentro dela, e **templates**. Deves agora ter os seguintes ficheiros e diretórios: - - ```output - web-app/ - static/ - css/ - templates/ - notebook.ipynb - ufo-model.pkl - ``` - - ✅ Consulta a pasta de solução para ver a aplicação finalizada - -1. O primeiro ficheiro a criar na pasta _web-app_ é o ficheiro **requirements.txt**. Tal como _package.json_ numa aplicação JavaScript, este ficheiro lista as dependências necessárias para a aplicação. No **requirements.txt** adiciona as linhas: - - ```text - scikit-learn - pandas - numpy - flask - ``` - -1. Agora, executa este ficheiro navegando até _web-app_: - - ```bash - cd web-app - ``` - -1. No terminal, digita `pip install` para instalar as bibliotecas listadas no _requirements.txt_: - - ```bash - pip install -r requirements.txt - ``` - -1. Agora, estás pronto para criar mais três ficheiros para finalizar a aplicação: - - 1. Cria **app.py** na raiz. - 2. Cria **index.html** na pasta _templates_. - 3. Cria **styles.css** na pasta _static/css_. - -1. Desenvolve o ficheiro _styles.css_ com alguns estilos: - - ```css - body { - width: 100%; - height: 100%; - font-family: 'Helvetica'; - background: black; - color: #fff; - text-align: center; - letter-spacing: 1.4px; - font-size: 30px; - } - - input { - min-width: 150px; - } - - .grid { - width: 300px; - border: 1px solid #2d2d2d; - display: grid; - justify-content: center; - margin: 20px auto; - } - - .box { - color: #fff; - background: #2d2d2d; - padding: 12px; - display: inline-block; - } - ``` - -1. Em seguida, desenvolve o ficheiro _index.html_: - - ```html - - - - - 🛸 UFO Appearance Prediction! 👽 - - - - -
- -
- -

According to the number of seconds, latitude and longitude, which country is likely to have reported seeing a UFO?

- -
- - - - -
- -

{{ prediction_text }}

- -
- -
- - - - ``` - - Dá uma olhada na utilização de templates neste ficheiro. Repara na sintaxe 'mustache' em torno das variáveis que serão fornecidas pela aplicação, como o texto de previsão: `{{}}`. Há também um formulário que envia uma previsão para a rota `/predict`. - - Finalmente, estás pronto para construir o ficheiro Python que conduz o consumo do modelo e a exibição das previsões: - -1. No `app.py` adiciona: - - ```python - import numpy as np - from flask import Flask, request, render_template - import pickle - - app = Flask(__name__) - - model = pickle.load(open("./ufo-model.pkl", "rb")) - - - @app.route("/") - def home(): - return render_template("index.html") - - - @app.route("/predict", methods=["POST"]) - def predict(): - - int_features = [int(x) for x in request.form.values()] - final_features = [np.array(int_features)] - prediction = model.predict(final_features) - - output = prediction[0] - - countries = ["Australia", "Canada", "Germany", "UK", "US"] - - return render_template( - "index.html", prediction_text="Likely country: {}".format(countries[output]) - ) - - - if __name__ == "__main__": - app.run(debug=True) - ``` - - > 💡 Dica: quando adicionas [`debug=True`](https://www.askpython.com/python-modules/flask/flask-debug-mode) enquanto executas a aplicação web utilizando Flask, quaisquer alterações que fizeres na tua aplicação serão refletidas imediatamente sem necessidade de reiniciar o servidor. Atenção! Não habilites este modo numa aplicação em produção. - -Se executares `python app.py` ou `python3 app.py` - o teu servidor web inicia localmente, e podes preencher um pequeno formulário para obter uma resposta à tua pergunta sobre onde os OVNIs foram avistados! - -Antes de fazer isso, dá uma olhada nas partes do `app.py`: - -1. Primeiro, as dependências são carregadas e a aplicação inicia. -1. Depois, o modelo é importado. -1. Em seguida, o index.html é renderizado na rota inicial. - -Na rota `/predict`, várias coisas acontecem quando o formulário é enviado: - -1. As variáveis do formulário são recolhidas e convertidas para um array numpy. Elas são então enviadas para o modelo e uma previsão é retornada. -2. Os países que queremos exibir são re-renderizados como texto legível a partir do código de país previsto, e esse valor é enviado de volta ao index.html para ser renderizado no template. - -Usar um modelo desta forma, com Flask e um modelo pickled, é relativamente simples. O mais difícil é entender qual é a forma dos dados que devem ser enviados ao modelo para obter uma previsão. Isso depende de como o modelo foi treinado. Este tem três pontos de dados que devem ser inseridos para obter uma previsão. - -Num ambiente profissional, podes ver como é necessária uma boa comunicação entre as pessoas que treinam o modelo e aquelas que o consomem numa aplicação web ou móvel. No nosso caso, és apenas tu! - ---- - -## 🚀 Desafio - -Em vez de trabalhar num notebook e importar o modelo para a aplicação Flask, poderias treinar o modelo diretamente dentro da aplicação Flask! Tenta converter o teu código Python no notebook, talvez depois de os dados serem limpos, para treinar o modelo dentro da aplicação numa rota chamada `train`. Quais são os prós e contras de seguir este método? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Existem muitas formas de construir uma aplicação web para consumir modelos de ML. Faz uma lista das formas como poderias usar JavaScript ou Python para construir uma aplicação web que aproveite o machine learning. Considera a arquitetura: o modelo deve permanecer na aplicação ou viver na nuvem? Se for o último caso, como o acederias? Desenha um modelo arquitetural para uma solução web aplicada de ML. - -## Tarefa - -[Experimenta um modelo diferente](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/3-Web-App/1-Web-App/assignment.md b/translations/pt/3-Web-App/1-Web-App/assignment.md deleted file mode 100644 index 6ff8a9d0b..000000000 --- a/translations/pt/3-Web-App/1-Web-App/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Experimente um modelo diferente - -## Instruções - -Agora que já criou uma aplicação web utilizando um modelo de Regressão treinado, utilize um dos modelos de uma lição anterior sobre Regressão para refazer esta aplicação web. Pode manter o estilo ou desenhá-la de forma diferente para refletir os dados das abóboras. Certifique-se de alterar os inputs para corresponder ao método de treino do seu modelo. - -## Critérios de Avaliação - -| Critérios | Exemplar | Adequado | Necessita Melhorias | -| -------------------------- | -------------------------------------------------------- | --------------------------------------------------------- | -------------------------------------- | -| | A aplicação web funciona como esperado e está implementada na nuvem | A aplicação web contém falhas ou apresenta resultados inesperados | A aplicação web não funciona corretamente | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/3-Web-App/1-Web-App/notebook.ipynb b/translations/pt/3-Web-App/1-Web-App/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/pt/3-Web-App/1-Web-App/solution/notebook.ipynb b/translations/pt/3-Web-App/1-Web-App/solution/notebook.ipynb deleted file mode 100644 index 97b3a034b..000000000 --- a/translations/pt/3-Web-App/1-Web-App/solution/notebook.ipynb +++ /dev/null @@ -1,267 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "5fa2e8f4584c78250ca9729b46562ceb", - "translation_date": "2025-09-03T20:19:38+00:00", - "source_file": "3-Web-App/1-Web-App/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " datetime city state country shape \\\n", - "0 10/10/1949 20:30 san marcos tx us cylinder \n", - "1 10/10/1949 21:00 lackland afb tx NaN light \n", - "2 10/10/1955 17:00 chester (uk/england) NaN gb circle \n", - "3 10/10/1956 21:00 edna tx us circle \n", - "4 10/10/1960 20:00 kaneohe hi us light \n", - "\n", - " duration (seconds) duration (hours/min) \\\n", - "0 2700.0 45 minutes \n", - "1 7200.0 1-2 hrs \n", - "2 20.0 20 seconds \n", - "3 20.0 1/2 hour \n", - "4 900.0 15 minutes \n", - "\n", - " comments date posted latitude \\\n", - "0 This event took place in early fall around 194... 4/27/2004 29.883056 \n", - "1 1949 Lackland AFB, TX. Lights racing acros... 12/16/2005 29.384210 \n", - "2 Green/Orange circular disc over Chester, En... 1/21/2008 53.200000 \n", - "3 My older brother and twin sister were leaving ... 1/17/2004 28.978333 \n", - "4 AS a Marine 1st Lt. flying an FJ4B fighter/att... 1/22/2004 21.418056 \n", - "\n", - " longitude \n", - "0 -97.941111 \n", - "1 -98.581082 \n", - "2 -2.916667 \n", - "3 -96.645833 \n", - "4 -157.803611 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
datetimecitystatecountryshapeduration (seconds)duration (hours/min)commentsdate postedlatitudelongitude
010/10/1949 20:30san marcostxuscylinder2700.045 minutesThis event took place in early fall around 194...4/27/200429.883056-97.941111
110/10/1949 21:00lackland afbtxNaNlight7200.01-2 hrs1949 Lackland AFB&#44 TX. Lights racing acros...12/16/200529.384210-98.581082
210/10/1955 17:00chester (uk/england)NaNgbcircle20.020 secondsGreen/Orange circular disc over Chester&#44 En...1/21/200853.200000-2.916667
310/10/1956 21:00ednatxuscircle20.01/2 hourMy older brother and twin sister were leaving ...1/17/200428.978333-96.645833
410/10/1960 20:00kaneohehiuslight900.015 minutesAS a Marine 1st Lt. flying an FJ4B fighter/att...1/22/200421.418056-157.803611
\n
" - }, - "metadata": {}, - "execution_count": 23 - } - ], - "source": [ - "import pandas as pd\n", - "import numpy as np\n", - "\n", - "ufos = pd.read_csv('../data/ufos.csv')\n", - "ufos.head()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array(['us', nan, 'gb', 'ca', 'au', 'de'], dtype=object)" - ] - }, - "metadata": {}, - "execution_count": 24 - } - ], - "source": [ - "\n", - "ufos = pd.DataFrame({'Seconds': ufos['duration (seconds)'], 'Country': ufos['country'],'Latitude': ufos['latitude'],'Longitude': ufos['longitude']})\n", - "\n", - "ufos.Country.unique()\n", - "\n", - "# 0 au, 1 ca, 2 de, 3 gb, 4 us" - ] - }, - { - "cell_type": "code", - "execution_count": 25, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\nInt64Index: 25863 entries, 2 to 80330\nData columns (total 4 columns):\n # Column Non-Null Count Dtype \n--- ------ -------------- ----- \n 0 Seconds 25863 non-null float64\n 1 Country 25863 non-null object \n 2 Latitude 25863 non-null float64\n 3 Longitude 25863 non-null float64\ndtypes: float64(3), object(1)\nmemory usage: 1010.3+ KB\n" - ] - } - ], - "source": [ - "ufos.dropna(inplace=True)\n", - "\n", - "ufos = ufos[(ufos['Seconds'] >= 1) & (ufos['Seconds'] <= 60)]\n", - "\n", - "ufos.info()" - ] - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Seconds Country Latitude Longitude\n", - "2 20.0 3 53.200000 -2.916667\n", - "3 20.0 4 28.978333 -96.645833\n", - "14 30.0 4 35.823889 -80.253611\n", - "23 60.0 4 45.582778 -122.352222\n", - "24 3.0 3 51.783333 -0.783333" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
SecondsCountryLatitudeLongitude
220.0353.200000-2.916667
320.0428.978333-96.645833
1430.0435.823889-80.253611
2360.0445.582778-122.352222
243.0351.783333-0.783333
\n
" - }, - "metadata": {}, - "execution_count": 26 - } - ], - "source": [ - "from sklearn.preprocessing import LabelEncoder\n", - "\n", - "ufos['Country'] = LabelEncoder().fit_transform(ufos['Country'])\n", - "\n", - "ufos.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 27, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "\n", - "Selected_features = ['Seconds','Latitude','Longitude']\n", - "\n", - "X = ufos[Selected_features]\n", - "y = ufos['Country']\n", - "\n", - "\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 28, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/linear_model/logistic.py:432: FutureWarning: Default solver will be changed to 'lbfgs' in 0.22. Specify a solver to silence this warning.\n", - " FutureWarning)\n", - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/linear_model/logistic.py:469: FutureWarning: Default multi_class will be changed to 'auto' in 0.22. Specify the multi_class option to silence this warning.\n", - " \"this warning.\", FutureWarning)\n", - " precision recall f1-score support\n", - "\n", - " 0 1.00 1.00 1.00 41\n", - " 1 1.00 0.02 0.05 250\n", - " 2 0.00 0.00 0.00 8\n", - " 3 0.94 1.00 0.97 131\n", - " 4 0.95 1.00 0.97 4743\n", - "\n", - " accuracy 0.95 5173\n", - " macro avg 0.78 0.60 0.60 5173\n", - "weighted avg 0.95 0.95 0.93 5173\n", - "\n", - "Predicted labels: [4 4 4 ... 3 4 4]\n", - "Accuracy: 0.9512855209742895\n", - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/metrics/classification.py:1437: UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels with no predicted samples.\n", - " 'precision', 'predicted', average, warn_for)\n" - ] - } - ], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "from sklearn.metrics import accuracy_score, classification_report \n", - "from sklearn.linear_model import LogisticRegression\n", - "model = LogisticRegression()\n", - "model.fit(X_train, y_train)\n", - "predictions = model.predict(X_test)\n", - "\n", - "print(classification_report(y_test, predictions))\n", - "print('Predicted labels: ', predictions)\n", - "print('Accuracy: ', accuracy_score(y_test, predictions))\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 29, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[3]\n" - ] - } - ], - "source": [ - "import pickle\n", - "model_filename = 'ufo-model.pkl'\n", - "pickle.dump(model, open(model_filename,'wb'))\n", - "\n", - "model = pickle.load(open('ufo-model.pkl','rb'))\n", - "print(model.predict([[50,44,-12]]))\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/3-Web-App/README.md b/translations/pt/3-Web-App/README.md deleted file mode 100644 index 9447a11ae..000000000 --- a/translations/pt/3-Web-App/README.md +++ /dev/null @@ -1,35 +0,0 @@ - -# Crie uma aplicação web para usar o seu modelo de ML - -Nesta secção do currículo, será introduzido a um tópico aplicado de ML: como guardar o seu modelo Scikit-learn como um ficheiro que pode ser utilizado para fazer previsões dentro de uma aplicação web. Depois de guardar o modelo, aprenderá como utilizá-lo numa aplicação web construída em Flask. Primeiro, irá criar um modelo utilizando alguns dados relacionados com avistamentos de OVNIs! Em seguida, irá construir uma aplicação web que permitirá introduzir um número de segundos juntamente com valores de latitude e longitude para prever qual país relatou ter visto um OVNI. - -![Estacionamento de OVNIs](../../../translated_images/pt-PT/ufo.9e787f5161da9d4d.webp) - -Foto por Michael Herren em Unsplash - -## Lições - -1. [Crie uma Aplicação Web](1-Web-App/README.md) - -## Créditos - -"Crie uma Aplicação Web" foi escrito com ♥️ por [Jen Looper](https://twitter.com/jenlooper). - -♥️ Os questionários foram escritos por Rohan Raj. - -O conjunto de dados foi obtido de [Kaggle](https://www.kaggle.com/NUFORC/ufo-sightings). - -A arquitetura da aplicação web foi sugerida em parte por [este artigo](https://towardsdatascience.com/how-to-easily-deploy-machine-learning-models-using-flask-b95af8fe34d4) e [este repositório](https://github.com/abhinavsagar/machine-learning-deployment) de Abhinav Sagar. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/1-Introduction/README.md b/translations/pt/4-Classification/1-Introduction/README.md deleted file mode 100644 index b9515003d..000000000 --- a/translations/pt/4-Classification/1-Introduction/README.md +++ /dev/null @@ -1,313 +0,0 @@ - -# Introdução à classificação - -Nestes quatro módulos, vais explorar um dos focos fundamentais do machine learning clássico - _classificação_. Vamos utilizar vários algoritmos de classificação com um conjunto de dados sobre as brilhantes culinárias da Ásia e da Índia. Espero que estejas com fome! - -![uma pitada!](../../../../4-Classification/1-Introduction/images/pinch.png) - -> Celebra as culinárias pan-asiáticas nestas lições! Imagem por [Jen Looper](https://twitter.com/jenlooper) - -Classificação é uma forma de [aprendizagem supervisionada](https://wikipedia.org/wiki/Supervised_learning) que tem muito em comum com técnicas de regressão. Se o machine learning consiste em prever valores ou nomes para coisas utilizando conjuntos de dados, então a classificação geralmente divide-se em dois grupos: _classificação binária_ e _classificação multicategorias_. - -[![Introdução à classificação](https://img.youtube.com/vi/eg8DJYwdMyg/0.jpg)](https://youtu.be/eg8DJYwdMyg "Introdução à classificação") - -> 🎥 Clica na imagem acima para ver um vídeo: John Guttag do MIT apresenta a classificação - -Lembra-te: - -- **Regressão linear** ajudou-te a prever relações entre variáveis e a fazer previsões precisas sobre onde um novo ponto de dados se encaixaria em relação a essa linha. Por exemplo, podias prever _qual seria o preço de uma abóbora em setembro vs. dezembro_. -- **Regressão logística** ajudou-te a descobrir "categorias binárias": a este preço, _esta abóbora é laranja ou não-laranja_? - -A classificação utiliza vários algoritmos para determinar outras formas de identificar o rótulo ou classe de um ponto de dados. Vamos trabalhar com estes dados sobre culinárias para ver se, ao observar um grupo de ingredientes, conseguimos determinar a sua origem culinária. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -> ### [Esta lição está disponível em R!](../../../../4-Classification/1-Introduction/solution/R/lesson_10.html) - -### Introdução - -Classificação é uma das atividades fundamentais do investigador de machine learning e do cientista de dados. Desde a classificação básica de um valor binário ("este email é spam ou não?"), até à classificação e segmentação complexa de imagens utilizando visão computacional, é sempre útil conseguir organizar dados em classes e fazer perguntas sobre eles. - -De forma mais científica, o teu método de classificação cria um modelo preditivo que te permite mapear a relação entre variáveis de entrada e variáveis de saída. - -![classificação binária vs. multicategorias](../../../../4-Classification/1-Introduction/images/binary-multiclass.png) - -> Problemas binários vs. multicategorias para algoritmos de classificação. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -Antes de começar o processo de limpeza dos dados, visualizá-los e prepará-los para as nossas tarefas de ML, vamos aprender um pouco sobre as várias formas como o machine learning pode ser utilizado para classificar dados. - -Derivada da [estatística](https://wikipedia.org/wiki/Statistical_classification), a classificação utilizando machine learning clássico usa características, como `fumador`, `peso` e `idade`, para determinar _probabilidade de desenvolver X doença_. Como técnica de aprendizagem supervisionada semelhante aos exercícios de regressão que realizaste anteriormente, os teus dados estão rotulados e os algoritmos de ML utilizam esses rótulos para classificar e prever classes (ou 'características') de um conjunto de dados e atribuí-las a um grupo ou resultado. - -✅ Tira um momento para imaginar um conjunto de dados sobre culinárias. Que tipo de perguntas um modelo multicategorias poderia responder? E um modelo binário? E se quisesses determinar se uma determinada culinária provavelmente utiliza feno-grego? E se quisesses ver se, dado um saco de compras cheio de anis-estrelado, alcachofras, couve-flor e rábano, conseguirias criar um prato típico indiano? - -[![Cestos misteriosos malucos](https://img.youtube.com/vi/GuTeDbaNoEU/0.jpg)](https://youtu.be/GuTeDbaNoEU "Cestos misteriosos malucos") - -> 🎥 Clica na imagem acima para ver um vídeo. Todo o conceito do programa 'Chopped' é o 'cesto misterioso', onde os chefs têm de criar um prato com uma escolha aleatória de ingredientes. Certamente um modelo de ML teria ajudado! - -## Olá 'classificador' - -A pergunta que queremos fazer sobre este conjunto de dados de culinárias é, na verdade, uma **questão multicategorias**, já que temos várias possíveis culinárias nacionais com que trabalhar. Dado um conjunto de ingredientes, a qual destas muitas classes os dados pertencem? - -O Scikit-learn oferece vários algoritmos diferentes para classificar dados, dependendo do tipo de problema que queres resolver. Nas próximas duas lições, vais aprender sobre alguns desses algoritmos. - -## Exercício - limpar e equilibrar os dados - -A primeira tarefa, antes de começar este projeto, é limpar e **equilibrar** os teus dados para obter melhores resultados. Começa com o ficheiro vazio _notebook.ipynb_ na raiz desta pasta. - -A primeira coisa a instalar é [imblearn](https://imbalanced-learn.org/stable/). Este é um pacote do Scikit-learn que te permitirá equilibrar melhor os dados (vais aprender mais sobre esta tarefa em breve). - -1. Para instalar `imblearn`, executa `pip install`, assim: - - ```python - pip install imblearn - ``` - -1. Importa os pacotes necessários para importar os teus dados e visualizá-los, e também importa `SMOTE` de `imblearn`. - - ```python - import pandas as pd - import matplotlib.pyplot as plt - import matplotlib as mpl - import numpy as np - from imblearn.over_sampling import SMOTE - ``` - - Agora estás pronto para importar os dados. - -1. A próxima tarefa será importar os dados: - - ```python - df = pd.read_csv('../data/cuisines.csv') - ``` - - Utilizar `read_csv()` irá ler o conteúdo do ficheiro csv _cusines.csv_ e colocá-lo na variável `df`. - -1. Verifica a forma dos dados: - - ```python - df.head() - ``` - - As primeiras cinco linhas têm este aspeto: - - ```output - | | Unnamed: 0 | cuisine | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | - | --- | ---------- | ------- | ------ | -------- | ----- | ---------- | ----- | ------------ | ------- | -------- | --- | ------- | ----------- | ---------- | ----------------------- | ---- | ---- | --- | ----- | ------ | -------- | - | 0 | 65 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 1 | 66 | indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 2 | 67 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 3 | 68 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | - | 4 | 69 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | - ``` - -1. Obtém informações sobre estes dados chamando `info()`: - - ```python - df.info() - ``` - - O teu output será semelhante a: - - ```output - - RangeIndex: 2448 entries, 0 to 2447 - Columns: 385 entries, Unnamed: 0 to zucchini - dtypes: int64(384), object(1) - memory usage: 7.2+ MB - ``` - -## Exercício - aprender sobre culinárias - -Agora o trabalho começa a tornar-se mais interessante. Vamos descobrir a distribuição dos dados, por culinária. - -1. Representa os dados como barras chamando `barh()`: - - ```python - df.cuisine.value_counts().plot.barh() - ``` - - ![distribuição de dados de culinárias](../../../../4-Classification/1-Introduction/images/cuisine-dist.png) - - Existem um número finito de culinárias, mas a distribuição dos dados é desigual. Podes corrigir isso! Antes de o fazer, explora um pouco mais. - -1. Descobre a quantidade de dados disponível por culinária e imprime-a: - - ```python - thai_df = df[(df.cuisine == "thai")] - japanese_df = df[(df.cuisine == "japanese")] - chinese_df = df[(df.cuisine == "chinese")] - indian_df = df[(df.cuisine == "indian")] - korean_df = df[(df.cuisine == "korean")] - - print(f'thai df: {thai_df.shape}') - print(f'japanese df: {japanese_df.shape}') - print(f'chinese df: {chinese_df.shape}') - print(f'indian df: {indian_df.shape}') - print(f'korean df: {korean_df.shape}') - ``` - - o output será semelhante a: - - ```output - thai df: (289, 385) - japanese df: (320, 385) - chinese df: (442, 385) - indian df: (598, 385) - korean df: (799, 385) - ``` - -## Descobrir ingredientes - -Agora podes aprofundar os dados e aprender quais são os ingredientes típicos por culinária. Deves limpar dados recorrentes que criam confusão entre culinárias, então vamos aprender sobre este problema. - -1. Cria uma função `create_ingredient()` em Python para criar um dataframe de ingredientes. Esta função começará por eliminar uma coluna inútil e organizar os ingredientes pelo seu número: - - ```python - def create_ingredient_df(df): - ingredient_df = df.T.drop(['cuisine','Unnamed: 0']).sum(axis=1).to_frame('value') - ingredient_df = ingredient_df[(ingredient_df.T != 0).any()] - ingredient_df = ingredient_df.sort_values(by='value', ascending=False, - inplace=False) - return ingredient_df - ``` - - Agora podes usar essa função para ter uma ideia dos dez ingredientes mais populares por culinária. - -1. Chama `create_ingredient()` e representa os dados chamando `barh()`: - - ```python - thai_ingredient_df = create_ingredient_df(thai_df) - thai_ingredient_df.head(10).plot.barh() - ``` - - ![thai](../../../../4-Classification/1-Introduction/images/thai.png) - -1. Faz o mesmo para os dados japoneses: - - ```python - japanese_ingredient_df = create_ingredient_df(japanese_df) - japanese_ingredient_df.head(10).plot.barh() - ``` - - ![japanese](../../../../4-Classification/1-Introduction/images/japanese.png) - -1. Agora para os ingredientes chineses: - - ```python - chinese_ingredient_df = create_ingredient_df(chinese_df) - chinese_ingredient_df.head(10).plot.barh() - ``` - - ![chinese](../../../../4-Classification/1-Introduction/images/chinese.png) - -1. Representa os ingredientes indianos: - - ```python - indian_ingredient_df = create_ingredient_df(indian_df) - indian_ingredient_df.head(10).plot.barh() - ``` - - ![indian](../../../../4-Classification/1-Introduction/images/indian.png) - -1. Finalmente, representa os ingredientes coreanos: - - ```python - korean_ingredient_df = create_ingredient_df(korean_df) - korean_ingredient_df.head(10).plot.barh() - ``` - - ![korean](../../../../4-Classification/1-Introduction/images/korean.png) - -1. Agora, elimina os ingredientes mais comuns que criam confusão entre culinárias distintas, chamando `drop()`: - - Toda a gente adora arroz, alho e gengibre! - - ```python - feature_df= df.drop(['cuisine','Unnamed: 0','rice','garlic','ginger'], axis=1) - labels_df = df.cuisine #.unique() - feature_df.head() - ``` - -## Equilibrar o conjunto de dados - -Agora que limpaste os dados, utiliza [SMOTE](https://imbalanced-learn.org/dev/references/generated/imblearn.over_sampling.SMOTE.html) - "Técnica de Sobreamostragem Sintética de Minorias" - para equilibrá-los. - -1. Chama `fit_resample()`, esta estratégia gera novas amostras por interpolação. - - ```python - oversample = SMOTE() - transformed_feature_df, transformed_label_df = oversample.fit_resample(feature_df, labels_df) - ``` - - Ao equilibrar os teus dados, vais obter melhores resultados ao classificá-los. Pensa numa classificação binária. Se a maior parte dos teus dados pertence a uma classe, um modelo de ML vai prever essa classe com mais frequência, apenas porque há mais dados para ela. O equilíbrio dos dados elimina esta desigualdade. - -1. Agora podes verificar os números de rótulos por ingrediente: - - ```python - print(f'new label count: {transformed_label_df.value_counts()}') - print(f'old label count: {df.cuisine.value_counts()}') - ``` - - O teu output será semelhante a: - - ```output - new label count: korean 799 - chinese 799 - indian 799 - japanese 799 - thai 799 - Name: cuisine, dtype: int64 - old label count: korean 799 - indian 598 - chinese 442 - japanese 320 - thai 289 - Name: cuisine, dtype: int64 - ``` - - Os dados estão limpos, equilibrados e muito deliciosos! - -1. O último passo é guardar os teus dados equilibrados, incluindo rótulos e características, num novo dataframe que pode ser exportado para um ficheiro: - - ```python - transformed_df = pd.concat([transformed_label_df,transformed_feature_df],axis=1, join='outer') - ``` - -1. Podes dar mais uma olhada nos dados utilizando `transformed_df.head()` e `transformed_df.info()`. Guarda uma cópia destes dados para uso em lições futuras: - - ```python - transformed_df.head() - transformed_df.info() - transformed_df.to_csv("../data/cleaned_cuisines.csv") - ``` - - Este novo CSV pode agora ser encontrado na pasta de dados raiz. - ---- - -## 🚀Desafio - -Este currículo contém vários conjuntos de dados interessantes. Explora as pastas `data` e vê se alguma contém conjuntos de dados que seriam apropriados para classificação binária ou multicategorias. Que perguntas farias a este conjunto de dados? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Individual - -Explora a API do SMOTE. Para que casos de uso é mais adequado? Que problemas resolve? - -## Tarefa - -[Explora métodos de classificação](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/1-Introduction/assignment.md b/translations/pt/4-Classification/1-Introduction/assignment.md deleted file mode 100644 index d2928f110..000000000 --- a/translations/pt/4-Classification/1-Introduction/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Explorar métodos de classificação - -## Instruções - -Na [documentação do Scikit-learn](https://scikit-learn.org/stable/supervised_learning.html) encontrarás uma longa lista de formas de classificar dados. Faz uma pequena caça ao tesouro nestes documentos: o teu objetivo é procurar métodos de classificação e associar um conjunto de dados deste currículo, uma pergunta que possas fazer sobre ele e uma técnica de classificação. Cria uma folha de cálculo ou tabela num ficheiro .doc e explica como o conjunto de dados funcionaria com o algoritmo de classificação. - -## Rubrica - -| Critérios | Exemplário | Adequado | Necessita de Melhorias | -| --------- | ------------------------------------------------------------------------------------------------------------------------------------ | ----------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------- | -| | é apresentado um documento que descreve 5 algoritmos juntamente com uma técnica de classificação. A descrição é bem explicada e detalhada. | é apresentado um documento que descreve 3 algoritmos juntamente com uma técnica de classificação. A descrição é bem explicada e detalhada. | é apresentado um documento que descreve menos de três algoritmos juntamente com uma técnica de classificação e a descrição não é bem explicada nem detalhada. | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/1-Introduction/notebook.ipynb b/translations/pt/4-Classification/1-Introduction/notebook.ipynb deleted file mode 100644 index 0098ed614..000000000 --- a/translations/pt/4-Classification/1-Introduction/notebook.ipynb +++ /dev/null @@ -1,39 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "d544ef384b7ba73757d830a72372a7f2", - "translation_date": "2025-09-03T20:33:35+00:00", - "source_file": "4-Classification/1-Introduction/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/1-Introduction/solution/Julia/README.md b/translations/pt/4-Classification/1-Introduction/solution/Julia/README.md deleted file mode 100644 index 2edf44db6..000000000 --- a/translations/pt/4-Classification/1-Introduction/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb b/translations/pt/4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb deleted file mode 100644 index 05d570ffe..000000000 --- a/translations/pt/4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb +++ /dev/null @@ -1,723 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_10-R.ipynb", - "provenance": [], - "collapsed_sections": [] - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "2621e24705e8100893c9bf84e0fc8aef", - "translation_date": "2025-09-03T20:39:15+00:00", - "source_file": "4-Classification/1-Introduction/solution/R/lesson_10-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Construir um modelo de classificação: Deliciosas Cozinhas Asiáticas e Indianas\n" - ], - "metadata": { - "id": "ItETB4tSFprR" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Introdução à classificação: Limpar, preparar e visualizar os seus dados\n", - "\n", - "Nestes quatro módulos, irá explorar um dos focos fundamentais do machine learning clássico - *classificação*. Vamos percorrer o uso de vários algoritmos de classificação com um conjunto de dados sobre as brilhantes culinárias da Ásia e da Índia. Esperamos que esteja com fome!\n", - "\n", - "

\n", - " \n", - "

Celebre as culinárias pan-asiáticas nestas lições! Imagem por Jen Looper
\n", - "\n", - "\n", - "\n", - "\n", - "Classificação é uma forma de [aprendizagem supervisionada](https://wikipedia.org/wiki/Supervised_learning) que tem muito em comum com técnicas de regressão. Na classificação, treina-se um modelo para prever a que `categoria` um item pertence. Se o machine learning trata de prever valores ou nomes para coisas usando conjuntos de dados, então a classificação geralmente se divide em dois grupos: *classificação binária* e *classificação multicategorias*.\n", - "\n", - "Lembre-se:\n", - "\n", - "- **Regressão linear** ajudou-o a prever relações entre variáveis e fazer previsões precisas sobre onde um novo ponto de dados se encaixaria em relação àquela linha. Por exemplo, poderia prever valores numéricos como *qual seria o preço de uma abóbora em setembro vs. dezembro*.\n", - "\n", - "- **Regressão logística** ajudou-o a descobrir \"categorias binárias\": a este preço, *esta abóbora é laranja ou não-laranja*?\n", - "\n", - "A classificação utiliza vários algoritmos para determinar outras formas de identificar o rótulo ou classe de um ponto de dados. Vamos trabalhar com estes dados de culinária para ver se, ao observar um grupo de ingredientes, conseguimos determinar a sua origem culinária.\n", - "\n", - "### [**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/19/)\n", - "\n", - "### **Introdução**\n", - "\n", - "A classificação é uma das atividades fundamentais do investigador de machine learning e do cientista de dados. Desde a classificação básica de um valor binário (\"este email é spam ou não?\"), até à classificação e segmentação complexa de imagens usando visão computacional, é sempre útil poder organizar dados em classes e fazer perguntas sobre eles.\n", - "\n", - "Para expressar o processo de forma mais científica, o seu método de classificação cria um modelo preditivo que permite mapear a relação entre variáveis de entrada e variáveis de saída.\n", - "\n", - "

\n", - " \n", - "

Problemas binários vs. multicategorias para algoritmos de classificação. Infográfico por Jen Looper
\n", - "\n", - "\n", - "\n", - "Antes de começar o processo de limpar os nossos dados, visualizá-los e prepará-los para as nossas tarefas de ML, vamos aprender um pouco sobre as várias formas como o machine learning pode ser utilizado para classificar dados.\n", - "\n", - "Derivada da [estatística](https://wikipedia.org/wiki/Statistical_classification), a classificação usando machine learning clássico utiliza características, como `fumador`, `peso` e `idade`, para determinar *probabilidade de desenvolver X doença*. Como uma técnica de aprendizagem supervisionada semelhante aos exercícios de regressão que realizou anteriormente, os seus dados são rotulados e os algoritmos de ML utilizam esses rótulos para classificar e prever classes (ou 'características') de um conjunto de dados e atribuí-los a um grupo ou resultado.\n", - "\n", - "✅ Tire um momento para imaginar um conjunto de dados sobre culinárias. O que um modelo multicategorias seria capaz de responder? O que um modelo binário seria capaz de responder? E se quisesse determinar se uma determinada culinária provavelmente utiliza feno-grego? E se quisesse ver se, dado um saco de compras cheio de anis-estrelado, alcachofras, couve-flor e rábano, conseguiria criar um prato típico indiano?\n", - "\n", - "### **Olá 'classificador'**\n", - "\n", - "A pergunta que queremos fazer a este conjunto de dados de culinária é, na verdade, uma questão **multicategorias**, já que temos várias possíveis culinárias nacionais com que trabalhar. Dado um lote de ingredientes, a qual destas muitas classes os dados se encaixam?\n", - "\n", - "O Tidymodels oferece vários algoritmos diferentes para classificar dados, dependendo do tipo de problema que deseja resolver. Nas próximas duas lições, aprenderá sobre alguns desses algoritmos.\n", - "\n", - "#### **Pré-requisitos**\n", - "\n", - "Para esta lição, precisaremos dos seguintes pacotes para limpar, preparar e visualizar os nossos dados:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [coleção de pacotes](https://www.tidymodels.org/packages/) para modelagem e machine learning.\n", - "\n", - "- `DataExplorer`: O [pacote DataExplorer](https://cran.r-project.org/web/packages/DataExplorer/vignettes/dataexplorer-intro.html) foi criado para simplificar e automatizar o processo de EDA e geração de relatórios.\n", - "\n", - "- `themis`: O [pacote themis](https://themis.tidymodels.org/) fornece passos extras de receitas para lidar com dados desequilibrados.\n", - "\n", - "Pode instalá-los como:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"DataExplorer\", \"here\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se tem os pacotes necessários para completar este módulo e instala-os caso estejam em falta.\n" - ], - "metadata": { - "id": "ri5bQxZ-Fz_0" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\r\n", - "\r\n", - "pacman::p_load(tidyverse, tidymodels, DataExplorer, themis, here)" - ], - "outputs": [], - "metadata": { - "id": "KIPxa4elGAPI" - } - }, - { - "cell_type": "markdown", - "source": [ - "Mais tarde, iremos carregar estes pacotes incríveis e torná-los disponíveis na nossa sessão atual de R. (Isto é apenas para ilustração, `pacman::p_load()` já fez isso por si)\n" - ], - "metadata": { - "id": "YkKAxOJvGD4C" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Exercício - limpar e equilibrar os seus dados\n", - "\n", - "A primeira tarefa, antes de começar este projeto, é limpar e **equilibrar** os seus dados para obter melhores resultados.\n", - "\n", - "Vamos conhecer os dados! 🕵️\n" - ], - "metadata": { - "id": "PFkQDlk0GN5O" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Import data\r\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/4-Classification/data/cuisines.csv\")\r\n", - "\r\n", - "# View the first 5 rows\r\n", - "df %>% \r\n", - " slice_head(n = 5)\r\n" - ], - "outputs": [], - "metadata": { - "id": "Qccw7okxGT0S" - } - }, - { - "cell_type": "markdown", - "source": [ - "Interessante! Pelo que parece, a primeira coluna é uma espécie de coluna `id`. Vamos obter um pouco mais de informações sobre os dados.\n" - ], - "metadata": { - "id": "XrWnlgSrGVmR" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Basic information about the data\r\n", - "df %>%\r\n", - " introduce()\r\n", - "\r\n", - "# Visualize basic information above\r\n", - "df %>% \r\n", - " plot_intro(ggtheme = theme_light())" - ], - "outputs": [], - "metadata": { - "id": "4UcGmxRxGieA" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir dos resultados, podemos ver imediatamente que temos `2448` linhas e `385` colunas e `0` valores em falta. Também temos 1 coluna discreta, *cuisine*.\n", - "\n", - "## Exercício - aprender sobre cozinhas\n", - "\n", - "Agora o trabalho começa a tornar-se mais interessante. Vamos descobrir a distribuição dos dados, por cozinha.\n" - ], - "metadata": { - "id": "AaPubl__GmH5" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Count observations per cuisine\r\n", - "df %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(n)\r\n", - "\r\n", - "# Plot the distribution\r\n", - "theme_set(theme_light())\r\n", - "df %>% \r\n", - " count(cuisine) %>% \r\n", - " ggplot(mapping = aes(x = n, y = reorder(cuisine, -n))) +\r\n", - " geom_col(fill = \"midnightblue\", alpha = 0.7) +\r\n", - " ylab(\"cuisine\")" - ], - "outputs": [], - "metadata": { - "id": "FRsBVy5eGrrv" - } - }, - { - "cell_type": "markdown", - "source": [ - "Existem um número finito de cozinhas, mas a distribuição dos dados é desigual. Pode resolver isso! Antes de o fazer, explore um pouco mais.\n", - "\n", - "De seguida, vamos atribuir cada cozinha ao seu próprio tibble e descobrir quantos dados estão disponíveis (linhas, colunas) por cozinha.\n", - "\n", - "> Um [tibble](https://tibble.tidyverse.org/) é uma versão moderna de um data frame.\n", - "\n", - "

\n", - " \n", - "

Ilustração por @allison_horst
\n" - ], - "metadata": { - "id": "vVvyDb1kG2in" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Create individual tibble for the cuisines\r\n", - "thai_df <- df %>% \r\n", - " filter(cuisine == \"thai\")\r\n", - "japanese_df <- df %>% \r\n", - " filter(cuisine == \"japanese\")\r\n", - "chinese_df <- df %>% \r\n", - " filter(cuisine == \"chinese\")\r\n", - "indian_df <- df %>% \r\n", - " filter(cuisine == \"indian\")\r\n", - "korean_df <- df %>% \r\n", - " filter(cuisine == \"korean\")\r\n", - "\r\n", - "\r\n", - "# Find out how much data is available per cuisine\r\n", - "cat(\" thai df:\", dim(thai_df), \"\\n\",\r\n", - " \"japanese df:\", dim(japanese_df), \"\\n\",\r\n", - " \"chinese_df:\", dim(chinese_df), \"\\n\",\r\n", - " \"indian_df:\", dim(indian_df), \"\\n\",\r\n", - " \"korean_df:\", dim(korean_df))" - ], - "outputs": [], - "metadata": { - "id": "0TvXUxD3G8Bk" - } - }, - { - "cell_type": "markdown", - "source": [ - "## **Exercício - Descobrir os principais ingredientes por cozinha usando dplyr**\n", - "\n", - "Agora pode explorar mais profundamente os dados e descobrir quais são os ingredientes típicos de cada cozinha. Deve limpar os dados recorrentes que criam confusão entre as cozinhas, então vamos aprender sobre este problema.\n", - "\n", - "Crie uma função `create_ingredient()` em R que devolva um dataframe de ingredientes. Esta função começará por remover uma coluna pouco útil e organizar os ingredientes pelo seu número de ocorrências.\n", - "\n", - "A estrutura básica de uma função em R é:\n", - "\n", - "`myFunction <- function(arglist){`\n", - "\n", - "**`...`**\n", - "\n", - "**`return`**`(value)`\n", - "\n", - "`}`\n", - "\n", - "Uma introdução prática às funções em R pode ser encontrada [aqui](https://skirmer.github.io/presentations/functions_with_r.html#1).\n", - "\n", - "Vamos direto ao assunto! Vamos utilizar os [verbos dplyr](https://dplyr.tidyverse.org/) que temos vindo a aprender nas nossas lições anteriores. Como resumo:\n", - "\n", - "- `dplyr::select()`: ajuda a escolher quais **colunas** manter ou excluir.\n", - "\n", - "- `dplyr::pivot_longer()`: ajuda a \"alongar\" os dados, aumentando o número de linhas e diminuindo o número de colunas.\n", - "\n", - "- `dplyr::group_by()` e `dplyr::summarise()`: ajudam a encontrar estatísticas resumidas para diferentes grupos e colocá-las numa tabela organizada.\n", - "\n", - "- `dplyr::filter()`: cria um subconjunto dos dados contendo apenas as linhas que satisfazem as suas condições.\n", - "\n", - "- `dplyr::mutate()`: ajuda a criar ou modificar colunas.\n", - "\n", - "Confira este [tutorial *artístico* learnr](https://allisonhorst.shinyapps.io/dplyr-learnr/#section-welcome) de Allison Horst, que introduz algumas funções úteis de manipulação de dados no dplyr *(parte do Tidyverse)*.\n" - ], - "metadata": { - "id": "K3RF5bSCHC76" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Creates a functions that returns the top ingredients by class\r\n", - "\r\n", - "create_ingredient <- function(df){\r\n", - " \r\n", - " # Drop the id column which is the first colum\r\n", - " ingredient_df = df %>% select(-1) %>% \r\n", - " # Transpose data to a long format\r\n", - " pivot_longer(!cuisine, names_to = \"ingredients\", values_to = \"count\") %>% \r\n", - " # Find the top most ingredients for a particular cuisine\r\n", - " group_by(ingredients) %>% \r\n", - " summarise(n_instances = sum(count)) %>% \r\n", - " filter(n_instances != 0) %>% \r\n", - " # Arrange by descending order\r\n", - " arrange(desc(n_instances)) %>% \r\n", - " mutate(ingredients = factor(ingredients) %>% fct_inorder())\r\n", - " \r\n", - " \r\n", - " return(ingredient_df)\r\n", - "} # End of function" - ], - "outputs": [], - "metadata": { - "id": "uB_0JR82HTPa" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora podemos usar a função para obter uma ideia dos dez ingredientes mais populares por cozinha. Vamos testá-la com `thai_df`.\n" - ], - "metadata": { - "id": "h9794WF8HWmc" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Call create_ingredient and display popular ingredients\r\n", - "thai_ingredient_df <- create_ingredient(df = thai_df)\r\n", - "\r\n", - "thai_ingredient_df %>% \r\n", - " slice_head(n = 10)" - ], - "outputs": [], - "metadata": { - "id": "agQ-1HrcHaEA" - } - }, - { - "cell_type": "markdown", - "source": [ - "Na seção anterior, utilizámos `geom_col()`, vamos ver como pode usar `geom_bar` também, para criar gráficos de barras. Use `?geom_bar` para leitura adicional.\n" - ], - "metadata": { - "id": "kHu9ffGjHdcX" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Make a bar chart for popular thai cuisines\r\n", - "thai_ingredient_df %>% \r\n", - " slice_head(n = 10) %>% \r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"steelblue\") +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "fb3Bx_3DHj6e" - } - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "RHP_xgdkHnvM" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Japanese cuisines and make bar chart\r\n", - "create_ingredient(df = japanese_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"darkorange\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")\r\n" - ], - "outputs": [], - "metadata": { - "id": "019v8F0XHrRU" - } - }, - { - "cell_type": "markdown", - "source": [ - "E quanto às cozinhas chinesas?\n" - ], - "metadata": { - "id": "iIGM7vO8Hu3v" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Chinese cuisines and make bar chart\r\n", - "create_ingredient(df = chinese_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"cyan4\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "lHd9_gd2HyzU" - } - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "ir8qyQbNH1c7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Indian cuisines and make bar chart\r\n", - "create_ingredient(df = indian_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"#041E42FF\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "ApukQtKjH5FO" - } - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "qv30cwY1H-FM" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Get popular ingredients for Korean cuisines and make bar chart\r\n", - "create_ingredient(df = korean_df) %>% \r\n", - " slice_head(n = 10) %>%\r\n", - " ggplot(aes(x = n_instances, y = ingredients)) +\r\n", - " geom_bar(stat = \"identity\", width = 0.5, fill = \"#852419FF\", alpha = 0.8) +\r\n", - " xlab(\"\") + ylab(\"\")" - ], - "outputs": [], - "metadata": { - "id": "lumgk9cHIBie" - } - }, - { - "cell_type": "markdown", - "source": [ - "A partir das visualizações de dados, podemos agora eliminar os ingredientes mais comuns que geram confusão entre diferentes cozinhas, utilizando `dplyr::select()`.\n", - "\n", - "Toda a gente adora arroz, alho e gengibre!\n" - ], - "metadata": { - "id": "iO4veMXuIEta" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Drop id column, rice, garlic and ginger from our original data set\r\n", - "df_select <- df %>% \r\n", - " select(-c(1, rice, garlic, ginger))\r\n", - "\r\n", - "# Display new data set\r\n", - "df_select %>% \r\n", - " slice_head(n = 5)" - ], - "outputs": [], - "metadata": { - "id": "iHJPiG6rIUcK" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Pré-processamento de dados usando receitas 👩‍🍳👨‍🍳 - Lidando com dados desequilibrados ⚖️\n", - "\n", - "

\n", - " \n", - "

Ilustração por @allison_horst
\n", - "\n", - "Dado que esta lição é sobre culinárias, temos de colocar `recipes` em contexto.\n", - "\n", - "O Tidymodels oferece mais um pacote interessante: `recipes` - um pacote para pré-processamento de dados.\n" - ], - "metadata": { - "id": "kkFd-JxdIaL6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos dar uma olhada novamente na distribuição das nossas culinárias.\n" - ], - "metadata": { - "id": "6l2ubtTPJAhY" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Distribution of cuisines\r\n", - "old_label_count <- df_select %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))\r\n", - "\r\n", - "old_label_count" - ], - "outputs": [], - "metadata": { - "id": "1e-E9cb7JDVi" - } - }, - { - "cell_type": "markdown", - "source": [ - "Como pode ver, há uma distribuição bastante desigual no número de cozinhas. As cozinhas coreanas são quase 3 vezes mais numerosas do que as tailandesas. Dados desequilibrados frequentemente têm efeitos negativos no desempenho do modelo. Pense numa classificação binária. Se a maior parte dos seus dados pertence a uma classe, um modelo de ML vai prever essa classe com mais frequência, simplesmente porque há mais dados disponíveis para ela. Equilibrar os dados corrige qualquer desvio e ajuda a eliminar esse desequilíbrio. Muitos modelos têm o melhor desempenho quando o número de observações é igual e, por isso, tendem a ter dificuldades com dados desequilibrados.\n", - "\n", - "Existem principalmente duas formas de lidar com conjuntos de dados desequilibrados:\n", - "\n", - "- adicionar observações à classe minoritária: `Over-sampling`, por exemplo, utilizando um algoritmo SMOTE\n", - "\n", - "- remover observações da classe maioritária: `Under-sampling`\n", - "\n", - "Vamos agora demonstrar como lidar com conjuntos de dados desequilibrados utilizando uma `recipe`. Uma recipe pode ser vista como um plano que descreve quais passos devem ser aplicados a um conjunto de dados para prepará-lo para análise de dados.\n" - ], - "metadata": { - "id": "soAw6826JKx9" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load themis package for dealing with imbalanced data\r\n", - "library(themis)\r\n", - "\r\n", - "# Create a recipe for preprocessing data\r\n", - "cuisines_recipe <- recipe(cuisine ~ ., data = df_select) %>% \r\n", - " step_smote(cuisine)\r\n", - "\r\n", - "cuisines_recipe" - ], - "outputs": [], - "metadata": { - "id": "HS41brUIJVJy" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos analisar os nossos passos de pré-processamento.\n", - "\n", - "- A chamada para `recipe()` com uma fórmula indica à receita os *papéis* das variáveis usando os dados de `df_select` como referência. Por exemplo, a coluna `cuisine` foi atribuída ao papel de `outcome`, enquanto as restantes colunas foram atribuídas ao papel de `predictor`.\n", - "\n", - "- [`step_smote(cuisine)`](https://themis.tidymodels.org/reference/step_smote.html) cria uma *especificação* de um passo da receita que gera sinteticamente novos exemplos da classe minoritária utilizando os vizinhos mais próximos desses casos.\n", - "\n", - "Agora, se quisermos ver os dados pré-processados, teremos de [**`prep()`**](https://recipes.tidymodels.org/reference/prep.html) e [**`bake()`**](https://recipes.tidymodels.org/reference/bake.html) a nossa receita.\n", - "\n", - "`prep()`: estima os parâmetros necessários a partir de um conjunto de treino que podem ser posteriormente aplicados a outros conjuntos de dados.\n", - "\n", - "`bake()`: aplica uma receita preparada às operações em qualquer conjunto de dados.\n" - ], - "metadata": { - "id": "Yb-7t7XcJaC8" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Prep and bake the recipe\r\n", - "preprocessed_df <- cuisines_recipe %>% \r\n", - " prep() %>% \r\n", - " bake(new_data = NULL) %>% \r\n", - " relocate(cuisine)\r\n", - "\r\n", - "# Display data\r\n", - "preprocessed_df %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "# Quick summary stats\r\n", - "preprocessed_df %>% \r\n", - " introduce()" - ], - "outputs": [], - "metadata": { - "id": "9QhSgdpxJl44" - } - }, - { - "cell_type": "markdown", - "source": [ - "Vamos agora verificar a distribuição das nossas culinárias e compará-las com os dados desequilibrados.\n" - ], - "metadata": { - "id": "dmidELh_LdV7" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Distribution of cuisines\r\n", - "new_label_count <- preprocessed_df %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))\r\n", - "\r\n", - "list(new_label_count = new_label_count,\r\n", - " old_label_count = old_label_count)" - ], - "outputs": [], - "metadata": { - "id": "aSh23klBLwDz" - } - }, - { - "cell_type": "markdown", - "source": [ - "Yum! Os dados estão limpos, equilibrados e muito deliciosos 😋!\n", - "\n", - "> Normalmente, uma receita é usada como um pré-processador para modelagem, onde define quais passos devem ser aplicados a um conjunto de dados para prepará-lo para a modelagem. Nesse caso, um `workflow()` é geralmente utilizado (como já vimos nas nossas lições anteriores) em vez de estimar manualmente uma receita.\n", - ">\n", - "> Assim, normalmente não é necessário **`prep()`** e **`bake()`** receitas quando se utiliza tidymodels, mas estas são funções úteis para ter na sua caixa de ferramentas para confirmar que as receitas estão a fazer o que espera, como no nosso caso.\n", - ">\n", - "> Quando se **`bake()`** uma receita preparada com **`new_data = NULL`**, obtém-se de volta os dados que foram fornecidos ao definir a receita, mas que passaram pelos passos de pré-processamento.\n", - "\n", - "Vamos agora guardar uma cópia destes dados para usar em lições futuras:\n" - ], - "metadata": { - "id": "HEu80HZ8L7ae" - } - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Save preprocessed data\r\n", - "write_csv(preprocessed_df, \"../../../data/cleaned_cuisines_R.csv\")" - ], - "outputs": [], - "metadata": { - "id": "cBmCbIgrMOI6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Este novo CSV pode agora ser encontrado na pasta raiz de dados.\n", - "\n", - "**🚀Desafio**\n", - "\n", - "Este currículo contém vários conjuntos de dados interessantes. Explore as pastas `data` e veja se alguma contém conjuntos de dados que seriam apropriados para classificação binária ou multi-classe. Que perguntas faria sobre este conjunto de dados?\n", - "\n", - "## [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/20/)\n", - "\n", - "## **Revisão & Estudo Individual**\n", - "\n", - "- Veja o [pacote themis](https://github.com/tidymodels/themis). Que outras técnicas poderíamos usar para lidar com dados desbalanceados?\n", - "\n", - "- Site de referência dos [modelos tidy](https://www.tidymodels.org/start/).\n", - "\n", - "- H. Wickham e G. Grolemund, [*R for Data Science: Visualize, Model, Transform, Tidy, and Import Data*](https://r4ds.had.co.nz/).\n", - "\n", - "#### OBRIGADO A:\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "[Cassie Breviu](https://www.twitter.com/cassieview) e [Jen Looper](https://www.twitter.com/jenlooper) por criarem a versão original em Python deste módulo ♥️\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "WQs5621pMGwf" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/1-Introduction/solution/notebook.ipynb b/translations/pt/4-Classification/1-Introduction/solution/notebook.ipynb deleted file mode 100644 index 57d5f3950..000000000 --- a/translations/pt/4-Classification/1-Introduction/solution/notebook.ipynb +++ /dev/null @@ -1,728 +0,0 @@ -{ - "cells": [ - { - "source": [ - "# Deliciosas Cozinhas Asiáticas e Indianas\n", - "\n", - "## Introdução\n", - "\n", - "A culinária asiática e indiana é conhecida pela sua diversidade de sabores, ingredientes únicos e técnicas de preparação. Este guia oferece uma visão geral de algumas receitas populares e dicas para recriar esses pratos em casa.\n", - "\n", - "## Ingredientes Essenciais\n", - "\n", - "### Cozinha Asiática\n", - "- Molho de soja\n", - "- Óleo de sésamo\n", - "- Gengibre fresco\n", - "- Alho\n", - "- Vinagre de arroz\n", - "- Pasta de miso\n", - "\n", - "### Cozinha Indiana\n", - "- Garam masala\n", - "- Cúrcuma\n", - "- Cominhos\n", - "- Cardamomo\n", - "- Ghee\n", - "- Lentilhas\n", - "\n", - "[!TIP] Certifique-se de usar ingredientes frescos para obter o melhor sabor possível.\n", - "\n", - "## Receitas Populares\n", - "\n", - "### Frango Teriyaki\n", - "O frango teriyaki é um prato japonês clássico que combina sabores doces e salgados. Para preparar, siga os passos abaixo:\n", - "\n", - "1. Misture molho de soja, açúcar e vinagre de arroz para criar o molho teriyaki.\n", - "2. Cozinhe o frango numa frigideira até ficar dourado.\n", - "3. Adicione o molho e deixe reduzir até engrossar.\n", - "4. Sirva com arroz branco e vegetais cozidos.\n", - "\n", - "### Caril de Lentilhas\n", - "O caril de lentilhas é uma opção vegetariana rica em proteínas e cheia de sabor. Para preparar:\n", - "\n", - "1. Refogue cebola, alho e gengibre em ghee.\n", - "2. Adicione cúrcuma, cominhos e garam masala.\n", - "3. Misture lentilhas cozidas e tomate picado.\n", - "4. Deixe cozinhar até os sabores se misturarem.\n", - "5. Sirva com arroz basmati ou pão naan.\n", - "\n", - "[!NOTE] Ajuste o nível de picante conforme o seu gosto.\n", - "\n", - "## Dicas de Cozinha\n", - "\n", - "- **Planeie com antecedência:** Muitos pratos asiáticos e indianos requerem marinadas ou tempos de cozimento prolongados.\n", - "- **Use utensílios adequados:** Uma wok ou uma panela de fundo pesado pode fazer toda a diferença.\n", - "- **Experimente:** Não tenha medo de ajustar os temperos para criar o seu próprio toque pessoal.\n", - "\n", - "[!WARNING] Alguns ingredientes, como o molho de soja, podem conter altos níveis de sódio. Use com moderação.\n", - "\n", - "## Conclusão\n", - "\n", - "Cozinhar pratos asiáticos e indianos em casa pode ser uma experiência gratificante e deliciosa. Com os ingredientes certos e um pouco de prática, você pode trazer os sabores autênticos dessas cozinhas para a sua mesa.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "Instale o Imblearn, que permitirá o SMOTE. Este é um pacote do Scikit-learn que ajuda a lidar com dados desequilibrados ao realizar classificação. (https://imbalanced-learn.org/stable/)\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: imblearn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.0)\n", - "Requirement already satisfied: imbalanced-learn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imblearn) (0.8.0)\n", - "Requirement already satisfied: numpy>=1.13.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (1.19.2)\n", - "Requirement already satisfied: scipy>=0.19.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (1.4.1)\n", - "Requirement already satisfied: scikit-learn>=0.24 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (0.24.2)\n", - "Requirement already satisfied: joblib>=0.11 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from imbalanced-learn->imblearn) (0.16.0)\n", - "Requirement already satisfied: threadpoolctl>=2.0.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from scikit-learn>=0.24->imbalanced-learn->imblearn) (2.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install imblearn" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "import matplotlib as mpl\n", - "import numpy as np\n", - "from imblearn.over_sampling import SMOTE" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "df = pd.read_csv('../../data/cuisines.csv')" - ] - }, - { - "source": [ - "Este conjunto de dados inclui 385 colunas que indicam todos os tipos de ingredientes em várias cozinhas de um determinado conjunto de cozinhas.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 65 indian 0 0 0 0 0 \n", - "1 66 indian 1 0 0 0 0 \n", - "2 67 indian 0 0 0 0 0 \n", - "3 68 indian 0 0 0 0 0 \n", - "4 69 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 385 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
065indian00000000...0000000000
166indian10000000...0000000000
267indian00000000...0000000000
368indian00000000...0000000000
469indian00000000...0000000010
\n

5 rows × 385 columns

\n
" - }, - "metadata": {}, - "execution_count": 4 - } - ], - "source": [ - "df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\nRangeIndex: 2448 entries, 0 to 2447\nColumns: 385 entries, Unnamed: 0 to zucchini\ndtypes: int64(384), object(1)\nmemory usage: 7.2+ MB\n" - ] - } - ], - "source": [ - "df.info()" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "korean 799\n", - "indian 598\n", - "chinese 442\n", - "japanese 320\n", - "thai 289\n", - "Name: cuisine, dtype: int64" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ], - "source": [ - "df.cuisine.value_counts()" - ] - }, - { - "source": [ - "Mostrar as cozinhas num gráfico de barras\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 7 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAZEAAAD4CAYAAAAtrdtxAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAASY0lEQVR4nO3df7TldV3v8eerGZkRRoeAiXtE5UgNIkUCjlwQIzAiC7NscdcSbcmsfkxl5SXX0juuyzK9d3UvlXnpplajma0kMtCUhluImNcr8msGBmb4pZaTQCFQOYom0fi+f+zPkd14hpnzOWefvYfzfKy113z35/vde7/22fvMa3++3733SVUhSVKPbxt3AEnSgcsSkSR1s0QkSd0sEUlSN0tEktRt+bgDLKYjjjiipqenxx1Dkg4oW7dufbiq1sy2bkmVyPT0NFu2bBl3DEk6oCT5u72tc3eWJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqduS+sT69vt3Mb3xqnHH0ALZefG5444gLXnORCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd0sEUlSN0tEktRtIkokyaFJXtuWz0yyeY6X/29Jzh5NOknS3kxEiQCHAq/tvXBVvbmqPraAeSRJ+2FSSuRi4DuTbAN+E1iV5Iokdye5NEkAkrw5yc1JdiTZNDT+viTnjTG/JC1Jk1IiG4G/qaoTgTcAJwEXAscDxwCnt+3eUVUvrKrvAZ4KvGxfV5xkQ5ItSbbs/tqu0aSXpCVqUkpkTzdV1X1V9Q1gGzDdxs9KcmOS7cBLgO/e1xVV1aaqWldV65YdvHp0iSVpCZrUL2B8dGh5N7A8yUrgXcC6qro3yVuAleMIJ0kamJSZyFeAp+1jm5nCeDjJKsBjIJI0ZhMxE6mqf0xyXZIdwL8AX5xlmy8leTewA3gAuHmRY0qS9jARJQJQVa/ay/gvDS1fBFw0yzbrR5dMkrQ3k7I7S5J0ALJEJEndLBFJUjdLRJLUzRKRJHWbmHdnLYYTjlrNlovPHXcMSXrScCYiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6rZ83AEW0/b7dzG98apxx9CY7Lz43HFHkJ50nIlIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG77VSJJPj3qIJKkA89+lUhVvWjUQSRJB579nYk8kmRVkmuT3JJke5Ifa+umk9yd5NIkdyW5IsnBbd2bk9ycZEeSTUnSxj+R5NeT3JTkM0m+r40vS/Kb7TK3J/m5Nj6V5JNJtrXrmtn+nCTXt0yXJ1k1ih+SJGl2czkm8nXgFVV1MnAW8FszpQA8F3hXVT0P+DLw2jb+jqp6YVV9D/BU4GVD17e8qk4BLgR+tY39NLCrql4IvBD42STPAV4FXF1VJwLPB7YlOQK4CDi7ZdoCvH4ud16SND9z+dqTAP8jyRnAN4CjgCPbunur6rq2/H7gdcDbgLOSvBE4GDgMuAP4i7bdh9q/W4HptnwO8L1JzmvnVwNrgZuB9yZ5CvDhqtqW5PuB44HrWpcdBFz/LaGTDcAGgGVPXzOHuytJ2pe5lMirgTXAC6rqsSQ7gZVtXe2xbSVZCbwLWFdV9yZ5y9D2AI+2f3cP5Qjwy1V19Z433srrXOB9Sd4O/DNwTVWd/0Shq2oTsAlgxdTaPXNKkuZhLruzVgMPtgI5Czh6aN2zk5zWll8FfIrHC+PhdqziPPbtauAX2oyDJMcmOSTJ0cAXq+rdwHuAk4EbgNOTfFfb9pAkx87h/kiS5ml/ZyIFXAr8RZLtDI4/3D20/h7gF5O8F7gT+N2q+lqSdwM7gAcY7JLal/cw2LV1Szve8hDw48CZwBuSPAY8Arymqh5Ksh64LMmKdvmLgM/s532SJM1Tqp54D0+Sw4FbqurovayfBja3g+cTbcXU2pq64JJxx9CY+FXwUp8kW6tq3WzrnnB3VpJnMDhY/bZRBJMkHdiecHdWVf098ITHGapqJzDxsxBJ0sLzu7MkSd0sEUlSN0tEktRtLh82POCdcNRqtvgOHUlaMM5EJEndLBFJUjdLRJLUzRKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd0sEUlSN0tEktTNEpEkdbNEJEndLBFJUjdLRJLUzRKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd2WjzvAYtp+/y6mN1417hhSt50XnzvuCNK/40xEktTNEpEkdbNEJEndLBFJUjdLRJLUzRKRJHWzRCRJ3Ra0RJK8L8l5s4w/I8kVC3lbkqTxW5QPG1bV3wPfUi6SpAPbvGYiSV6T5PYktyX54zZ8RpJPJ/nbmVlJkukkO9ry+iQfSvJXST6b5DeGru+cJNcnuSXJ5UlWtfGLk9zZbuttbWxNkg8mubmdTp/PfZEkzV33TCTJdwMXAS+qqoeTHAa8HZgCXgwcB1wJzLYb60TgJOBR4J4kvwP8S7u+s6vqq0n+C/D6JO8EXgEcV1WV5NB2Hb8N/K+q+lSSZwNXA8+bJecGYAPAsqev6b27kqRZzGd31kuAy6vqYYCq+qckAB+uqm8AdyY5ci+XvbaqdgEkuRM4GjgUOB64rl3PQcD1wC7g68AfJNkMbG7XcTZwfNsW4OlJVlXVI8M3VFWbgE0AK6bW1jzuryRpD6M4JvLo0HL2Y5vdLUeAa6rq/D03TnIK8AMMjqv8EoMC+zbg1Kr6+kKEliTN3XyOiXwc+E9JDgdou7Pm4wbg9CTf1a7vkCTHtuMiq6vq/wC/Ajy/bf9R4JdnLpzkxHneviRpjrpnIlV1R5JfA/5vkt3ArfMJUlUPJVkPXJZkRRu+CPgK8JEkKxnMVl7f1r0OeGeS2xncj08CPz+fDJKkuUnV0jlMsGJqbU1dcMm4Y0jd/HsiGockW6tq3Wzr/MS6JKmbJSJJ6maJSJK6WSKSpG6WiCSp26J8AeOkOOGo1Wzx3S2StGCciUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6LR93gMW0/f5dTG+8atwxJM3RzovPHXcE7YUzEUlSN0tEktTNEpEkdbNEJEndLBFJUjdLRJLUbWQlkuTTc9z+zCSb2/LLk2wcTTJJ0kIZ2edEqupF87jslcCVCxhHkjQCo5yJPNL+PTPJJ5JckeTuJJcmSVv30jZ2C/ATQ5ddn+QdbflHk9yY5NYkH0tyZBt/S5L3tuv+2ySvG9V9kSTNbrGOiZwEXAgcDxwDnJ5kJfBu4EeBFwD/YS+X/RRwalWdBPwp8MahdccBPwScAvxqkqeMJr4kaTaL9bUnN1XVfQBJtgHTwCPA56vqs238/cCGWS77TOADSaaAg4DPD627qqoeBR5N8iBwJHDf8IWTbJi53mVPX7OQ90mSlrzFmok8OrS8m7mV1+8A76iqE4CfA1bO5XqralNVrauqdcsOXj2Hm5Uk7cs43+J7NzCd5Dvb+fP3st1q4P62fMHIU0mS9tvYSqSqvs5gN9NV7cD6g3vZ9C3A5Um2Ag8vUjxJ0n5IVY07w6JZMbW2pi64ZNwxJM2RXwU/Xkm2VtW62db5iXVJUjdLRJLUzRKRJHWzRCRJ3SwRSVK3xfrE+kQ44ajVbPFdHpK0YJyJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrpZIpKkbpaIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqZolIkrotH3eAxbT9/l1Mb7xq3DEkaVHtvPjckV23MxFJUjdLRJLUzRKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1W9ASSTKdZMdCXqckaXJNxEwkyZL60KMkPVmMrESSHJPk1iTfl+QPk2xv589q69cnuTLJx4Fr29gbktyc5PYkbx26rg8n2ZrkjiQbhsYfSfJrSW5LckOSI0d1fyRJ32okJZLkucAHgfXAKUBV1QnA+cAfJVnZNj0ZOK+qvj/JOcDatv2JwAuSnNG2+6mqegGwDnhdksPb+CHADVX1fOCTwM/OkmVDki1Jtuz+2q5R3F1JWrJGUSJrgI8Ar66q24AXA+8HqKq7gb8Djm3bXlNV/9SWz2mnW4FbgOMYlAoMiuM24AbgWUPj/wpsbstbgek9w1TVpqpaV1Xrlh28eqHuoySJ0XwB4y7gCwzK4859bPvVoeUA/7Oqfn94gyRnAmcDp1XV15J8ApiZyTxWVdWWd7PEvlBSksZtFDORfwVeAbwmyauA/we8GiDJscCzgXtmudzVwE8lWdW2PSrJdwCrgX9uBXIccOoIMkuSOozklXtVfTXJy4BrgP8OnJBkO/BvwPqqejTJnpf5aJLnAde3dY8APwn8FfDzSe5iUD43jCKzJGnu8vjeoCe/FVNra+qCS8YdQ5IW1Xz/nkiSrVW1brZ1E/E5EUnSgckSkSR1s0QkSd0sEUlSN0tEktRtSX0474SjVrNlnu9SkCQ9zpmIJKmbJSJJ6maJSJK6WSKSpG6WiCSpmyUiSepmiUiSulkikqRulogkqZslIknqtqT+KFWSrzD7n+adFEcAD487xBMw3/yYb37MNz/zyXd0Va2ZbcWS+u4s4J69/XWuSZBki/n6mW9+zDc/SzWfu7MkSd0sEUlSt6VWIpvGHWAfzDc/5psf883Pksy3pA6sS5IW1lKbiUiSFpAlIknqtmRKJMlLk9yT5HNJNo4pw3uTPJhkx9DYYUmuSfLZ9u+3t/Ek+d8t7+1JTl6EfM9K8tdJ7kxyR5L/PEkZk6xMclOS21q+t7bx5yS5seX4QJKD2viKdv5zbf30KPO121yW5NYkmycw284k25NsS7KljU3EY9tu89AkVyS5O8ldSU6blHxJntt+bjOnLye5cFLytdv8lfZ7sSPJZe33ZfTPv6p60p+AZcDfAMcABwG3AcePIccZwMnAjqGx3wA2tuWNwK+35R8B/hIIcCpw4yLkmwJObstPAz4DHD8pGdvtrGrLTwFubLf7Z8Ar2/jvAb/Qll8L/F5bfiXwgUX4Gb4e+BNgczs/Sdl2AkfsMTYRj227zT8CfqYtHwQcOkn5hnIuAx4Ajp6UfMBRwOeBpw4979YvxvNvUX7o4z4BpwFXD51/E/CmMWWZ5t+XyD3AVFueYvCBSIDfB86fbbtFzPoR4AcnMSNwMHAL8B8ZfAp3+Z6PNXA1cFpbXt62ywgzPRO4FngJsLn9BzIR2drt7ORbS2QiHltgdftPMJOYb49M5wDXTVI+BiVyL3BYez5tBn5oMZ5/S2V31swPeMZ9bWwSHFlV/9CWHwCObMtjzdymtycxeLU/MRnb7qJtwIPANQxmmF+qqn+bJcM387X1u4DDRxjvEuCNwDfa+cMnKBtAAR9NsjXJhjY2KY/tc4CHgD9suwPfk+SQCco37JXAZW15IvJV1f3A24AvAP/A4Pm0lUV4/i2VEjkg1OBlwdjfc51kFfBB4MKq+vLwunFnrKrdVXUig1f9pwDHjSvLsCQvAx6sqq3jzvIEXlxVJwM/DPxikjOGV475sV3OYFfv71bVScBXGewe+qZxP/cA2jGFlwOX77lunPnasZgfY1DGzwAOAV66GLe9VErkfuBZQ+ef2cYmwReTTAG0fx9s42PJnOQpDArk0qr60CRmBKiqLwF/zWCKfmiSme+BG87wzXxt/WrgH0cU6XTg5Ul2An/KYJfWb09INuCbr1apqgeBP2dQwpPy2N4H3FdVN7bzVzAolUnJN+OHgVuq6ovt/KTkOxv4fFU9VFWPAR9i8Jwc+fNvqZTIzcDa9k6FgxhMR68cc6YZVwIXtOULGByHmBl/TXuXx6nArqFp80gkCfAHwF1V9fZJy5hkTZJD2/JTGRyvuYtBmZy3l3wzuc8DPt5eLS64qnpTVT2zqqYZPL8+XlWvnoRsAEkOSfK0mWUG+/V3MCGPbVU9ANyb5Llt6AeAOycl35DzeXxX1kyOScj3BeDUJAe33+OZn9/on3+LcSBqEk4M3i3xGQb70P/rmDJcxmB/5WMMXnn9NIP9kNcCnwU+BhzWtg3wzpZ3O7BuEfK9mMF0/HZgWzv9yKRkBL4XuLXl2wG8uY0fA9wEfI7BboYVbXxlO/+5tv6YRXqcz+Txd2dNRLaW47Z2umPmd2BSHtt2mycCW9rj+2Hg2ycs3yEMXq2vHhqbpHxvBe5uvxt/DKxYjOefX3siSeq2VHZnSZJGwBKRJHWzRCRJ3SwRSVI3S0SS1M0SkSR1s0QkSd3+PxNFbW14TY8fAAAAAElFTkSuQmCC\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df.cuisine.value_counts().plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "thai df: (289, 385)\njapanese df: (320, 385)\nchinese df: (442, 385)\nindian df: (598, 385)\nkorean df: (799, 385)\n" - ] - } - ], - "source": [ - "\n", - "thai_df = df[(df.cuisine == \"thai\")]\n", - "japanese_df = df[(df.cuisine == \"japanese\")]\n", - "chinese_df = df[(df.cuisine == \"chinese\")]\n", - "indian_df = df[(df.cuisine == \"indian\")]\n", - "korean_df = df[(df.cuisine == \"korean\")]\n", - "\n", - "print(f'thai df: {thai_df.shape}')\n", - "print(f'japanese df: {japanese_df.shape}')\n", - "print(f'chinese df: {chinese_df.shape}')\n", - "print(f'indian df: {indian_df.shape}')\n", - "print(f'korean df: {korean_df.shape}')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "def create_ingredient_df(df):\n", - " # transpose df, drop cuisine and unnamed rows, sum the row to get total for ingredient and add value header to new df\n", - " ingredient_df = df.T.drop(['cuisine','Unnamed: 0']).sum(axis=1).to_frame('value')\n", - " # drop ingredients that have a 0 sum\n", - " ingredient_df = ingredient_df[(ingredient_df.T != 0).any()]\n", - " # sort df\n", - " ingredient_df = ingredient_df.sort_values(by='value', ascending=False, inplace=False)\n", - " return ingredient_df\n" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 10 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "thai_ingredient_df = create_ingredient_df(thai_df)\r\n", - "thai_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 11 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "japanese_ingredient_df = create_ingredient_df(japanese_df)\r\n", - "japanese_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 12 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "chinese_ingredient_df = create_ingredient_df(chinese_df)\r\n", - "chinese_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 13 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAaYAAAD4CAYAAACngkIwAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAfTElEQVR4nO3de5RXdb3/8ecLHEEdQkU0fngZNBRFBGH0eMtMTSs17QjiL0tMj/ws01ylHUrr4MnWsU4Xu1iGHsPMo1zSBcVKLe+aF2ZAbhJqggWSgOUkGoTj+/fH/ox8HecK35m9v8zrsdZ3zd6f/dmf/d6f9WXefPbesz+KCMzMzIqiV94BmJmZlXJiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQtku7wC2BbvttlvU1NTkHYaZWUWpr69fFxEDm5c7MZVBTU0NdXV1eYdhZlZRJL3YUrkv5ZmZWaE4MZmZWaE4MZmZWaH4HpOZWTfYtGkTK1euZMOGDXmH0u369u3LnnvuSVVVVYfqOzGVwaJVDdRMmpN3GLaNWnHtKXmHYGWwcuVK+vXrR01NDZLyDqfbRASvvPIKK1euZMiQIR3ax5fyzMy6wYYNGxgwYECPSkoAkhgwYECnRopdnpgkXSppqaTbuvpY5SBphaTd8o7DzLY9PS0pNenseXfHpbzPAidGxMpuONbbJG0XEW925zHNzGzrdWliknQDsC/wG0l3APsBBwNVwOSImCXpPOBjwI5p+10R8aW0//qIqE7LY4FTI+I8SfsBtwE7AbOAyyKiWtJxwNeBvwHDgP0lfRK4FNgeeBL4bEQ0SjoJuBroA/wR+HRErC+JfQfgTuDOiLixyzrJzHqkct+XLve9yOrqatavX99+xS7QpZfyIuIi4CXgg2RJ5P6IODyt/7eknVLVUcB4YAQwXtJe7TT9feD7ETECaD4SGw18PiL2l3RgavfoiBgFNALnpEt1V5GN5EYDdcAXStqoBn4F3N5aUpI0UVKdpLrGNxra7wwzM+uQ7nz44SRgkqSngQeBvsDeadt9EdEQERuAZ4B92mnrSGBGWv7fZtueiojlafkEYAwwNx33BLIR3BHAQcBjqXxCs2POAn4WET9vLYCImBIRtRFR23vH/u2Ea2aWr0mTJnH99de/vT558mSuueYaTjjhBEaPHs2IESOYNWvWu/Z78MEHOfXUU99e/9znPsfUqVMBqK+v5wMf+ABjxozh5JNPZvXq1WWJtTsTk4AzI2JU+uwdEUvTto0l9RrZfImxdN73vh08zuvNjnlLyTEPiIjJqfy3JeUHRcQFJfs9BnxYPfVOpZltc8aPH8/06dPfXp8+fToTJkzgrrvuYt68eTzwwAN88YtfJCLaaGWzTZs2cckllzBz5kzq6+s5//zzufLKK8sSa3cmpnuAS5p+2Us6tAP7vCzpQEm9gI+XlD8BnJmWz25j//uAsZJ2T8fcVdI+af+jJb0vle8kaf+S/b5Gdp/q+uYNmplVokMPPZQ1a9bw0ksvsWDBAnbZZRfe+9738pWvfIVDDjmEE088kVWrVvHyyy93qL1ly5axePFiPvShDzFq1CiuueYaVq4szzNu3fkHtl8HrgMWpkSzHDi17V2YBPwaWEt2H6g6lV8G/ELSlcDdQIs3eSLiGUlXAfemY24CLo6IJ9JDF7dL6pOqXwU8W7L754GbJX2r6WEMM7NKNm7cOGbOnMlf/vIXxo8fz2233cbatWupr6+nqqqKmpqad/290Xbbbcdbb7319nrT9ohg+PDhPP7442WPs8sTU0TUlKz+vxa2TwWmlqyfWrI8E5jZQrOrgCMiIiSdDRyQ6j9Idv+qtP1pwLQWjns/cFg78X66hWObmVWk8ePHc+GFF7Ju3Toeeughpk+fzu67705VVRUPPPAAL7747lko9tlnH5555hk2btzIP/7xD+677z6OOeYYDjjgANauXcvjjz/OkUceyaZNm3j22WcZPnz4VsdZqa8kGgP8KF0WfBU4P89gRgzuT51fG2NmnZDHq6aGDx/Oa6+9xuDBgxk0aBDnnHMOp512GiNGjKC2tpZhw4a9a5+99tqLs846i4MPPpghQ4Zw6KHZXZjtt9+emTNncumll9LQ0MCbb77JZZddVpbEpI7e6LLW1dbWhicKNLO2LF26lAMPPDDvMHLT0vlLqo+I2uZ1/a48MzMrFCcmMzMrFCcmM7Nu0lNvnXT2vJ2YzMy6Qd++fXnllVd6XHJqmo+pb9+OviOhcp/KMzOrKHvuuScrV65k7dq1eYfS7ZpmsO0oJyYzs25QVVXV4RlcezpfyjMzs0JxYjIzs0JxYjIzs0LxPaYyWLSqoeyzUZptiTxec2NWbh4xmZlZoTgxmZlZoTgxtUMZ95OZWTcp9C9cSTWS/iDpNklLJc2UtKOkMZIeklQv6R5Jg1L9ByV9X9LTkhZLOjyVT5Z0q6THJT0n6cKSY1whaa6khZKuLjnuMkk/BxYDe+Vx/mZmPVElPPxwAHBBRDwm6WbgYrJp1k+PiLWSxgPfYPOcTDtGxChJxwI3Awen8kOAI4CdgPmS5qRtQ4HDAQGz035/SuUTIuKJloKSNBGYCND7PQPLfc5mZj1WJSSmP0fEY2n5F8BXyBLKb7N5AukNrC6pfztARDws6T2Sdk7lsyLiH8A/JD1AloyOAU4C5qc61WQJ6U/Ai60lpdT+FGAKQJ9BQ3vWy6/MzLpQJSSm5r/0XwOWRMSRHawfbZQL+K+I+GnpBkk1wOudjtTMzLZaoe8xJXtLakpCnwCeAAY2lUmqklQ6l+/4VH4M0BARDan8dEl9JQ0AjgPmAvcA50uqTvsMlrR7l5+RmZm1qhJGTMuAi9P9pWeAH5IllB9I6k92DtcBS1L9DZLmA1Vsvu8EsBB4ANgN+HpEvAS8JOlA4PF0WXA98EmgscvPyszMWqQizw2SLqn9OiIObqdqU/0Hgcsjoq5Z+WRgfUR8u8whAlBbWxt1dXXtVzQzs7dJqo+I2ubllXApz8zMepBCX8qLiBVsfty7I/WPa6V8cnkiMjOzruYRk5mZFYoTk5mZFYoTk5mZFYoTk5mZFYoTk5mZFYoTk5mZFYoTk5mZFYoTk5mZFUqh/8C2Uixa1UDNpDl5h2HWI6y49pS8Q7Au5hGTmZkVihOTmZkVSq6JSdIZkg7qQL2pksa2UH6cpF+XMZ5aST9Iy+dJ+lG52jYzs47Je8R0BtBuYuouEVEXEZfmHYeZWU/WZmKSdK2ki0vWJ0u6XNIVkuZKWijp6pLtX5W0TNKjkm6XdHkq30/S3ZLqJT0iaZiko4CPAf8t6elU58LU7gJJv5S0Y0k4J0qqk/SspFNbiHUnSTdLekrSfEmnt3FefSX9TNKiVPeDqbysIzAzM+u89kZM04CzStbPAtYCQ4HDgVHAGEnHSjoMOBMYCXwEKJ38aQpwSUSMAS4HfhwRvwdmA1dExKiI+CNwZ0QcFhEjgaXABSVt1KRjngLcIKlvs1ivBO6PiMOBD5IlvJ1aOa+LgYiIEcD/BW5pob02SZqYEmVd4xsN7e9gZmYd0ubj4hExX9Lukv4PMBD4GzACOAmYn6pVkyWqfsCsiNhANr35rwAkVQNHATPS9OUAfVo55MGSrgF2Tu3eU7JtekS8BTwn6QVgWLN9TwI+1jRKA/oCe5MluOaOIZuinYj4g6QXgf3b6ovmImIKWcKlz6ChxZ0G2MyswnTk75hmAGOB95KNoPYB/isiflpaSdJlrezfC3g1IkZ14FhTgTMiYoGk84DjSrY1/+XffF3AmRGxrAPHMTOzgurIww/TgLPJktMMslHM+WkkhKTBknYHHgNOS/dvqoFTASLi78BySeNSfUkamdp+jWyk1aQfsFpSFXBOszjGSeolaT9gX6B5AroHuERpWCbp0DbO6ZGm9iXtTzayckIzMyuAdhNTRCwhSxirImJ1RNwL/C/wuKRFwEygX0TMJbtntBD4DbAIaLr5cg5wgaQFwBKg6cGEO4Ar0gMI+wFfBZ4kS3J/aBbKn4CnUtsXpUuGpb4OVAELJS1J6635MdArxT8NOC8iNrbXF2Zm1vUUUb7bI5KqI2J9epruYWBiRMwr2wEKqra2Nurq6vIOw8ysokiqj4ja5uXlflfelPQHs32BW3pCUjIzs/Iqa2KKiE+Us72tJelk4JvNipdHxMfziMfMzNq3Tb9dPCLu4Z2PnJuZWcHl/UoiMzOzd3BiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQtmm/46puyxa1UDNpDl5h2HWY6y49pS8Q7Au5BGTmZkVSsUnJkn/KenEvOMwM7PyqPhLeRHxta4+hqTeEdHY1ccxM7MKGzFJ+qqkZZIelXS7pMslTZU0Nm1fIelqSfMkLZI0LJUPlPRbSUsk3STpRUm7pW2flPSUpKcl/VRS71S+XtJ30hxSR+Z20mZmPUzFJCZJhwFnAiOBjwDvmsMjWRcRo4GfAJensv8A7o+I4WQTG+6d2jwQGA8cnaZ+b2TzzLk7AU9GxMiIeLSFeCZKqpNU1/hGQ/PNZma2hSrpUt7RwKw0c+0GSb9qpd6d6Wc98K9p+Rjg4wARcbekv6XyE4AxwNw0I/sOwJq0rRH4ZWvBRMQUYApAn0FDyzfboplZD1dJiamjmqZIb6T98xPZhIZfbmHbBt9XMjPrfhVzKQ94DDhNUl9J1cCpndz3LABJJwG7pPL7gLGSdk/bdpW0TxljNjOzTqqYEVNEzJU0G1gIvAwsAjp6c+dq4HZJnwIeB/4CvBYR6yRdBdwrqRewCbgYeLHsJ2BmZh1SMYkp+XZETJa0I/AwUB8RNzZtjIiakuU64Li02gCcHBFvSjoSOCwiNqZ604BpzQ8UEdVddhZmZtaqSktMUyQdBPQluzc0r4P77Q1MT6OifwIXljOoEYP7U+dXpJiZlUVFJaaI+MQW7vcccGiZwzEzsy5QSQ8/mJlZD+DEZGZmheLEZGZmheLEZGZmheLEZGZmheLEZGZmheLEZGZmheLEZGZmheLEZGZmhVJRb34oqkWrGqiZNCfvMMxsK63wq8UKwSMmMzMrlB6bmCSdJ+lHafkiSefmHZOZmfXQS3mS3nHeEXFDXrGYmdk7VXRikvRV4JPAWuDPQD3Z3EsTge2B54FPRcQbkqYCG8jeMv4Y2YSDTe1MBtZHxLclvQ+4ARhINj37uIj4Y3edk5lZT1exl/IkHQacCYwEPgLUpk13RsRhETESWApcULLbnsBREfGFNpq+Dbg+7X8UsLqV40+UVCeprvGNjk6ka2Zm7ankEdPRwKyI2ABskPSrVH6wpGuAnYFq4J6SfWZERGNrDUrqBwyOiLsAUtstiogpwBSAPoOGxladiZmZva1iR0xtmAp8LiJGAFeTzXbb5PVcIjIzsw6r5MT0GHCapL6SqoFTU3k/YLWkKuCczjQYEa8BKyWdASCpj6Qdyxm0mZm1rWITU0TMBWaTPcTwG2AR2YMPXwWeJEtcf9iCpj8FXCppIfB74L1lCdjMzDpEEZV7e0RSdUSsT6Oah4GJETGvu+PoM2hoDJpwXXcf1szKzG9+6F6S6iOitnl5JT/8ADBF0kFk95FuySMpAYwY3J86f6HNzMqiohNTRHwi7xjMzKy8KvYek5mZbZucmMzMrFCcmMzMrFCcmMzMrFCcmMzMrFCcmMzMrFCcmMzMrFCcmMzMrFCcmMzMrFAq+s0PRbFoVQM1k+bkHYaZdTG/S697eMRkZmaF4sRkZmaF4sRkZmaFUojEJOlcSQslLZB0q6TTJD0pab6k30naQ1IvSc9JGpj26SXpeUkD0+eXkuamz9GpzmRJN0t6UNILki5N5TWSlkq6UdISSfdK2iFt20/S3ZLqJT0iaVh+PWNm1vPknpgkDQeuAo6PiJHA54FHgSMi4lDgDuBLEfEW8As2T5d+IrAgItYC3we+FxGHAWcCN5UcYhhwMnA48B9pynWAocD1ETEceDXtBzAFuCQixgCXAz9uJe6Jkuok1TW+0bDV/WBmZpkiPJV3PDAjItYBRMRfJY0ApkkaBGwPLE91bwZmAdcB5wM/S+UnAgdJamrzPZKq0/KciNgIbJS0BtgjlS+PiKfTcj1Qk/Y5CphR0lafloKOiClkSYw+g4ZW7jTAZmYFU4TE1JIfAt+NiNmSjgMmA0TEnyW9LOl4shFQ0+ipF9kIa0NpIym5bCwpamTzOTcv3yG182pEjCrr2ZiZWYflfikPuB8YJ2kAgKRdgf7AqrR9QrP6N5Fd0psREY2p7F7gkqYKkrYosUTE34HlksaldiRp5Ja0ZWZmWyb3xBQRS4BvAA9JWgB8l2yENENSPbCu2S6zgWo2X8YDuBSoTQ9QPANctBUhnQNckGJZApy+FW2ZmVknKaKybo9IqiV70OH9ecfSpLa2Nurq6vIOw8ysokiqj4ja5uVFvcfUIkmTgM+w+d6SmZltY3K/lNcZEXFtROwTEY/mHYuZmXWNikpMZma27XNiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQnFiMjOzQqmoNz8U1aJVDdRMmpN3GGbWDVZce0reIWzzPGIyM7NCcWIyM7NCqZjEJOlj6SWu5WhrsqTLy9GWmZmVV0XcY5K0XUTMJpuLKa/jv5nHsc3MeppuHzFJOjdN6LdA0q2SaiTdn8ruk7R3qjdV0g2SngS+Jek8ST9K206T9KSk+ZJ+J2mPVD5Z0s2SHpT0gqRLS457paRnJT0KHFBSvp+kuyXVS3pE0rCWjt+NXWRm1qN164hJ0nDgKuCoiFiXplG/BbglIm6RdD7wA+CMtMueqW6jpPNKmnoUOCIiQtK/AV8Cvpi2DQM+CPQDlkn6CXAIcDYwiuyc5wH1qf4U4KKIeE7SvwA/Bo5vfvwWzmUiMBGg93sGbk23mJlZie6+lHc8MCMi1gFExF8lHQn8a9p+K+8cncxoKSmQJYxpkgYB2wPLS7bNiYiNwEZJa4A9gPcDd0XEGwCSZqef1cBRZNO4N+3fpwPHJyKmkCU1+gwaWlnTAJuZFVjR7zG93kr5D4HvRsRsSccBk0u2bSxZbqTtc+wFvBoRozp5fDMz6yLdfY/pfmCcpAEA6VLe78kus0E2ZfojHWinP7AqLU/oQP2HgTMk7SCpH3AaQET8HVguaVyKR5JGdvRkzMys/Lp1xBQRSyR9A3hIUiMwH7gE+JmkK4C1wKc70NRksstvfyNLdkPaOe48SdOABcAaYG7J5nOAn0i6CqgC7kj1zMwsB4rw7ZGtVVtbG3V1dXmHYWZWUSTVR0Rt8/KK+QNbMzPrGZyYzMysUJyYzMysUJyYzMysUJyYzMysUJyYzMysUJyYzMysUJyYzMysUJyYzMysUJyYzMysUIr+dvGKsGhVAzWT5uQdhpkVzIprT8k7hIrkEZOZmRVKj0pMkv5T0ol5x2FmZq3rUZfyIuJrecdgZmZtq/gRk6QvSFqcPpdJqpG0VNKNkpZIulfSDqnuVElj0/IJkuZLWiTpZkl9UvkKSVdLmpe2Dcvz/MzMepqKTkySxpBNLPgvwBHAhcAuwFDg+ogYDrwKnNlsv77AVGB8RIwgGzl+pqTKuogYDfwEuLyVY0+UVCeprvGNhrKel5lZT1bRiQk4BrgrIl6PiPXAncD7geUR8XSqUw/UNNvvgFTn2bR+C3BsyfY729gXgIiYEhG1EVHbe8f+W30iZmaWqfTE1JqNJcuNdP5eWtP+W7KvmZlthUpPTI8AZ0jaUdJOwMdTWXuWATWS3pfWPwU81EUxmplZJ1T0aCAi5kmaCjyVim4C/taB/TZI+jQwQ9J2wFzghi4L1MzMOkwRkXcMFa/PoKExaMJ1eYdhZgXjNz+0TVJ9RNQ2L6/oEVNRjBjcnzp/Ac3MyqLS7zGZmdk2xonJzMwKxYnJzMwKxYnJzMwKxYnJzMwKxYnJzMwKxYnJzMwKxYnJzMwKxYnJzMwKxYnJzMwKxa8kKoNFqxqomTQn7zDMrAL4/Xnt84jJzMwKJdfEJGlnSZ/NM4YUx02SDso7DjMzy3/EtDPQqcQkqXc5A5DUOyL+LSKeKWe7Zma2ZfJOTNcC+0l6WtJcSb9u2iDpR5LOS8srJH1T0jxgnKQHJX1PUp2kpZIOk3SnpOckXVPSxiclPZXa/2lTUpO0XtJ3JC0Ajkzt1aZtH5Y0T9ICSfd1Z2eYmVn+iWkS8MeIGAVc0U7dVyJidETckdb/mSaYugGYBVwMHAycJ2mApAOB8cDRqf1G4Jy0707AkxExMiIebTqApIHAjcCZETESGNdaMJImpsRY1/hGQ2fP28zMWlFJT+VNa7Y+O/1cBCyJiNUAkl4A9gKOAcYAcyUB7ACsSfs0Ar9s4RhHAA9HxHKAiPhra8FExBRgCmQz2G7B+ZiZWQuKlJje5J0juL7Ntr/ebH1j+vlWyXLT+naAgFsi4sstHGtDRDRuRaxmZtZF8r6U9xrQLy2/CBwkqY+knYETtrLt+4CxknYHkLSrpH3a2ecJ4FhJQ5r22coYzMysk3IdMUXEK5Iek7QY+A0wHVgMLAfmb2Xbz0i6CrhXUi9gE9l9qBfb2GetpInAnWmfNcCHtiYOMzPrHEX49sjW6jNoaAyacF3eYZhZBfCbHzaTVJ8eYnuHIt1jqlgjBvenzl82M7OyyPsek5mZ2Ts4MZmZWaE4MZmZWaE4MZmZWaE4MZmZWaE4MZmZWaE4MZmZWaE4MZmZWaE4MZmZWaH4zQ9lsGhVAzWT5uQdhplZt+qq1yt5xGRmZoXixGRmZoXS4xOTpIsknZt3HGZmlunx95gi4oa8YzAzs80qbsQk6VxJCyUtkHSrpKmSxpZsX59+HifpIUmzJL0g6VpJ50h6StIiSfulepMlXZ6WH5T0zVTnWUnvz+cszcx6ropKTJKGA1cBx0fESODz7ewyErgIOBD4FLB/RBwO3ARc0so+26U6lwH/0UYsEyXVSaprfKOhk2diZmatqajEBBwPzIiIdQAR8dd26s+NiNURsRH4I3BvKl8E1LSyz53pZ30bdYiIKRFRGxG1vXfs38HwzcysPZWWmFryJuk8JPUCti/ZtrFk+a2S9bdo/f5aU53GNuqYmVkXqbTEdD8wTtIAAEm7AiuAMWn7x4CqfEIzM7NyqKgRQUQskfQN4CFJjcB84N+BWZIWAHcDr+cZo5mZbR1FRN4xVLza2tqoq6vLOwwzs4oiqT4iapuXV9qlPDMz28Y5MZmZWaE4MZmZWaE4MZmZWaE4MZmZWaH4qbwykPQasCzvODphN2Bd3kF0guPtWpUWL1RezI63ZftExMDmhRX1d0wFtqylRx6LSlKd4+06jrfrVVrMjrdzfCnPzMwKxYnJzMwKxYmpPKbkHUAnOd6u5Xi7XqXF7Hg7wQ8/mJlZoXjEZGZmheLEZGZmheLEtBUkfVjSMknPS5qUdzwtkbRC0iJJT0uqS2W7SvqtpOfSz11yjvFmSWskLS4pazFGZX6Q+nyhpNEFiXeypFWpn5+W9NGSbV9O8S6TdHIO8e4l6QFJz0haIunzqbyQfdxGvIXsY0l9JT0laUGK9+pUPkTSkymuaZK2T+V90vrzaXtNQeKdKml5Sf+OSuXd/32ICH+24AP0JpuufV+yWXMXAAflHVcLca4AdmtW9i1gUlqeBHwz5xiPBUYDi9uLEfgo8BtAwBHAkwWJdzJweQt1D0rfjT7AkPSd6d3N8Q4CRqflfsCzKa5C9nEb8Rayj1M/VaflKuDJ1G/TgbNT+Q3AZ9LyZ4Eb0vLZwLRu7t/W4p0KjG2hfrd/Hzxi2nKHA89HxAsR8U/gDuD0nGPqqNOBW9LyLcAZOcZCRDwM/LVZcWsxng78PDJPADtLGtQ9kWZaibc1pwN3RMTGiFgOPE/23ek2EbE6Iual5deApcBgCtrHbcTbmlz7OPXT+rRalT4BHA/MTOXN+7ep32cCJ0hSN4XbVryt6fbvgxPTlhsM/LlkfSVt/+PJSwD3SqqXNDGV7RERq9PyX4A98gmtTa3FWOR+/1y61HFzyeXRQsWbLhsdSva/5ML3cbN4oaB9LKm3pKeBNcBvyUZtr0bEmy3E9Ha8aXsDMCDPeCOiqX+/kfr3e5L6NI836fL+dWLa9h0TEaOBjwAXSzq2dGNkY/VC/81AJcQI/ATYDxgFrAa+k2847yapGvglcFlE/L10WxH7uIV4C9vHEdEYEaOAPclGa8NyDqlNzeOVdDDwZbK4DwN2Bf49r/icmLbcKmCvkvU9U1mhRMSq9HMNcBfZP5qXm4bi6eea/CJsVWsxFrLfI+Ll9I/9LeBGNl9KKkS8kqrIfsnfFhF3puLC9nFL8Ra9jwEi4lXgAeBIskteTe8jLY3p7XjT9v7AK90cKvCOeD+cLqFGRGwEfkaO/evEtOXmAkPTkzfbk93EnJ1zTO8gaSdJ/ZqWgZOAxWRxTkjVJgCz8omwTa3FOBs4Nz0pdATQUHI5KjfNrrl/nKyfIYv37PQk1hBgKPBUN8cm4H+ApRHx3ZJNhezj1uItah9LGihp57S8A/AhsvtiDwBjU7Xm/dvU72OB+9OINc94/1DynxSR3Q8r7d/u/T509dMV2/KH7GmVZ8muJ1+ZdzwtxLcv2dNKC4AlTTGSXc++D3gO+B2wa85x3k52aWYT2fXrC1qLkezJoOtTny8CagsS760pnoVk/5AHldS/MsW7DPhIDvEeQ3aZbiHwdPp8tKh93Ea8hexj4BBgfoprMfC1VL4vWYJ8HpgB9EnlfdP682n7vgWJ9/7Uv4uBX7D5yb1u/z74lURmZlYovpRnZmaF4sRkZmaF4sRkZmaF4sRkZmaF4sRkZmaF4sRkZmaF4sRkZmaF8v8BEBScEicaSW4AAAAASUVORK5CYII=\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "indian_ingredient_df = create_ingredient_df(indian_df)\r\n", - "indian_ingredient_df.head(10).plot.barh()" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 14 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAdIAAAD4CAYAAABYIGfSAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nO3de5xXVb3/8dcbHCEFp1SyCbQho0hAQAYTNPV4KfOSdhTpRF7SXxz9HbFOWnHSftFJfz/NfuZdo1JILQXKS3KCTPBOyowIwyWsRI8gKd5GkSCEz/ljr5Ev48www56ZLzPf9/PxmMfs79prr/XZCx58WGvv796KCMzMzGz7dCt2AGZmZp2ZE6mZmVkOTqRmZmY5OJGamZnl4ERqZmaWw07FDsA61p577hmVlZXFDsPMrFOpqal5JSL6NLbPibTEVFZWUl1dXewwzMw6FUnPN7XPS7tmZmY5OJGamZnl4ERqZmaWg6+RmpnZe2zcuJGVK1eyfv36YofSoXr27Em/fv0oKytr8TFOpCWmdlUdlRNnFjsM68Keu+y4YodgbWDlypX07t2byspKJBU7nA4REbz66qusXLmS/v37t/g4L+2amdl7rF+/nj322KNkkiiAJPbYY49Wz8KdSDuYpJMk7deCelMkndJI+eGS7muf6MzMtiilJFpve87ZibTjnQRsM5GamVnn4GukDUi6DHghIq5PnycBawEBpwI9gLsi4ntp/3eBLwNrgBeAmoj4kaR9geuBPsA64KvA7sDngcMkXQycDBwBjAd2Bv4CnBYR61I4R0maCOwGfCMitpqJStoVuBYYDJQBkyLinjYfFDMreW19b0VbX0vv1asXa9eubdM2W8oz0ve6kyxh1juVLEkOAA4EhgEjJB0qaSRZMhwKfA6oKjhuMjAhIkYAFwI3RMTjwL3ANyNiWET8FfhNRIyMiKHAMuDsgjYqU5/HATdJ6tkg1ouAORFxIPBPwBUpuW5F0nhJ1ZKqN62r244hMTOzpjiRNhARC4APSvqwpKHA68AQ4DPAAuApYCBZYj0YuCci1kfEW8BvAST1AkYD0yU9DfwEqGiiy8GSHpFUC4wDBhXsmxYRmyPiz8Czqd9CnwEmpj4eBHoC+zRyTpMjoioiqrrvUt7KETEz63gTJ07k+uuvf/fzpEmTuOSSSzjyyCM54IADGDJkCPfc894FuAcffJDjjz/+3c/nnXceU6ZMAaCmpobDDjuMESNG8NnPfpbVq1e3SaxOpI2bDpwCjCWboQr4f2kWOSwiPhYRP2/m+G7AGwX1h0XEJ5uoOwU4LyKGAN8nS4b1okHdhp8FnFzQxz4Rsaxlp2hmtuMaO3Ys06ZNe/fztGnTOOOMM7jrrrt46qmnmDt3LhdccAERDf9ZbNzGjRuZMGECM2bMoKamhrPOOouLLrqoTWJ1Im3cncAXyZLpdGA2cFaaaSKpr6QPAo8BJ0jqmfYdDxARbwIrJI1J9ZVmtwBvAb0L+uoNrJZURjYjLTRGUrd0vfWjwPIG+2cDE5RuM5M0vA3O3cys6IYPH87LL7/Miy++yMKFC/nABz7Ahz70Ib7zne+w//77c9RRR7Fq1SpeeumlFrW3fPlyFi9ezNFHH82wYcO45JJLWLlyZZvE6puNGhERSyT1BlZFxGqyRPdJYF7KWWuBL0fEfEn3AouAl4BaoP4i5DjgxnRTURlwB7Aw/f6ppPPJEvV3gSfIrsM+wdZJ9r+BJ8luNjonItY3uDX7B8BVwCJJ3YAVpGRuZtbZjRkzhhkzZvC3v/2NsWPHcvvtt7NmzRpqamooKyujsrLyPd/53Gmnndi8efO7n+v3RwSDBg1i3rx5bR6nE2kT0lJr4eergasbqfqjiJgkaRfgYaAm1V8BHNNIu4+x9ddfbkw/Deud2URcD5JdDyUi/g786zZPxsysExo7dixf/epXeeWVV3jooYeYNm0aH/zgBykrK2Pu3Lk8//x732z2kY98hKVLl7Jhwwb+/ve/88ADD3DIIYfwiU98gjVr1jBv3jxGjRrFxo0beeaZZxg0aFAjPbeOE2l+k9MDFnoCUyPiqWIH1Jwhfcup9iPczKyVivHox0GDBvHWW2/Rt29fKioqGDduHCeccAJDhgyhqqqKgQMb3n8Je++9N6eeeiqDBw+mf//+DB+eXfHaeeedmTFjBueffz51dXW88847fP3rX2+TRKqWXqi1rqGqqir8Ym8z25Zly5bxyU82dY9k19bYuUuqiYiqxur7ZiMzM7McnEjNzMxycCI1M7NGleKlv+05ZydSMzN7j549e/Lqq6+WVDKtfx9pz54Nn8baPN+1a2Zm79GvXz9WrlzJmjVrih1Kh+rZsyf9+vVr1TFOpGZm9h5lZWX079+/2GF0Cl7aNTMzy8GJ1MzMLAcnUjMzsxx8jbTE1K6qa/M33Zu1VDEeM2fW3jwjNTMzy8GJ1MzMLIeiJFJJJ6U3prT2uLXtEU9XIWmKpFOKHYeZWSlpVSJVpi2S70ls/U5OMzOzTmmbSVFSpaTlkn4BLAZOk1QrabGkywvq3SipWtISSd8vKL9M0lJJiyT9SNJo4PPAFZKelrRv+pklqUbSI5IGpmP7S5qX+rtkG3FWSHo4tblY0qdT+WdSG09Jmi6pV2NxpbITJD0haYGkP0jaK5VPkjQ1xfa8pH+W9MMU1yxJZaneCEkPpfOYLamimXjPL+j/jlS2q6SbJT2ZYjgxlXeXdIWk+an+v6ZySbou/fn8AfhgE32NT3821ZvW1TX7521mZq3T0rt2BwBnAP8N/BEYAbwO/F7SSRFxN3BRRLwmqTvwgKT9gVXAF4CBERGS3h8Rb0i6F7gvImYASHoAOCci/izpU8ANwBHA1cCNEfELSf+2jRi/BMyOiEtTDLtI2hO4GDgqIt6W9G3gG5KubxhXauNR4KBU9r+AbwEXpH37Av9ENpOeB5wcEd+SdBdwnKSZwLXAiRGxRtJY4FLgrCbinQj0j4gNBf1fBMyJiLNS2ZMpQY4D6iJipKQewGOSfg8MBz6RYtoLWArc3LCjiJgMTAboUTGgdB6caWbWAVqaSJ+PiD+mGdKDEbEGQNLtwKHA3cCpksanNivI/nFfCqwHfi7pPuC+hg2nGeJoYLqk+uIe6ffBwMlp+1bgcpo2H7g5zQ7vjoinJR2W4ngstb0zWRKsayKufsCdaSa5M7CioP3fRcRGSbVAd2BWKq8FKskS2mDg/tRXd2B1M/EuAm6XdDfZ+AF8Bvi8pAvT557APql8f225/llO9p+bQ4FfRcQm4EVJc5rpz8zM2kFLE+nbze2U1B+4EBgZEa9LmgL0jIh3JB0IHAmcApxHNtMs1A14IyKGNdF8i2ZQEfGwpEOB44Apkq4kmzXfHxH/0kjMjcV1LXBlRNwr6XBgUsEhG1I/myVtjC2vRNhMNo4ClkTEqJbEm+I8FDgBuEjSkNTGyRGxvEGsAiZExOwG5ce2sC8zM2snrb1x6EngMEl7puXTfwEeAnYjS7Z16bri5+Dd2WZ5RPwX8O/A0NTOW0BvgIh4E1ghaUw6RpLq6z0GfDFtj2suMEkfAV6KiJ8CPwMOIFuGPljSx1KdXSV9vJm4ysmWoyFbym6N5UAfSaNSX2WSBjURazdg74iYC3w79dsLmA1MSIkTScPTIbOBcwuuxX5c0q7Aw8DYdA21gmzp2czMOlCrnmwUEaslTQTmks2eZkbEPQCSFgB/Al4gS4CQJct7JPVM9b+Ryu8AfirpfLIZ4TjgRkkXA2Vp/0Lga8Av07XNe7YR3uHANyVtBNYCp6drlWcCv0rXFiG7ZvpWE3FNIltifh2YA7T41QcR8Y+09HqNpHKysb0KWNJI9e7AbamegGvSteMfpGMWpWS7Ajie7D8GlcBTKcmuIbvz+S6ymfRSsuvX87YV55C+5VT76TJmZm1GpfTSVoOqqqqorq4udhhmZp2KpJqIqGpsn59sZGZmlkOne2h9uinn1gbFGyLiU8WIZ1vSV20OblB8dUTcUox4zMysbXW6RBoRtUBTd/jucCJiW99/NTOzTsxLu2ZmZjk4kZqZmeXgRGpmZpaDE6mZmVkOTqRmZmY5OJGamZnl0Om+/mL51K6qo3LizGKHYbaV5/zYSuvEPCM1MzPLwYnUzMwsByfSIpC0ttgxmJlZ23AiNTMzy8GJtJXSy8FnSlooabGksZKOlLRAUq2kmyX1kHSEpLsLjjta0l0Fn38saYmkByT1SWX7SpolqUbSI5IGpvITJD2R+vhDenk6kial/h6U9Gx6v6uZmXUgJ9LWOwZ4MSKGRsRgYBYwBRgbEUPI7oQ+l+zl5wPrkyTwFeDmtL0rUB0Rg4CHgO+l8snAhIgYAVwI3JDKHwUOiojhZC89/1ZBPAOBzwIHAt+TVNYwYEnjJVVLqt60ri73AJiZ2RZOpK1XCxwt6XJJnwYqgRUR8UzaPxU4NLI3pt8KfFnS+4FRwO9Snc3AnWn7NuAQSb2A0cB0SU8DPwEqUp1+wGxJtcA3gUEF8cyMiA0R8QrwMrBXw4AjYnJEVEVEVfddyttgCMzMrJ6/R9pKEfGMpAOAY4FLgDnNVL8F+C2wHpgeEe801SzZf2reiIjGXhF3LXBlRNwr6XBgUsG+DQXbm/CfqZlZh/KMtJUkfRhYFxG3AVeQzTQrJX0sVTmNbLmWiHgReBG4mCyp1usGnJK2vwQ8GhFvAiskjUn9SNLQVKccWJW2z2iXEzMzs+3i2UvrDQGukLQZ2Eh2PbScbEl2J2A+cFNB/duBPhGxrKDsbeBASReTLceOTeXjgBtTeRnZ9dCFZDPQ6ZJeJ5sB92+nczMzs1ZSdinP2ouk64AFEfHzYscCUFVVFdXV1cUOw8ysU5FUExFVje3zjLQdSaohm31eUOxYzMysfTiRtqP0NRYzM+vCfLORmZlZDk6kZmZmOTiRmpmZ5eBEamZmloMTqZmZWQ5OpGZmZjk4kZqZmeXgRGpmZpaDH8hQYmpX1VE5cWaxwzBrV89ddlyxQ7AS4hmpmZlZDk6kOzhJ/5VeDG5mZjsgL+3uwCQJOD4iNhc7FjMza5xnpDsYSZWSlkv6BbAY2CRpz7TvdEmLJC2UdGsq6yPp15Lmp5+Dixm/mVmp8Yx0xzQAOCMi/ijpOQBJg4CLgdER8Yqk3VPdq4EfR8SjkvYBZgOfLGxM0nhgPED33fp00CmYmZUGJ9Id0/MR8ccGZUcA0yPiFYCIeC2VHwXsl60CA7CbpF4Rsba+ICImA5MBelQM8JvczczakBPpjuntVtTtBhwUEevbKxgzM2uar5F2HnOAMZL2AChY2v09MKG+kqRhRYjNzKxkOZF2EhGxBLgUeEjSQuDKtOt8oCrdhLQUOKdYMZqZlSIv7e5gIuI5YHDB58qC7anA1Ab1XwHGdlB4ZmbWgBNpiRnSt5xqPz7NzKzNeGnXzMwsBydSMzOzHJxIzczMcnAiNTMzy8GJ1MzMLAcnUjMzsxycSM3MzHJwIjUzM8vBidTMzCwHJ1IzM7Mc/IjAElO7qo7KiTOLHYZZUT3nx2RaG/KM1MzMLAcnUjMzsxy6XCKVVClpcSPlD0qq2o72zpR0XdtEZ2ZmXU2XS6QGknzt28ysg3TVRLqTpNslLZM0Q9IuhTsl3SipWtISSd8vKB8p6XFJCyU9Kal3g+OOkzRP0p6NdSppiqSbUtvPSDo+lXeXdIWk+ZIWSfrXVH64pIclzZS0PB3bLe1bK+nHKcYHJPVJ5ftKmiWpRtIjkgY26PsJ4IcN4hqfYqretK4u9+CamdkWXTWRfgK4ISI+CbwJ/O8G+y+KiCpgf+AwSftL2hm4E/haRAwFjgL+Xn+ApC8AE4FjI+KVZvquBA4EjgNuktQTOBuoi4iRwEjgq5L6p/oHAhOA/YB9gX9O5bsC1RExCHgI+F4qnwxMiIgRwIXADQV99wNGR8Q3CgOKiMkRURURVd13KW8mdDMza62uugT4QkQ8lrZvA85vsP9USePJzr+CLIkFsDoi5gNExJsAkgCOAKqAz9SXN2NaRGwG/izpWWAg8Blgf0mnpDrlwADgH8CTEfFs6utXwCHADGAzWWKvP4ffSOoFjAamp7gAehT0PT0iNm0jPjMza0NdNZFGU5/TTPBCYGREvC5pCtBzG+39Ffgo8HGgejv6FtkscnbhDkmHNxdrI+XdgDciYlgTdd7eRmxmZtbGuurS7j6SRqXtLwGPFuzbjSzh1EnaC/hcKl8OVEgaCSCpd8FNO88DJwO/kDRoG32PkdRN0r5kyXc5MBs4V1JZavvjknZN9Q+U1D9dGx1bEGs3oH4G+yXg0TQbXiFpTGpHkoa2dFDMzKztddVEuhz4N0nLgA8AN9bviIiFwALgT8AvgcdS+T/IEtm1khYC91MwU42IPwHjyJZV922m7/8GngR+B5wTEeuBnwFLgafSV3N+wpbVgPnAdcAyYAVwVyp/myzJLiZbWv7PVD4OODvFuAQ4sVUjY2ZmbUoRTa0kWmulZeL7ImJGC+sfDlwYEcc3sm9tRPRq2wihqqoqqqu3tTptZmaFJNWkm1Tfo6vOSM3MzDpEV73ZqF1JuggY06B4ekSc2Zp2IuJB4MEm9rX5bNTMzNqeE+l2iIhLgUuLHYeZmRWfl3bNzMxycCI1MzPLwYnUzMwsBydSMzOzHJxIzczMcnAiNTMzy8GJ1MzMLAd/j7TE1K6qo3LizGKHYWbNeO6y44odgrWCZ6RmZmY5OJGamZnl4ETayUk6R9LpaXuKpFO2dYyZmbUdXyPt5CLipmLHYGZWykp6RippV0kzJS2UtFjSWEkjJD0kqUbSbEkVqe75kpZKWiTpjlR2oKR5khZIelzSJ1L5mZLulnS/pOcknSfpG6neHyXtnurtK2lW6usRSQObibVS0pzU/wOS9knlkyRduI3zHC+pWlL1pnV1bTV8ZmZGiSdS4BjgxYgYGhGDgVnAtcApETECuJktb3mZCAyPiP2Bc1LZn4BPR8Rw4P8A/7eg7cHAPwMjUxvrUr15wOmpzmRgQurrQuCGZmK9Fpia+r8duKalJxkRkyOiKiKquu9S3tLDzMysBUp9abcW+P+SLgfuA14nS4D3SwLoDqxOdRcBt0u6G7g7lZUDUyUNAAIoK2h7bkS8BbwlqQ74bUGf+0vqBYwGpqe+AHo0E+sossQMcCvww9afrpmZtbWSTqQR8YykA4BjgUuAOcCSiBjVSPXjgEOBE4CLJA0BfkCWML8gqZKtX9K9oWB7c8HnzWTj3g14IyKGtdkJmZlZhyvppV1JHyZbcr0NuAL4FNBH0qi0v0zSIEndgL0jYi7wbbKZaK/0e1Vq7szW9B0RbwIrJI1JfUnS0GYOeRz4YtoeBzzSmv7MzKx9lPSMFBgCXCFpM7AROBd4B7hGUjnZ+FwFPAPclsoEXBMRb0j6IdnS7sXA9jwuaBxwYzq+DLgDWNhE3QnALZK+CawBvrId/TGkbznVfmqKmVmbUUQUOwbrQFVVVVFdXV3sMMzMOhVJNRFR1di+kl7aNTMzy6vUl3Z3OJIuAsY0KJ4eEZc2Vt/MzIrLiXQHkxKmk6aZWSfhpV0zM7McnEjNzMxycCI1MzPLwYnUzMwsBydSMzOzHJxIzczMcvDXX0pM7ao6Kiduz9MMzayUPOdHibaYZ6RmZmY5OJGamZnl4ERqZmaWgxOpmZlZDk6kBSTtKmmmpIWSFksaK+lISQsk1Uq6WVIPSUdIurvguKMl3dVEm90lTUnt1Ur691T+VUnzU1+/lrRLKp8i6ZSC49cWbH87tbFQ0mWpbF9JsyTVSHpE0sD2Gh8zM3svJ9KtHQO8GBFDI2IwMAuYAoyNiCFkdzmfC8wFBkrqk477CnBzE20OA/pGxODUxi2p/DcRMTIihgLLgLObC0zS54ATgU+lY36Ydk0GJkTECOBC4IZGjh0vqVpS9aZ1ddseBTMzazEn0q3VAkdLulzSp4FKYEVEPJP2TwUOjext6LcCX5b0fmAU8Lsm2nwW+KikayUdA7yZygenGWQtMA4YtI3YjgJuiYh1ABHxmqRewGhguqSngZ8AFQ0PjIjJEVEVEVXddylvyTiYmVkL+XukBSLiGUkHAMcClwBzmql+C/BbYD3Z+0LfaaLN1yUNBT4LnAOcCpxFNtM9KSIWSjoTODwd8g7pPziSugE7NxNDN+CNiBjWkvMzM7O25xlpAUkfBtZFxG3AFWQzzUpJH0tVTgMeAoiIF4EXgYvZslzbWJt7At0i4tep7gFpV29gtaQyshlpveeAEWn780BZ2r4f+ErBtdTdI+JNYIWkMalMKWmbmVkH8Yx0a0OAKyRtBjaSXQ8tJ1s63QmYD9xUUP92oE9ELGumzb7ALWl2CfAf6fd3gSeANel371T+U+AeSQvJrtG+DRARsyQNA6ol/QP4L+A7ZEn4RkkXkyXdO4CF23n+ZmbWSsou99n2kHQdsCAifl7sWFqqqqoqqqurix2GmVmnIqkmIqoa2+cZ6XaSVEM2W7yg2LGYmVnxOJFup/R1k61IegLo0aD4tIio7ZiozMysozmRtqGI+FSxYzAzs47lu3bNzMxycCI1MzPLwYnUzMwsBydSMzOzHJxIzczMcnAiNTMzy8GJ1MzMLAd/j7TE1K6qo3LizGKHYWZdzHOXHVfsEIrGM1IzM7McnEjNzMxycCI1MzPLwYm0lSSdLmmRpIWSbpV0gqQnJC2Q9AdJe0nqJunPkvqkY7pJ+oukPunn15Lmp5+DU51Jkm6W9KCkZyWdn8orJS2T9FNJSyT9XtL70r59Jc2SVCPpEUkDizcyZmalyYm0FSQNAi4GjoiIocDXgEeBgyJiONlLtb8VEZuB28heug1wFLAwItYAVwM/joiRwMnAzwq6GAh8FjgQ+J6kslQ+ALg+IgYBb6TjACYDE9KbaC4Ebmgi7vGSqiVVb1pXl3sczMxsC9+12zpHANMj4hWAiHhN0hDgTkkVwM7AilT3ZuAe4CrgLOCWVH4UsJ+k+jZ3k9Qrbc+MiA3ABkkvA3ul8hUR8XTargEq0zGjgekFbTV8hRspzslkSZceFQP8JnczszbkRJrftcCVEXGvpMOBSQAR8YKklyQdQTbDrJ+ddiObwa4vbCQlww0FRZvY8ufTsPx9qZ03ImJYm56NmZm1ipd2W2cOMEbSHgCSdgfKgVVp/xkN6v+MbIl3ekRsSmW/BybUV5C0XYkwIt4EVkgak9qRpKHb05aZmW0/J9JWiIglwKXAQ5IWAleSzUCnS6oBXmlwyL1AL7Ys6wKcD1SlG5aWAufkCGkccHaKZQlwYo62zMxsOyjCl8zai6QqshuLPl3sWOr1qBgQFWdcVewwzKyL6epPNpJUExFVje3zNdJ2ImkicC5bro3uEIb0Lae6i/+FNzPrSF7abScRcVlEfCQiHi12LGZm1n6cSM3MzHJwIjUzM8vBidTMzCwHJ1IzM7McnEjNzMxycCI1MzPLwYnUzMwsBydSMzOzHJxIzczMcvAjAktM7ao6KifOLHYYZlYCuvrzd+t5RmpmZpaDE2mRSaqUtDhtHy7pvrT9+fTgezMz24F5aXcHFRH3kr3P1MzMdmCekeYkaVdJMyUtlLRY0lhJIyU9nsqelNQ7zTwfkfRU+hm9jXbPlHRd2q6UNCe9DPwBSfuk8imSrkl9PSvplI44ZzMz28Iz0vyOAV6MiOMAJJUDC4CxETFf0m7A34GXgaMjYr2kAcCvgEZfEtuIa4GpETFV0lnANcBJaV8FcAgwkGwGO6PhwZLGA+MBuu/WZ/vO0szMGuUZaX61wNGSLpf0aWAfYHVEzAeIiDcj4h2gDPippFpgOrBfK/oYBfwybd9Kljjr3R0RmyNiKbBXYwdHxOSIqIqIqu67lLfq5MzMrHmekeYUEc9IOgA4FrgEmNNE1X8HXgKGkv0HZn0bhbChYFtt1KaZmbWQZ6Q5SfowsC4ibgOuAD4FVEgamfb3lrQTUE42U90MnAZ0b0U3jwNfTNvjgEfaKn4zM8vHM9L8hgBXSNoMbATOJZsZXivpfWTXR48CbgB+Lel0YBbwdiv6mADcIumbwBrgK20Yv5mZ5aCIKHYM1oF6VAyIijOuKnYYZlYCutKTjSTVRESjN4h6RlpihvQtp7oL/eU2Mys2XyM1MzPLwYnUzMwsBydSMzOzHJxIzczMcnAiNTMzy8GJ1MzMLAcnUjMzsxycSM3MzHJwIjUzM8vBTzYqMbWr6qicOLPYYZiZdaj2fFyhZ6RmZmY5OJGamZnl4ETaSUg6U9J1afuc9Do2MzMrMl8j7QTSi8HfFRE3FSsWMzPbmhNpB5L0XeDLZC/nfgGoAeqA8cDOwF+A0yJinaQpwHpgOPAYsKignUnA2oj4kaSPATcBfYBNwJiI+GtHnZOZWanz0m4HkTQSOBkYCnwOqH9B7G8iYmREDAWWAWcXHNYPGB0R32im6duB69Pxo4HVjfQ9XlK1pOpN6+ra4GzMzKyeZ6Qd52DgnohYD6yX9NtUPljSJcD7gV7A7IJjpkfEpqYalNQb6BsRdwGktt8jIiYDkwF6VAyI3GdiZmbv8oy0+KYA50XEEOD7QM+CfW8XJSIzM2sxJ9KO8xhwgqSeknoBx6fy3sBqSWXAuNY0GBFvASslnQQgqYekXdoyaDMza54TaQeJiPnAvWQ3Df0OqCW70ei7wBNkifZP29H0acD5khYBjwMfapOAzcysRRThS2YdRVKviFibZo0PA+Mj4qmOjKGqqiqqq6s7skszs05PUk1EVDW2zzcbdazJkvYjuw46taOTqJmZtT0n0g4UEV8qdgxmZta2fI3UzMwsBydSMzOzHJxIzczMcvBduyVG0lvA8mLHsQPZE3il2EHsQDweW3gstlbq4/GRiOjT2A7fbFR6ljd1C3cpklTt8djC47GFx2JrHo+meWnXzMwsBydSMzOzHJxIS8/kYgewg/F4bM3jsYXHYmsejyb4ZiMzM7McPCM1MzPLwYnUzMwsByfSEiLpGEnLJf1F0sRix9MRJN0s6WVJiwvKdpd0v6Q/p98fSOWSdE0an0WSDihe5G1P0t6S5kpaKmmJpK+l8pIbj/Re4CclLUxj8f1U3l/SE+mc75S0cyrvkT7/Je2vLLtjiJIAAALmSURBVGb87UVSd0kLJN2XPpf0eLSUE2mJkNQduB74HLAf8C/pTTRd3RTgmAZlE4EHImIA8ED6DNnYDEg/44EbOyjGjvIOcEFE7AccBPxb+jtQiuOxATgiIoYCw4BjJB0EXA78OCI+BrwOnJ3qnw28nsp/nOp1RV8DlhV8LvXxaBEn0tJxIPCXiHg2Iv4B3AGcWOSY2l1EPAy81qD4RGBq2p4KnFRQ/ovI/BF4v6SKjom0/UXE6vpX90XEW2T/YPalBMcjndPa9LEs/QRwBDAjlTcci/oxmgEcKUkdFG6HkNQPOA74WfosSng8WsOJtHT0BV4o+LwylZWivSJiddr+G7BX2i6ZMUpLccOBJyjR8UjLmE8DLwP3A38F3oiId1KVwvN9dyzS/jpgj46NuN1dBXwL2Jw+70Fpj0eLOZFaSYvs+18l9R0wSb2AXwNfj4g3C/eV0nhExKaIGAb0I1uxGVjkkIpG0vHAyxFRU+xYOiMn0tKxCti74HO/VFaKXqpfoky/X07lXX6MJJWRJdHbI+I3qbhkxwMgIt4A5gKjyJav659BXni+745F2l8OvNrBobang4HPS3qO7LLPEcDVlO54tIoTaemYDwxId+HtDHwRuLfIMRXLvcAZafsM4J6C8tPT3aoHAXUFS56dXrqG9XNgWURcWbCr5MZDUh9J70/b7wOOJrtmPBc4JVVrOBb1Y3QKMCe60NNsIuI/IqJfRFSS/dswJyLGUaLj0Vp+slEJkXQs2XWQ7sDNEXFpkUNqd5J+BRxO9gqol4DvAXcD04B9gOeBUyPitZRoriO7y3cd8JWIqC5G3O1B0iHAI0AtW66DfYfsOmlJjYek/clululONqGYFhH/KemjZDOy3YEFwJcjYoOknsCtZNeVXwO+GBHPFif69iXpcODCiDje49EyTqRmZmY5eGnXzMwsBydSMzOzHJxIzczMcnAiNTMzy8GJ1MzMLAcnUjMzsxycSM3MzHL4Hx9S2FkSapv/AAAAAElFTkSuQmCC\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "korean_ingredient_df = create_ingredient_df(korean_df)\r\n", - "korean_ingredient_df.head(10).plot.barh()" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 15 - } - ], - "source": [ - "feature_df= df.drop(['cuisine','Unnamed: 0','rice','garlic','ginger'], axis=1)\n", - "labels_df = df.cuisine #.unique()\n", - "feature_df.head()\n" - ] - }, - { - "source": [ - "Equilibre os dados com sobreamostragem SMOTE para a classe mais alta. Leia mais aqui: https://imbalanced-learn.org/dev/references/generated/imblearn.over_sampling.SMOTE.html\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [], - "source": [ - "oversample = SMOTE()\n", - "transformed_feature_df, transformed_label_df = oversample.fit_resample(feature_df, labels_df)" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "new label count: korean 799\nchinese 799\njapanese 799\nindian 799\nthai 799\nName: cuisine, dtype: int64\nold label count: korean 799\nindian 598\nchinese 442\njapanese 320\nthai 289\nName: cuisine, dtype: int64\n" - ] - } - ], - "source": [ - "print(f'new label count: {transformed_label_df.value_counts()}')\r\n", - "print(f'old label count: {df.cuisine.value_counts()}')" - ] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 18 - } - ], - "source": [ - "transformed_feature_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " cuisine almond angelica anise anise_seed apple apple_brandy \\\n", - "0 indian 0 0 0 0 0 0 \n", - "1 indian 1 0 0 0 0 0 \n", - "2 indian 0 0 0 0 0 0 \n", - "3 indian 0 0 0 0 0 0 \n", - "4 indian 0 0 0 0 0 0 \n", - "... ... ... ... ... ... ... ... \n", - "3990 thai 0 0 0 0 0 0 \n", - "3991 thai 0 0 0 0 0 0 \n", - "3992 thai 0 0 0 0 0 0 \n", - "3993 thai 0 0 0 0 0 0 \n", - "3994 thai 0 0 0 0 0 0 \n", - "\n", - " apricot armagnac artemisia ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "... ... ... ... ... ... ... ... \n", - "3990 0 0 0 ... 0 0 0 \n", - "3991 0 0 0 ... 0 0 0 \n", - "3992 0 0 0 ... 0 0 0 \n", - "3993 0 0 0 ... 0 0 0 \n", - "3994 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "... ... ... ... ... ... ... ... \n", - "3990 0 0 0 0 0 0 0 \n", - "3991 0 0 0 0 0 0 0 \n", - "3992 0 0 0 0 0 0 0 \n", - "3993 0 0 0 0 0 0 0 \n", - "3994 0 0 0 0 0 0 0 \n", - "\n", - "[3995 rows x 381 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisia...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
0indian000000000...0000000000
1indian100000000...0000000000
2indian000000000...0000000000
3indian000000000...0000000000
4indian000000000...0000000010
..................................................................
3990thai000000000...0000000000
3991thai000000000...0000000000
3992thai000000000...0000000000
3993thai000000000...0000000000
3994thai000000000...0000000000
\n

3995 rows × 381 columns

\n
" - }, - "metadata": {}, - "execution_count": 19 - } - ], - "source": [ - "# export transformed data to new df for classification\n", - "transformed_df = pd.concat([transformed_label_df,transformed_feature_df],axis=1, join='outer')\n", - "transformed_df" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "\nRangeIndex: 3995 entries, 0 to 3994\nColumns: 381 entries, cuisine to zucchini\ndtypes: int64(380), object(1)\nmemory usage: 11.6+ MB\n" - ] - } - ], - "source": [ - "transformed_df.info()" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [], - "source": [ - "transformed_df.to_csv(\"../../data/cleaned_cuisines.csv\")" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "1da12ed6d238756959b8de9cac2a35a2", - "translation_date": "2025-09-03T20:34:40+00:00", - "source_file": "4-Classification/1-Introduction/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/pt/4-Classification/2-Classifiers-1/README.md b/translations/pt/4-Classification/2-Classifiers-1/README.md deleted file mode 100644 index 76595e97a..000000000 --- a/translations/pt/4-Classification/2-Classifiers-1/README.md +++ /dev/null @@ -1,253 +0,0 @@ - -# Classificadores de culinária 1 - -Nesta lição, vais utilizar o conjunto de dados que guardaste na última lição, cheio de dados equilibrados e limpos sobre culinárias. - -Vais usar este conjunto de dados com uma variedade de classificadores para _prever uma culinária nacional com base num grupo de ingredientes_. Enquanto fazes isso, vais aprender mais sobre algumas das formas como os algoritmos podem ser utilizados para tarefas de classificação. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) -# Preparação - -Assumindo que completaste [Lição 1](../1-Introduction/README.md), certifica-te de que existe um ficheiro _cleaned_cuisines.csv_ na pasta raiz `/data` para estas quatro lições. - -## Exercício - prever uma culinária nacional - -1. Trabalhando na pasta _notebook.ipynb_ desta lição, importa esse ficheiro juntamente com a biblioteca Pandas: - - ```python - import pandas as pd - cuisines_df = pd.read_csv("../data/cleaned_cuisines.csv") - cuisines_df.head() - ``` - - Os dados têm este aspeto: - -| | Unnamed: 0 | cuisine | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | -| --- | ---------- | ------- | ------ | -------- | ----- | ---------- | ----- | ------------ | ------- | -------- | --- | ------- | ----------- | ---------- | ----------------------- | ---- | ---- | --- | ----- | ------ | -------- | -| 0 | 0 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 1 | 1 | indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 2 | 2 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 3 | 3 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 4 | 4 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | - - -1. Agora, importa mais algumas bibliotecas: - - ```python - from sklearn.linear_model import LogisticRegression - from sklearn.model_selection import train_test_split, cross_val_score - from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve - from sklearn.svm import SVC - import numpy as np - ``` - -1. Divide as coordenadas X e y em dois dataframes para treino. `cuisine` pode ser o dataframe de etiquetas: - - ```python - cuisines_label_df = cuisines_df['cuisine'] - cuisines_label_df.head() - ``` - - Vai ter este aspeto: - - ```output - 0 indian - 1 indian - 2 indian - 3 indian - 4 indian - Name: cuisine, dtype: object - ``` - -1. Remove a coluna `Unnamed: 0` e a coluna `cuisine`, utilizando `drop()`. Guarda o resto dos dados como características treináveis: - - ```python - cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1) - cuisines_feature_df.head() - ``` - - As tuas características têm este aspeto: - -| | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | artemisia | artichoke | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | -| ---: | -----: | -------: | ----: | ---------: | ----: | -----------: | ------: | -------: | --------: | --------: | ---: | ------: | ----------: | ---------: | ----------------------: | ---: | ---: | ---: | ----: | -----: | -------: | -| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | - -Agora estás pronto para treinar o teu modelo! - -## Escolher o classificador - -Agora que os teus dados estão limpos e prontos para treino, tens de decidir qual o algoritmo a usar para o trabalho. - -O Scikit-learn agrupa a classificação sob Aprendizagem Supervisionada, e nessa categoria vais encontrar muitas formas de classificar. [A variedade](https://scikit-learn.org/stable/supervised_learning.html) pode parecer confusa à primeira vista. Os seguintes métodos incluem técnicas de classificação: - -- Modelos Lineares -- Máquinas de Vetores de Suporte -- Descida de Gradiente Estocástica -- Vizinhos Mais Próximos -- Processos Gaussianos -- Árvores de Decisão -- Métodos de Ensemble (classificador por votação) -- Algoritmos multiclasses e multioutput (classificação multiclasses e multilabel, classificação multiclasses-multioutput) - -> Também podes usar [redes neuronais para classificar dados](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), mas isso está fora do âmbito desta lição. - -### Qual classificador escolher? - -Então, qual classificador deves escolher? Muitas vezes, testar vários e procurar um bom resultado é uma forma de experimentar. O Scikit-learn oferece uma [comparação lado a lado](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) num conjunto de dados criado, comparando KNeighbors, SVC de duas formas, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB e QuadraticDiscriminationAnalysis, mostrando os resultados visualizados: - -![comparação de classificadores](../../../../4-Classification/2-Classifiers-1/images/comparison.png) -> Gráficos gerados na documentação do Scikit-learn - -> O AutoML resolve este problema de forma prática ao realizar estas comparações na nuvem, permitindo-te escolher o melhor algoritmo para os teus dados. Experimenta [aqui](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) - -### Uma abordagem melhor - -Uma forma melhor do que adivinhar aleatoriamente é seguir as ideias deste [guia de consulta de ML](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott) que podes descarregar. Aqui, descobrimos que, para o nosso problema multiclasses, temos algumas opções: - -![guia para problemas multiclasses](../../../../4-Classification/2-Classifiers-1/images/cheatsheet.png) -> Uma secção do Guia de Algoritmos da Microsoft, detalhando opções de classificação multiclasses - -✅ Descarrega este guia, imprime-o e pendura-o na tua parede! - -### Raciocínio - -Vamos ver se conseguimos raciocinar sobre diferentes abordagens dadas as restrições que temos: - -- **Redes neuronais são demasiado pesadas**. Dado o nosso conjunto de dados limpo, mas minimalista, e o facto de estarmos a realizar o treino localmente via notebooks, redes neuronais são demasiado pesadas para esta tarefa. -- **Sem classificadores de duas classes**. Não usamos um classificador de duas classes, o que exclui o one-vs-all. -- **Árvore de decisão ou regressão logística podem funcionar**. Uma árvore de decisão pode funcionar, ou regressão logística para dados multiclasses. -- **Árvores de decisão impulsionadas multiclasses resolvem outro problema**. A árvore de decisão impulsionada multiclasses é mais adequada para tarefas não paramétricas, como tarefas projetadas para criar rankings, por isso não é útil para nós. - -### Usar Scikit-learn - -Vamos usar o Scikit-learn para analisar os nossos dados. No entanto, existem muitas formas de usar regressão logística no Scikit-learn. Dá uma olhada nos [parâmetros a passar](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). - -Basicamente, há dois parâmetros importantes - `multi_class` e `solver` - que precisamos especificar quando pedimos ao Scikit-learn para realizar uma regressão logística. O valor de `multi_class` aplica um certo comportamento. O valor do solver é o algoritmo a usar. Nem todos os solvers podem ser combinados com todos os valores de `multi_class`. - -De acordo com a documentação, no caso multiclasses, o algoritmo de treino: - -- **Usa o esquema one-vs-rest (OvR)**, se a opção `multi_class` estiver definida como `ovr` -- **Usa a perda de entropia cruzada**, se a opção `multi_class` estiver definida como `multinomial`. (Atualmente, a opção `multinomial` é suportada apenas pelos solvers ‘lbfgs’, ‘sag’, ‘saga’ e ‘newton-cg’.) - -> 🎓 O 'esquema' aqui pode ser 'ovr' (one-vs-rest) ou 'multinomial'. Como a regressão logística foi projetada para suportar classificação binária, esses esquemas permitem que ela lide melhor com tarefas de classificação multiclasses. [fonte](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) - -> 🎓 O 'solver' é definido como "o algoritmo a usar no problema de otimização". [fonte](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). - -O Scikit-learn oferece esta tabela para explicar como os solvers lidam com diferentes desafios apresentados por diferentes tipos de estruturas de dados: - -![solvers](../../../../4-Classification/2-Classifiers-1/images/solvers.png) - -## Exercício - dividir os dados - -Podemos focar-nos na regressão logística para o nosso primeiro teste de treino, já que aprendeste sobre ela recentemente numa lição anterior. -Divide os teus dados em grupos de treino e teste chamando `train_test_split()`: - -```python -X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) -``` - -## Exercício - aplicar regressão logística - -Como estás a usar o caso multiclasses, precisas de escolher que _esquema_ usar e que _solver_ definir. Usa LogisticRegression com uma configuração multiclasses e o solver **liblinear** para treinar. - -1. Cria uma regressão logística com multi_class definida como `ovr` e o solver definido como `liblinear`: - - ```python - lr = LogisticRegression(multi_class='ovr',solver='liblinear') - model = lr.fit(X_train, np.ravel(y_train)) - - accuracy = model.score(X_test, y_test) - print ("Accuracy is {}".format(accuracy)) - ``` - - ✅ Experimenta um solver diferente como `lbfgs`, que muitas vezes é definido como padrão -> Nota, utilize a função Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) para achatar os seus dados quando necessário. -A precisão é boa, acima de **80%**! - -1. Pode ver este modelo em ação ao testar uma linha de dados (#50): - - ```python - print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}') - print(f'cuisine: {y_test.iloc[50]}') - ``` - - O resultado é impresso: - - ```output - ingredients: Index(['cilantro', 'onion', 'pea', 'potato', 'tomato', 'vegetable_oil'], dtype='object') - cuisine: indian - ``` - - ✅ Experimente um número de linha diferente e verifique os resultados. - -1. Explorando mais a fundo, pode verificar a precisão desta previsão: - - ```python - test= X_test.iloc[50].values.reshape(-1, 1).T - proba = model.predict_proba(test) - classes = model.classes_ - resultdf = pd.DataFrame(data=proba, columns=classes) - - topPrediction = resultdf.T.sort_values(by=[0], ascending = [False]) - topPrediction.head() - ``` - - O resultado é impresso - cozinha indiana é a melhor estimativa, com boa probabilidade: - - | | 0 | - | -------: | -------: | - | indian | 0.715851 | - | chinese | 0.229475 | - | japanese | 0.029763 | - | korean | 0.017277 | - | thai | 0.007634 | - - ✅ Consegue explicar por que o modelo tem tanta certeza de que se trata de uma cozinha indiana? - -1. Obtenha mais detalhes imprimindo um relatório de classificação, como fez nas lições de regressão: - - ```python - y_pred = model.predict(X_test) - print(classification_report(y_test,y_pred)) - ``` - - | | precisão | recall | f1-score | suporte | - | ------------ | -------- | ------ | -------- | ------- | - | chinese | 0.73 | 0.71 | 0.72 | 229 | - | indian | 0.91 | 0.93 | 0.92 | 254 | - | japanese | 0.70 | 0.75 | 0.72 | 220 | - | korean | 0.86 | 0.76 | 0.81 | 242 | - | thai | 0.79 | 0.85 | 0.82 | 254 | - | accuracy | 0.80 | 1199 | | | - | macro avg | 0.80 | 0.80 | 0.80 | 1199 | - | weighted avg | 0.80 | 0.80 | 0.80 | 1199 | - -## 🚀Desafio - -Nesta lição, utilizou os seus dados limpos para construir um modelo de aprendizagem automática que pode prever uma cozinha nacional com base numa série de ingredientes. Dedique algum tempo a explorar as muitas opções que o Scikit-learn oferece para classificar dados. Aprofunde o conceito de 'solver' para entender o que acontece nos bastidores. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Individual - -Explore um pouco mais a matemática por trás da regressão logística nesta [lição](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf). -## Tarefa - -[Estude os solvers](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/2-Classifiers-1/assignment.md b/translations/pt/4-Classification/2-Classifiers-1/assignment.md deleted file mode 100644 index c5745e488..000000000 --- a/translations/pt/4-Classification/2-Classifiers-1/assignment.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Estude os solucionadores -## Instruções - -Nesta lição, aprendeste sobre os vários solucionadores que combinam algoritmos com um processo de aprendizagem automática para criar um modelo preciso. Revê os solucionadores mencionados na lição e escolhe dois. Com as tuas próprias palavras, compara e contrasta esses dois solucionadores. Que tipo de problema eles resolvem? Como trabalham com diferentes estruturas de dados? Por que escolherias um em vez do outro? -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita Melhorar | -| --------- | --------------------------------------------------------------------------------------------- | ------------------------------------------------ | ---------------------------- | -| | Um ficheiro .doc é apresentado com dois parágrafos, um sobre cada solucionador, comparando-os de forma reflexiva. | Um ficheiro .doc é apresentado com apenas um parágrafo | A tarefa está incompleta | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/2-Classifiers-1/notebook.ipynb b/translations/pt/4-Classification/2-Classifiers-1/notebook.ipynb deleted file mode 100644 index 8815f1694..000000000 --- a/translations/pt/4-Classification/2-Classifiers-1/notebook.ipynb +++ /dev/null @@ -1,41 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "68829b06b4dcd512d3327849191f4d7f", - "translation_date": "2025-09-03T20:19:58+00:00", - "source_file": "4-Classification/2-Classifiers-1/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Construir Modelos de Classificação\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/2-Classifiers-1/solution/Julia/README.md b/translations/pt/4-Classification/2-Classifiers-1/solution/Julia/README.md deleted file mode 100644 index d9048fd36..000000000 --- a/translations/pt/4-Classification/2-Classifiers-1/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb b/translations/pt/4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb deleted file mode 100644 index 999719458..000000000 --- a/translations/pt/4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb +++ /dev/null @@ -1,1298 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 2, - "metadata": { - "colab": { - "name": "lesson_11-R.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "6ea6a5171b1b99b7b5a55f7469c048d2", - "translation_date": "2025-09-03T20:23:38+00:00", - "source_file": "4-Classification/2-Classifiers-1/solution/R/lesson_11-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "source": [ - "# Construir um modelo de classificação: Deliciosas Cozinhas Asiáticas e Indianas\n" - ], - "metadata": { - "id": "zs2woWv_HoE8" - } - }, - { - "cell_type": "markdown", - "source": [ - "## Classificadores de culinária 1\n", - "\n", - "Nesta lição, vamos explorar uma variedade de classificadores para *prever uma culinária nacional específica com base em um grupo de ingredientes.* Enquanto fazemos isso, aprenderemos mais sobre algumas das formas como os algoritmos podem ser utilizados em tarefas de classificação.\n", - "\n", - "### [**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/21/)\n", - "\n", - "### **Preparação**\n", - "\n", - "Esta lição é uma continuação da nossa [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/4-Classification/1-Introduction/solution/lesson_10-R.ipynb), onde:\n", - "\n", - "- Fizemos uma introdução leve às classificações usando um conjunto de dados sobre todas as brilhantes culinárias da Ásia e da Índia 😋.\n", - "\n", - "- Explorámos alguns [verbos do dplyr](https://dplyr.tidyverse.org/) para preparar e limpar os nossos dados.\n", - "\n", - "- Criámos visualizações bonitas usando ggplot2.\n", - "\n", - "- Demonstrámos como lidar com dados desequilibrados ao pré-processá-los usando [recipes](https://recipes.tidymodels.org/articles/Simple_Example.html).\n", - "\n", - "- Mostrámos como `prep` e `bake` a nossa receita para confirmar que funcionará como esperado.\n", - "\n", - "#### **Pré-requisitos**\n", - "\n", - "Para esta lição, precisaremos dos seguintes pacotes para limpar, preparar e visualizar os nossos dados:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [framework de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizagem automática.\n", - "\n", - "- `themis`: O [pacote themis](https://themis.tidymodels.org/) fornece passos adicionais de receitas para lidar com dados desequilibrados.\n", - "\n", - "- `nnet`: O [pacote nnet](https://cran.r-project.org/web/packages/nnet/nnet.pdf) fornece funções para estimar redes neurais feed-forward com uma única camada oculta e para modelos de regressão logística multinomial.\n", - "\n", - "Pode instalá-los da seguinte forma:\n" - ], - "metadata": { - "id": "iDFOb3ebHwQC" - } - }, - { - "cell_type": "markdown", - "source": [ - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"DataExplorer\", \"here\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se tem os pacotes necessários para completar este módulo e instala-os caso estejam em falta.\n" - ], - "metadata": { - "id": "4V85BGCjII7F" - } - }, - { - "cell_type": "code", - "execution_count": 2, - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\r\n", - "\r\n", - "pacman::p_load(tidyverse, tidymodels, themis, here)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "Loading required package: pacman\n", - "\n" - ] - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "an5NPyyKIKNR", - "outputId": "834d5e74-f4b8-49f9-8ab5-4c52ff2d7bc8" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 1. Dividir os dados em conjuntos de treino e teste.\n", - "\n", - "Vamos começar por selecionar alguns passos da nossa lição anterior.\n", - "\n", - "### Eliminar os ingredientes mais comuns que geram confusão entre diferentes cozinhas, utilizando `dplyr::select()`.\n", - "\n", - "Toda a gente adora arroz, alho e gengibre!\n" - ], - "metadata": { - "id": "0ax9GQLBINVv" - } - }, - { - "cell_type": "code", - "execution_count": 3, - "source": [ - "# Load the original cuisines data\r\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/4-Classification/data/cuisines.csv\")\r\n", - "\r\n", - "# Drop id column, rice, garlic and ginger from our original data set\r\n", - "df_select <- df %>% \r\n", - " select(-c(1, rice, garlic, ginger)) %>%\r\n", - " # Encode cuisine column as categorical\r\n", - " mutate(cuisine = factor(cuisine))\r\n", - "\r\n", - "# Display new data set\r\n", - "df_select %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "# Display distribution of cuisines\r\n", - "df_select %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "New names:\n", - "* `` -> ...1\n", - "\n", - "\u001b[1m\u001b[1mRows: \u001b[1m\u001b[22m\u001b[34m\u001b[34m2448\u001b[34m\u001b[39m \u001b[1m\u001b[1mColumns: \u001b[1m\u001b[22m\u001b[34m\u001b[34m385\u001b[34m\u001b[39m\n", - "\n", - "\u001b[36m──\u001b[39m \u001b[1m\u001b[1mColumn specification\u001b[1m\u001b[22m \u001b[36m────────────────────────────────────────────────────────\u001b[39m\n", - "\u001b[1mDelimiter:\u001b[22m \",\"\n", - "\u001b[31mchr\u001b[39m (1): cuisine\n", - "\u001b[32mdbl\u001b[39m (384): ...1, almond, angelica, anise, anise_seed, apple, apple_brandy, a...\n", - "\n", - "\n", - "\u001b[36mℹ\u001b[39m Use \u001b[30m\u001b[47m\u001b[30m\u001b[47m`spec()`\u001b[47m\u001b[30m\u001b[49m\u001b[39m to retrieve the full column specification for this data.\n", - "\u001b[36mℹ\u001b[39m Specify the column types or set \u001b[30m\u001b[47m\u001b[30m\u001b[47m`show_col_types = FALSE`\u001b[47m\u001b[30m\u001b[49m\u001b[39m to quiet this message.\n", - "\n" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine almond angelica anise anise_seed apple apple_brandy apricot armagnac\n", - "1 indian 0 0 0 0 0 0 0 0 \n", - "2 indian 1 0 0 0 0 0 0 0 \n", - "3 indian 0 0 0 0 0 0 0 0 \n", - "4 indian 0 0 0 0 0 0 0 0 \n", - "5 indian 0 0 0 0 0 0 0 0 \n", - " artemisia ⋯ whiskey white_bread white_wine whole_grain_wheat_flour wine wood\n", - "1 0 ⋯ 0 0 0 0 0 0 \n", - "2 0 ⋯ 0 0 0 0 0 0 \n", - "3 0 ⋯ 0 0 0 0 0 0 \n", - "4 0 ⋯ 0 0 0 0 0 0 \n", - "5 0 ⋯ 0 0 0 0 0 0 \n", - " yam yeast yogurt zucchini\n", - "1 0 0 0 0 \n", - "2 0 0 0 0 \n", - "3 0 0 0 0 \n", - "4 0 0 0 0 \n", - "5 0 0 1 0 " - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 381\n", - "\n", - "| cuisine <fct> | almond <dbl> | angelica <dbl> | anise <dbl> | anise_seed <dbl> | apple <dbl> | apple_brandy <dbl> | apricot <dbl> | armagnac <dbl> | artemisia <dbl> | ⋯ ⋯ | whiskey <dbl> | white_bread <dbl> | white_wine <dbl> | whole_grain_wheat_flour <dbl> | wine <dbl> | wood <dbl> | yam <dbl> | yeast <dbl> | yogurt <dbl> | zucchini <dbl> |\n", - "|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 381\n", - "\\begin{tabular}{lllllllllllllllllllll}\n", - " cuisine & almond & angelica & anise & anise\\_seed & apple & apple\\_brandy & apricot & armagnac & artemisia & ⋯ & whiskey & white\\_bread & white\\_wine & whole\\_grain\\_wheat\\_flour & wine & wood & yam & yeast & yogurt & zucchini\\\\\n", - " & & & & & & & & & & ⋯ & & & & & & & & & & \\\\\n", - "\\hline\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t indian & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 381
cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiawhiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
<fct><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl>
indian0000000000000000000
indian1000000000000000000
indian0000000000000000000
indian0000000000000000000
indian0000000000000000010
\n" - ] - }, - "metadata": {} - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine n \n", - "1 korean 799\n", - "2 indian 598\n", - "3 chinese 442\n", - "4 japanese 320\n", - "5 thai 289" - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 2\n", - "\n", - "| cuisine <fct> | n <int> |\n", - "|---|---|\n", - "| korean | 799 |\n", - "| indian | 598 |\n", - "| chinese | 442 |\n", - "| japanese | 320 |\n", - "| thai | 289 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 2\n", - "\\begin{tabular}{ll}\n", - " cuisine & n\\\\\n", - " & \\\\\n", - "\\hline\n", - "\t korean & 799\\\\\n", - "\t indian & 598\\\\\n", - "\t chinese & 442\\\\\n", - "\t japanese & 320\\\\\n", - "\t thai & 289\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 2
cuisinen
<fct><int>
korean 799
indian 598
chinese 442
japanese320
thai 289
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 735 - }, - "id": "jhCrrH22IWVR", - "outputId": "d444a85c-1d8b-485f-bc4f-8be2e8f8217c" - } - }, - { - "cell_type": "markdown", - "source": [ - "Perfeito! Agora, é hora de dividir os dados de forma que 70% dos dados sejam destinados ao treino e 30% aos testes. Também aplicaremos uma técnica de `estratificação` ao dividir os dados para `manter a proporção de cada tipo de cozinha` nos conjuntos de treino e validação.\n", - "\n", - "[rsample](https://rsample.tidymodels.org/), um pacote do Tidymodels, fornece infraestrutura para divisão e reamostragem eficiente de dados:\n" - ], - "metadata": { - "id": "AYTjVyajIdny" - } - }, - { - "cell_type": "code", - "execution_count": 4, - "source": [ - "# Load the core Tidymodels packages into R session\r\n", - "library(tidymodels)\r\n", - "\r\n", - "# Create split specification\r\n", - "set.seed(2056)\r\n", - "cuisines_split <- initial_split(data = df_select,\r\n", - " strata = cuisine,\r\n", - " prop = 0.7)\r\n", - "\r\n", - "# Extract the data in each split\r\n", - "cuisines_train <- training(cuisines_split)\r\n", - "cuisines_test <- testing(cuisines_split)\r\n", - "\r\n", - "# Print the number of cases in each split\r\n", - "cat(\"Training cases: \", nrow(cuisines_train), \"\\n\",\r\n", - " \"Test cases: \", nrow(cuisines_test), sep = \"\")\r\n", - "\r\n", - "# Display the first few rows of the training set\r\n", - "cuisines_train %>% \r\n", - " slice_head(n = 5)\r\n", - "\r\n", - "\r\n", - "# Display distribution of cuisines in the training set\r\n", - "cuisines_train %>% \r\n", - " count(cuisine) %>% \r\n", - " arrange(desc(n))" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Training cases: 1712\n", - "Test cases: 736" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine almond angelica anise anise_seed apple apple_brandy apricot armagnac\n", - "1 chinese 0 0 0 0 0 0 0 0 \n", - "2 chinese 0 0 0 0 0 0 0 0 \n", - "3 chinese 0 0 0 0 0 0 0 0 \n", - "4 chinese 0 0 0 0 0 0 0 0 \n", - "5 chinese 0 0 0 0 0 0 0 0 \n", - " artemisia ⋯ whiskey white_bread white_wine whole_grain_wheat_flour wine wood\n", - "1 0 ⋯ 0 0 0 0 1 0 \n", - "2 0 ⋯ 0 0 0 0 1 0 \n", - "3 0 ⋯ 0 0 0 0 0 0 \n", - "4 0 ⋯ 0 0 0 0 0 0 \n", - "5 0 ⋯ 0 0 0 0 0 0 \n", - " yam yeast yogurt zucchini\n", - "1 0 0 0 0 \n", - "2 0 0 0 0 \n", - "3 0 0 0 0 \n", - "4 0 0 0 0 \n", - "5 0 0 0 0 " - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 381\n", - "\n", - "| cuisine <fct> | almond <dbl> | angelica <dbl> | anise <dbl> | anise_seed <dbl> | apple <dbl> | apple_brandy <dbl> | apricot <dbl> | armagnac <dbl> | artemisia <dbl> | ⋯ ⋯ | whiskey <dbl> | white_bread <dbl> | white_wine <dbl> | whole_grain_wheat_flour <dbl> | wine <dbl> | wood <dbl> | yam <dbl> | yeast <dbl> | yogurt <dbl> | zucchini <dbl> |\n", - "|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "| chinese | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ⋯ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 381\n", - "\\begin{tabular}{lllllllllllllllllllll}\n", - " cuisine & almond & angelica & anise & anise\\_seed & apple & apple\\_brandy & apricot & armagnac & artemisia & ⋯ & whiskey & white\\_bread & white\\_wine & whole\\_grain\\_wheat\\_flour & wine & wood & yam & yeast & yogurt & zucchini\\\\\n", - " & & & & & & & & & & ⋯ & & & & & & & & & & \\\\\n", - "\\hline\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\t chinese & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & ⋯ & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 381
cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiawhiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
<fct><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl><dbl>
chinese0000000000000100000
chinese0000000000000100000
chinese0000000000000000000
chinese0000000000000000000
chinese0000000000000000000
\n" - ] - }, - "metadata": {} - }, - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine n \n", - "1 korean 559\n", - "2 indian 418\n", - "3 chinese 309\n", - "4 japanese 224\n", - "5 thai 202" - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 2\n", - "\n", - "| cuisine <fct> | n <int> |\n", - "|---|---|\n", - "| korean | 559 |\n", - "| indian | 418 |\n", - "| chinese | 309 |\n", - "| japanese | 224 |\n", - "| thai | 202 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 2\n", - "\\begin{tabular}{ll}\n", - " cuisine & n\\\\\n", - " & \\\\\n", - "\\hline\n", - "\t korean & 559\\\\\n", - "\t indian & 418\\\\\n", - "\t chinese & 309\\\\\n", - "\t japanese & 224\\\\\n", - "\t thai & 202\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 2
cuisinen
<fct><int>
korean 559
indian 418
chinese 309
japanese224
thai 202
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 535 - }, - "id": "w5FWIkEiIjdN", - "outputId": "2e195fd9-1a8f-4b91-9573-cce5582242df" - } - }, - { - "cell_type": "markdown", - "source": [ - "## 2. Lidar com dados desequilibrados\n", - "\n", - "Como deve ter reparado no conjunto de dados original, assim como no nosso conjunto de treino, há uma distribuição bastante desigual no número de tipos de cozinha. As cozinhas coreanas são *quase* 3 vezes mais numerosas do que as cozinhas tailandesas. Dados desequilibrados frequentemente têm efeitos negativos no desempenho do modelo. Muitos modelos funcionam melhor quando o número de observações é igual e, por isso, tendem a ter dificuldades com dados desequilibrados.\n", - "\n", - "Existem principalmente duas formas de lidar com conjuntos de dados desequilibrados:\n", - "\n", - "- adicionar observações à classe minoritária: `Over-sampling`, por exemplo, utilizando um algoritmo SMOTE que gera sinteticamente novos exemplos da classe minoritária com base nos vizinhos mais próximos desses casos.\n", - "\n", - "- remover observações da classe majoritária: `Under-sampling`\n", - "\n", - "Na nossa lição anterior, demonstrámos como lidar com conjuntos de dados desequilibrados utilizando uma `recipe`. Uma recipe pode ser vista como um plano que descreve os passos que devem ser aplicados a um conjunto de dados para prepará-lo para análise. No nosso caso, queremos ter uma distribuição igual no número de tipos de cozinha no nosso `conjunto de treino`. Vamos começar!\n" - ], - "metadata": { - "id": "daBi9qJNIwqW" - } - }, - { - "cell_type": "code", - "execution_count": 5, - "source": [ - "# Load themis package for dealing with imbalanced data\r\n", - "library(themis)\r\n", - "\r\n", - "# Create a recipe for preprocessing training data\r\n", - "cuisines_recipe <- recipe(cuisine ~ ., data = cuisines_train) %>% \r\n", - " step_smote(cuisine)\r\n", - "\r\n", - "# Print recipe\r\n", - "cuisines_recipe" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "Data Recipe\n", - "\n", - "Inputs:\n", - "\n", - " role #variables\n", - " outcome 1\n", - " predictor 380\n", - "\n", - "Operations:\n", - "\n", - "SMOTE based on cuisine" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 200 - }, - "id": "Az6LFBGxI1X0", - "outputId": "29d71d85-64b0-4e62-871e-bcd5398573b6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Pode, claro, confirmar (usando prep+bake) que a receita funcionará como esperado - todas as etiquetas de cozinha têm `559` observações.\n", - "\n", - "Como vamos usar esta receita como um pré-processador para modelagem, um `workflow()` fará todo o trabalho de preparação e execução para nós, então não será necessário estimar manualmente a receita.\n", - "\n", - "Agora estamos prontos para treinar um modelo 👩‍💻👨‍💻!\n", - "\n", - "## 3. Escolher o seu classificador\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ], - "metadata": { - "id": "NBL3PqIWJBBB" - } - }, - { - "cell_type": "markdown", - "source": [ - "Agora temos de decidir qual algoritmo usar para o trabalho 🤔.\n", - "\n", - "No Tidymodels, o [`parsnip package`](https://parsnip.tidymodels.org/index.html) fornece uma interface consistente para trabalhar com modelos em diferentes motores (pacotes). Consulte a documentação do parsnip para explorar [tipos de modelos e motores](https://www.tidymodels.org/find/parsnip/#models) e os seus correspondentes [argumentos de modelo](https://www.tidymodels.org/find/parsnip/#model-args). A variedade pode ser bastante confusa à primeira vista. Por exemplo, os seguintes métodos incluem técnicas de classificação:\n", - "\n", - "- Modelos de Classificação Baseados em Regras C5.0\n", - "\n", - "- Modelos de Discriminação Flexível\n", - "\n", - "- Modelos de Discriminação Linear\n", - "\n", - "- Modelos de Discriminação Regularizada\n", - "\n", - "- Modelos de Regressão Logística\n", - "\n", - "- Modelos de Regressão Multinomial\n", - "\n", - "- Modelos de Bayes Ingénuo\n", - "\n", - "- Máquinas de Vetores de Suporte\n", - "\n", - "- Vizinhos Mais Próximos\n", - "\n", - "- Árvores de Decisão\n", - "\n", - "- Métodos de Ensemble\n", - "\n", - "- Redes Neuronais\n", - "\n", - "E a lista continua!\n", - "\n", - "### **Qual classificador escolher?**\n", - "\n", - "Então, qual classificador deve escolher? Muitas vezes, testar vários e procurar um bom resultado é uma forma de experimentar.\n", - "\n", - "> O AutoML resolve este problema de forma prática ao realizar estas comparações na nuvem, permitindo-lhe escolher o melhor algoritmo para os seus dados. Experimente [aqui](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott)\n", - "\n", - "Além disso, a escolha do classificador depende do nosso problema. Por exemplo, quando o resultado pode ser categorizado em `mais de duas classes`, como no nosso caso, deve usar um `algoritmo de classificação multiclasses` em vez de `classificação binária.`\n", - "\n", - "### **Uma abordagem melhor**\n", - "\n", - "Uma abordagem melhor do que adivinhar aleatoriamente, no entanto, é seguir as ideias deste [Guia de Referência de ML](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott) disponível para download. Aqui, descobrimos que, para o nosso problema de multiclasses, temos algumas opções:\n", - "\n", - "

\n", - " \n", - "

Uma secção do Guia de Referência de Algoritmos da Microsoft, detalhando opções de classificação multiclasses
\n" - ], - "metadata": { - "id": "a6DLAZ3vJZ14" - } - }, - { - "cell_type": "markdown", - "source": [ - "### **Raciocínio**\n", - "\n", - "Vamos analisar diferentes abordagens dadas as restrições que temos:\n", - "\n", - "- **Redes Neurais Profundas são demasiado pesadas**. Dado o nosso conjunto de dados limpo, mas minimalista, e o facto de estarmos a executar o treino localmente através de notebooks, redes neurais profundas são demasiado pesadas para esta tarefa.\n", - "\n", - "- **Sem classificador de duas classes**. Não utilizamos um classificador de duas classes, o que elimina a abordagem um-contra-todos.\n", - "\n", - "- **Árvore de decisão ou regressão logística podem funcionar**. Uma árvore de decisão pode funcionar, ou regressão multinomial/regressão logística multiclasses para dados multiclasses.\n", - "\n", - "- **Árvores de decisão multiclasses impulsionadas resolvem outro problema**. A árvore de decisão multiclasses impulsionada é mais adequada para tarefas não paramétricas, por exemplo, tarefas destinadas a construir rankings, por isso não é útil para nós.\n", - "\n", - "Além disso, normalmente antes de embarcar em modelos de aprendizagem automática mais complexos, como métodos de ensemble, é uma boa ideia construir o modelo mais simples possível para ter uma ideia do que está a acontecer. Assim, para esta lição, começaremos com um modelo de `regressão multinomial`.\n", - "\n", - "> A regressão logística é uma técnica utilizada quando a variável de resultado é categórica (ou nominal). Na regressão logística binária, o número de variáveis de resultado é dois, enquanto na regressão logística multinomial o número de variáveis de resultado é superior a dois. Consulte [Advanced Regression Methods](https://bookdown.org/chua/ber642_advanced_regression/multinomial-logistic-regression.html) para leitura adicional.\n", - "\n", - "## 4. Treinar e avaliar um modelo de regressão logística multinomial.\n", - "\n", - "No Tidymodels, `parsnip::multinom_reg()`, define um modelo que utiliza preditores lineares para prever dados multiclasses usando a distribuição multinomial. Consulte `?multinom_reg()` para conhecer as diferentes formas/motores que pode usar para ajustar este modelo.\n", - "\n", - "Neste exemplo, ajustaremos um modelo de regressão multinomial através do motor padrão [nnet](https://cran.r-project.org/web/packages/nnet/nnet.pdf).\n", - "\n", - "> Escolhi um valor para `penalty` de forma um pouco aleatória. Existem formas melhores de escolher este valor, nomeadamente utilizando `resampling` e ajustando o modelo, algo que discutiremos mais tarde.\n", - ">\n", - "> Consulte [Tidymodels: Get Started](https://www.tidymodels.org/start/tuning/) caso queira aprender mais sobre como ajustar os hiperparâmetros do modelo.\n" - ], - "metadata": { - "id": "gWMsVcbBJemu" - } - }, - { - "cell_type": "code", - "execution_count": 6, - "source": [ - "# Create a multinomial regression model specification\r\n", - "mr_spec <- multinom_reg(penalty = 1) %>% \r\n", - " set_engine(\"nnet\", MaxNWts = 2086) %>% \r\n", - " set_mode(\"classification\")\r\n", - "\r\n", - "# Print model specification\r\n", - "mr_spec" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "Multinomial Regression Model Specification (classification)\n", - "\n", - "Main Arguments:\n", - " penalty = 1\n", - "\n", - "Engine-Specific Arguments:\n", - " MaxNWts = 2086\n", - "\n", - "Computational engine: nnet \n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 166 - }, - "id": "Wq_fcyQiJvfG", - "outputId": "c30449c7-3864-4be7-f810-72a003743e2d" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho 🥳! Agora que temos uma receita e uma especificação de modelo, precisamos encontrar uma forma de agrupá-los num objeto que primeiro pré-processará os dados, depois ajustará o modelo nos dados pré-processados e também permitirá atividades de pós-processamento, caso necessário. No Tidymodels, este objeto prático é chamado de [`workflow`](https://workflows.tidymodels.org/) e organiza convenientemente os seus componentes de modelação! Isto é o que chamaríamos de *pipelines* em *Python*.\n", - "\n", - "Então, vamos agrupar tudo num workflow!📦\n" - ], - "metadata": { - "id": "NlSbzDfgJ0zh" - } - }, - { - "cell_type": "code", - "execution_count": 7, - "source": [ - "# Bundle recipe and model specification\r\n", - "mr_wf <- workflow() %>% \r\n", - " add_recipe(cuisines_recipe) %>% \r\n", - " add_model(mr_spec)\r\n", - "\r\n", - "# Print out workflow\r\n", - "mr_wf" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "══ Workflow ════════════════════════════════════════════════════════════════════\n", - "\u001b[3mPreprocessor:\u001b[23m Recipe\n", - "\u001b[3mModel:\u001b[23m multinom_reg()\n", - "\n", - "── Preprocessor ────────────────────────────────────────────────────────────────\n", - "1 Recipe Step\n", - "\n", - "• step_smote()\n", - "\n", - "── Model ───────────────────────────────────────────────────────────────────────\n", - "Multinomial Regression Model Specification (classification)\n", - "\n", - "Main Arguments:\n", - " penalty = 1\n", - "\n", - "Engine-Specific Arguments:\n", - " MaxNWts = 2086\n", - "\n", - "Computational engine: nnet \n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 333 - }, - "id": "Sc1TfPA4Ke3_", - "outputId": "82c70013-e431-4e7e-cef6-9fcf8aad4a6c" - } - }, - { - "cell_type": "markdown", - "source": [ - "Workflows 👌👌! Um **`workflow()`** pode ser ajustado de forma muito semelhante a um modelo. Então, é hora de treinar um modelo!\n" - ], - "metadata": { - "id": "TNQ8i85aKf9L" - } - }, - { - "cell_type": "code", - "execution_count": 8, - "source": [ - "# Train a multinomial regression model\n", - "mr_fit <- fit(object = mr_wf, data = cuisines_train)\n", - "\n", - "mr_fit" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "══ Workflow [trained] ══════════════════════════════════════════════════════════\n", - "\u001b[3mPreprocessor:\u001b[23m Recipe\n", - "\u001b[3mModel:\u001b[23m multinom_reg()\n", - "\n", - "── Preprocessor ────────────────────────────────────────────────────────────────\n", - "1 Recipe Step\n", - "\n", - "• step_smote()\n", - "\n", - "── Model ───────────────────────────────────────────────────────────────────────\n", - "Call:\n", - "nnet::multinom(formula = ..y ~ ., data = data, decay = ~1, MaxNWts = ~2086, \n", - " trace = FALSE)\n", - "\n", - "Coefficients:\n", - " (Intercept) almond angelica anise anise_seed apple\n", - "indian 0.19723325 0.2409661 0 -5.004955e-05 -0.1657635 -0.05769734\n", - "japanese 0.13961959 -0.6262400 0 -1.169155e-04 -0.4893596 -0.08585717\n", - "korean 0.22377347 -0.1833485 0 -5.560395e-05 -0.2489401 -0.15657804\n", - "thai -0.04336577 -0.6106258 0 4.903828e-04 -0.5782866 0.63451105\n", - " apple_brandy apricot armagnac artemisia artichoke asparagus\n", - "indian 0 0.37042636 0 -0.09122797 0 -0.27181970\n", - "japanese 0 0.28895643 0 -0.12651100 0 0.14054037\n", - "korean 0 -0.07981259 0 0.55756709 0 -0.66979948\n", - "thai 0 -0.33160904 0 -0.10725182 0 -0.02602152\n", - " avocado bacon baked_potato balm banana barley\n", - "indian -0.46624197 0.16008055 0 0 -0.2838796 0.2230625\n", - "japanese 0.90341344 0.02932727 0 0 -0.4142787 2.0953906\n", - "korean -0.06925382 -0.35804134 0 0 -0.2686963 -0.7233404\n", - "thai -0.21473955 -0.75594439 0 0 0.6784880 -0.4363320\n", - " bartlett_pear basil bay bean beech\n", - "indian 0 -0.7128756 0.1011587 -0.8777275 -0.0004380795\n", - "japanese 0 0.1288697 0.9425626 -0.2380748 0.3373437611\n", - "korean 0 -0.2445193 -0.4744318 -0.8957870 -0.0048784496\n", - "thai 0 1.5365848 0.1333256 0.2196970 -0.0113078024\n", - " beef beef_broth beef_liver beer beet\n", - "indian -0.7985278 0.2430186 -0.035598065 -0.002173738 0.01005813\n", - "japanese 0.2241875 -0.3653020 -0.139551027 0.128905553 0.04923911\n", - "korean 0.5366515 -0.6153237 0.213455197 -0.010828645 0.27325423\n", - "thai 0.1570012 -0.9364154 -0.008032213 -0.035063746 -0.28279823\n", - " bell_pepper bergamot berry bitter_orange black_bean\n", - "indian 0.49074330 0 0.58947607 0.191256164 -0.1945233\n", - "japanese 0.09074167 0 -0.25917977 -0.118915977 -0.3442400\n", - "korean -0.57876763 0 -0.07874180 -0.007729435 -0.5220672\n", - "thai 0.92554006 0 -0.07210196 -0.002983296 -0.4614426\n", - " black_currant black_mustard_seed_oil black_pepper black_raspberry\n", - "indian 0 0.38935801 -0.4453495 0\n", - "japanese 0 -0.05452887 -0.5440869 0\n", - "korean 0 -0.03929970 0.8025454 0\n", - "thai 0 -0.21498372 -0.9854806 0\n", - " black_sesame_seed black_tea blackberry blackberry_brandy\n", - "indian -0.2759246 0.3079977 0.191256164 0\n", - "japanese -0.6101687 -0.1671913 -0.118915977 0\n", - "korean 1.5197674 -0.3036261 -0.007729435 0\n", - "thai -0.1755656 -0.1487033 -0.002983296 0\n", - " blue_cheese blueberry bone_oil bourbon_whiskey brandy\n", - "indian 0 0.216164294 -0.2276744 0 0.22427587\n", - "japanese 0 -0.119186087 0.3913019 0 -0.15595599\n", - "korean 0 -0.007821986 0.2854487 0 -0.02562342\n", - "thai 0 -0.004947048 -0.0253658 0 -0.05715244\n", - "\n", - "...\n", - "and 308 more lines." - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 1000 - }, - "id": "GMbdfVmTKkJI", - "outputId": "adf9ebdf-d69d-4a64-e9fd-e06e5322292e" - } - }, - { - "cell_type": "markdown", - "source": [ - "Os resultados mostram os coeficientes que o modelo aprendeu durante o treino.\n", - "\n", - "### Avaliar o Modelo Treinado\n", - "\n", - "É hora de verificar como o modelo se saiu 📏 avaliando-o num conjunto de teste! Vamos começar por fazer previsões no conjunto de teste.\n" - ], - "metadata": { - "id": "tt2BfOxrKmcJ" - } - }, - { - "cell_type": "code", - "execution_count": 9, - "source": [ - "# Make predictions on the test set\n", - "results <- cuisines_test %>% select(cuisine) %>% \n", - " bind_cols(mr_fit %>% predict(new_data = cuisines_test))\n", - "\n", - "# Print out results\n", - "results %>% \n", - " slice_head(n = 5)" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine .pred_class\n", - "1 indian thai \n", - "2 indian indian \n", - "3 indian indian \n", - "4 indian indian \n", - "5 indian indian " - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 2\n", - "\n", - "| cuisine <fct> | .pred_class <fct> |\n", - "|---|---|\n", - "| indian | thai |\n", - "| indian | indian |\n", - "| indian | indian |\n", - "| indian | indian |\n", - "| indian | indian |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 2\n", - "\\begin{tabular}{ll}\n", - " cuisine & .pred\\_class\\\\\n", - " & \\\\\n", - "\\hline\n", - "\t indian & thai \\\\\n", - "\t indian & indian\\\\\n", - "\t indian & indian\\\\\n", - "\t indian & indian\\\\\n", - "\t indian & indian\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 2
cuisine.pred_class
<fct><fct>
indianthai
indianindian
indianindian
indianindian
indianindian
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 248 - }, - "id": "CqtckvtsKqax", - "outputId": "e57fe557-6a68-4217-fe82-173328c5436d" - } - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho! No Tidymodels, avaliar o desempenho do modelo pode ser feito usando [yardstick](https://yardstick.tidymodels.org/) - um pacote utilizado para medir a eficácia dos modelos através de métricas de desempenho. Como fizemos na nossa aula de regressão logística, vamos começar por calcular uma matriz de confusão.\n" - ], - "metadata": { - "id": "8w5N6XsBKss7" - } - }, - { - "cell_type": "code", - "execution_count": 10, - "source": [ - "# Confusion matrix for categorical data\n", - "conf_mat(data = results, truth = cuisine, estimate = .pred_class)\n" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " Truth\n", - "Prediction chinese indian japanese korean thai\n", - " chinese 83 1 8 15 10\n", - " indian 4 163 1 2 6\n", - " japanese 21 5 73 25 1\n", - " korean 15 0 11 191 0\n", - " thai 10 11 3 7 70" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 133 - }, - "id": "YvODvsLkK0iG", - "outputId": "bb69da84-1266-47ad-b174-d43b88ca2988" - } - }, - { - "cell_type": "markdown", - "source": [ - "Ao lidar com várias classes, é geralmente mais intuitivo visualizar isto como um mapa de calor, assim:\n" - ], - "metadata": { - "id": "c0HfPL16Lr6U" - } - }, - { - "cell_type": "code", - "execution_count": 11, - "source": [ - "update_geom_defaults(geom = \"tile\", new = list(color = \"black\", alpha = 0.7))\n", - "# Visualize confusion matrix\n", - "results %>% \n", - " conf_mat(cuisine, .pred_class) %>% \n", - " autoplot(type = \"heatmap\")" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - "plot without title" - ], - "image/png": "" - }, - "metadata": { - "image/png": { - "width": 420, - "height": 420 - } - } - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 436 - }, - "id": "HsAtwukyLsvt", - "outputId": "3032a224-a2c8-4270-b4f2-7bb620317400" - } - }, - { - "cell_type": "markdown", - "source": [ - "Os quadrados mais escuros no gráfico da matriz de confusão indicam um número elevado de casos, e espera-se que consiga ver uma linha diagonal de quadrados mais escuros, indicando os casos em que o rótulo previsto e o rótulo real são iguais.\n", - "\n", - "Vamos agora calcular as estatísticas resumidas para a matriz de confusão.\n" - ], - "metadata": { - "id": "oOJC87dkLwPr" - } - }, - { - "cell_type": "code", - "execution_count": 12, - "source": [ - "# Summary stats for confusion matrix\n", - "conf_mat(data = results, truth = cuisine, estimate = .pred_class) %>% \n", - "summary()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " .metric .estimator .estimate\n", - "1 accuracy multiclass 0.7880435\n", - "2 kap multiclass 0.7276583\n", - "3 sens macro 0.7780927\n", - "4 spec macro 0.9477598\n", - "5 ppv macro 0.7585583\n", - "6 npv macro 0.9460080\n", - "7 mcc multiclass 0.7292724\n", - "8 j_index macro 0.7258524\n", - "9 bal_accuracy macro 0.8629262\n", - "10 detection_prevalence macro 0.2000000\n", - "11 precision macro 0.7585583\n", - "12 recall macro 0.7780927\n", - "13 f_meas macro 0.7641862" - ], - "text/markdown": [ - "\n", - "A tibble: 13 × 3\n", - "\n", - "| .metric <chr> | .estimator <chr> | .estimate <dbl> |\n", - "|---|---|---|\n", - "| accuracy | multiclass | 0.7880435 |\n", - "| kap | multiclass | 0.7276583 |\n", - "| sens | macro | 0.7780927 |\n", - "| spec | macro | 0.9477598 |\n", - "| ppv | macro | 0.7585583 |\n", - "| npv | macro | 0.9460080 |\n", - "| mcc | multiclass | 0.7292724 |\n", - "| j_index | macro | 0.7258524 |\n", - "| bal_accuracy | macro | 0.8629262 |\n", - "| detection_prevalence | macro | 0.2000000 |\n", - "| precision | macro | 0.7585583 |\n", - "| recall | macro | 0.7780927 |\n", - "| f_meas | macro | 0.7641862 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 13 × 3\n", - "\\begin{tabular}{lll}\n", - " .metric & .estimator & .estimate\\\\\n", - " & & \\\\\n", - "\\hline\n", - "\t accuracy & multiclass & 0.7880435\\\\\n", - "\t kap & multiclass & 0.7276583\\\\\n", - "\t sens & macro & 0.7780927\\\\\n", - "\t spec & macro & 0.9477598\\\\\n", - "\t ppv & macro & 0.7585583\\\\\n", - "\t npv & macro & 0.9460080\\\\\n", - "\t mcc & multiclass & 0.7292724\\\\\n", - "\t j\\_index & macro & 0.7258524\\\\\n", - "\t bal\\_accuracy & macro & 0.8629262\\\\\n", - "\t detection\\_prevalence & macro & 0.2000000\\\\\n", - "\t precision & macro & 0.7585583\\\\\n", - "\t recall & macro & 0.7780927\\\\\n", - "\t f\\_meas & macro & 0.7641862\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 13 × 3
.metric.estimator.estimate
<chr><chr><dbl>
accuracy multiclass0.7880435
kap multiclass0.7276583
sens macro 0.7780927
spec macro 0.9477598
ppv macro 0.7585583
npv macro 0.9460080
mcc multiclass0.7292724
j_index macro 0.7258524
bal_accuracy macro 0.8629262
detection_prevalencemacro 0.2000000
precision macro 0.7585583
recall macro 0.7780927
f_meas macro 0.7641862
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 494 - }, - "id": "OYqetUyzL5Wz", - "outputId": "6a84d65e-113d-4281-dfc1-16e8b70f37e6" - } - }, - { - "cell_type": "markdown", - "source": [ - "Se nos concentrarmos em algumas métricas como precisão, sensibilidade, ppv, não estamos mal para começar 🥳!\n", - "\n", - "## 4. Aprofundando\n", - "\n", - "Vamos fazer uma pergunta subtil: Que critérios são usados para decidir por um determinado tipo de cozinha como o resultado previsto?\n", - "\n", - "Bem, os algoritmos de aprendizagem automática estatística, como a regressão logística, baseiam-se em `probabilidade`; portanto, o que é realmente previsto por um classificador é uma distribuição de probabilidade sobre um conjunto de resultados possíveis. A classe com a maior probabilidade é então escolhida como o resultado mais provável para as observações dadas.\n", - "\n", - "Vamos ver isto em ação, fazendo tanto previsões de classes rígidas como probabilidades.\n" - ], - "metadata": { - "id": "43t7vz8vMJtW" - } - }, - { - "cell_type": "code", - "execution_count": 13, - "source": [ - "# Make hard class prediction and probabilities\n", - "results_prob <- cuisines_test %>%\n", - " select(cuisine) %>% \n", - " bind_cols(mr_fit %>% predict(new_data = cuisines_test)) %>% \n", - " bind_cols(mr_fit %>% predict(new_data = cuisines_test, type = \"prob\"))\n", - "\n", - "# Print out results\n", - "results_prob %>% \n", - " slice_head(n = 5)" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": [ - " cuisine .pred_class .pred_chinese .pred_indian .pred_japanese .pred_korean\n", - "1 indian thai 1.551259e-03 0.4587877 5.988039e-04 2.428503e-04\n", - "2 indian indian 2.637133e-05 0.9999488 6.648651e-07 2.259993e-05\n", - "3 indian indian 1.049433e-03 0.9909982 1.060937e-03 1.644947e-05\n", - "4 indian indian 6.237482e-02 0.4763035 9.136702e-02 3.660913e-01\n", - "5 indian indian 1.431745e-02 0.9418551 2.945239e-02 8.721782e-03\n", - " .pred_thai \n", - "1 5.388194e-01\n", - "2 1.577948e-06\n", - "3 6.874989e-03\n", - "4 3.863391e-03\n", - "5 5.653283e-03" - ], - "text/markdown": [ - "\n", - "A tibble: 5 × 7\n", - "\n", - "| cuisine <fct> | .pred_class <fct> | .pred_chinese <dbl> | .pred_indian <dbl> | .pred_japanese <dbl> | .pred_korean <dbl> | .pred_thai <dbl> |\n", - "|---|---|---|---|---|---|---|\n", - "| indian | thai | 1.551259e-03 | 0.4587877 | 5.988039e-04 | 2.428503e-04 | 5.388194e-01 |\n", - "| indian | indian | 2.637133e-05 | 0.9999488 | 6.648651e-07 | 2.259993e-05 | 1.577948e-06 |\n", - "| indian | indian | 1.049433e-03 | 0.9909982 | 1.060937e-03 | 1.644947e-05 | 6.874989e-03 |\n", - "| indian | indian | 6.237482e-02 | 0.4763035 | 9.136702e-02 | 3.660913e-01 | 3.863391e-03 |\n", - "| indian | indian | 1.431745e-02 | 0.9418551 | 2.945239e-02 | 8.721782e-03 | 5.653283e-03 |\n", - "\n" - ], - "text/latex": [ - "A tibble: 5 × 7\n", - "\\begin{tabular}{lllllll}\n", - " cuisine & .pred\\_class & .pred\\_chinese & .pred\\_indian & .pred\\_japanese & .pred\\_korean & .pred\\_thai\\\\\n", - " & & & & & & \\\\\n", - "\\hline\n", - "\t indian & thai & 1.551259e-03 & 0.4587877 & 5.988039e-04 & 2.428503e-04 & 5.388194e-01\\\\\n", - "\t indian & indian & 2.637133e-05 & 0.9999488 & 6.648651e-07 & 2.259993e-05 & 1.577948e-06\\\\\n", - "\t indian & indian & 1.049433e-03 & 0.9909982 & 1.060937e-03 & 1.644947e-05 & 6.874989e-03\\\\\n", - "\t indian & indian & 6.237482e-02 & 0.4763035 & 9.136702e-02 & 3.660913e-01 & 3.863391e-03\\\\\n", - "\t indian & indian & 1.431745e-02 & 0.9418551 & 2.945239e-02 & 8.721782e-03 & 5.653283e-03\\\\\n", - "\\end{tabular}\n" - ], - "text/html": [ - "\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\n", - "\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\t\n", - "\n", - "
A tibble: 5 × 7
cuisine.pred_class.pred_chinese.pred_indian.pred_japanese.pred_korean.pred_thai
<fct><fct><dbl><dbl><dbl><dbl><dbl>
indianthai 1.551259e-030.45878775.988039e-042.428503e-045.388194e-01
indianindian2.637133e-050.99994886.648651e-072.259993e-051.577948e-06
indianindian1.049433e-030.99099821.060937e-031.644947e-056.874989e-03
indianindian6.237482e-020.47630359.136702e-023.660913e-013.863391e-03
indianindian1.431745e-020.94185512.945239e-028.721782e-035.653283e-03
\n" - ] - }, - "metadata": {} - } - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 248 - }, - "id": "xdKNs-ZPMTJL", - "outputId": "68f6ac5a-725a-4eff-9ea6-481fef00e008" - } - }, - { - "cell_type": "markdown", - "source": [ - "✅ Consegues explicar porque é que o modelo tem tanta certeza de que a primeira observação é tailandesa?\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Nesta lição, utilizaste os teus dados limpos para construir um modelo de machine learning capaz de prever uma cozinha nacional com base numa série de ingredientes. Dedica algum tempo a explorar as [muitas opções](https://www.tidymodels.org/find/parsnip/#models) que o Tidymodels oferece para classificar dados e [outras formas](https://parsnip.tidymodels.org/articles/articles/Examples.html#multinom_reg-models) de ajustar regressões multinomiais.\n", - "\n", - "#### AGRADECIMENTOS A:\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontra mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "[Cassie Breviu](https://www.twitter.com/cassieview) e [Jen Looper](https://www.twitter.com/jenlooper) por criarem a versão original deste módulo em Python ♥️\n", - "\n", - "
\n", - "Teria incluído algumas piadas, mas não percebo trocadilhos sobre comida 😅.\n", - "\n", - "
\n", - "\n", - "Boas aprendizagens,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Embaixador Estudante Gold da Microsoft Learn.\n" - ], - "metadata": { - "id": "2tWVHMeLMYdM" - } - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/2-Classifiers-1/solution/notebook.ipynb b/translations/pt/4-Classification/2-Classifiers-1/solution/notebook.ipynb deleted file mode 100644 index 169da9e9f..000000000 --- a/translations/pt/4-Classification/2-Classifiers-1/solution/notebook.ipynb +++ /dev/null @@ -1,281 +0,0 @@ -{ - "cells": [ - { - "source": [ - "# Construir Modelos de Classificação\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 1 - } - ], - "source": [ - "import pandas as pd\n", - "cuisines_df = pd.read_csv(\"../../data/cleaned_cuisines.csv\")\n", - "cuisines_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.linear_model import LogisticRegression\n", - "from sklearn.model_selection import train_test_split, cross_val_score\n", - "from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve\n", - "from sklearn.svm import SVC\n", - "import numpy as np" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian\n", - "Name: cuisine, dtype: object" - ] - }, - "metadata": {}, - "execution_count": 3 - } - ], - "source": [ - "cuisines_label_df = cuisines_df['cuisine']\n", - "cuisines_label_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 4 - } - ], - "source": [ - "cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1)\n", - "cuisines_feature_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Accuracy is 0.8181818181818182\n" - ] - } - ], - "source": [ - "lr = LogisticRegression(multi_class='ovr',solver='liblinear')\n", - "model = lr.fit(X_train, np.ravel(y_train))\n", - "\n", - "accuracy = model.score(X_test, y_test)\n", - "print (\"Accuracy is {}\".format(accuracy))" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "ingredients: Index(['artemisia', 'black_pepper', 'mushroom', 'shiitake', 'soy_sauce',\n 'vegetable_oil'],\n dtype='object')\ncuisine: korean\n" - ] - } - ], - "source": [ - "# test an item\n", - "print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}')\n", - "print(f'cuisine: {y_test.iloc[50]}')" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " 0\n", - "korean 0.392231\n", - "chinese 0.372872\n", - "japanese 0.218825\n", - "thai 0.013427\n", - "indian 0.002645" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
0
korean0.392231
chinese0.372872
japanese0.218825
thai0.013427
indian0.002645
\n
" - }, - "metadata": {}, - "execution_count": 8 - } - ], - "source": [ - "#rehsape to 2d array and transpose\n", - "test= X_test.iloc[50].values.reshape(-1, 1).T\n", - "# predict with score\n", - "proba = model.predict_proba(test)\n", - "classes = model.classes_\n", - "# create df with classes and scores\n", - "resultdf = pd.DataFrame(data=proba, columns=classes)\n", - "\n", - "# create df to show results\n", - "topPrediction = resultdf.T.sort_values(by=[0], ascending = [False])\n", - "topPrediction.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " precision recall f1-score support\n\n chinese 0.75 0.73 0.74 223\n indian 0.93 0.88 0.90 255\n japanese 0.78 0.78 0.78 253\n korean 0.87 0.86 0.86 236\n thai 0.76 0.84 0.80 232\n\n accuracy 0.82 1199\n macro avg 0.82 0.82 0.82 1199\nweighted avg 0.82 0.82 0.82 1199\n\n" - ] - } - ], - "source": [ - "y_pred = model.predict(X_test)\r\n", - "print(classification_report(y_test,y_pred))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "9408506dd864f2b6e334c62f80c0cfcc", - "translation_date": "2025-09-03T20:20:22+00:00", - "source_file": "4-Classification/2-Classifiers-1/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/pt/4-Classification/3-Classifiers-2/README.md b/translations/pt/4-Classification/3-Classifiers-2/README.md deleted file mode 100644 index 30e87850a..000000000 --- a/translations/pt/4-Classification/3-Classifiers-2/README.md +++ /dev/null @@ -1,249 +0,0 @@ - -# Classificadores de culinária 2 - -Nesta segunda lição sobre classificação, vais explorar mais formas de classificar dados numéricos. Também vais aprender sobre as implicações de escolher um classificador em vez de outro. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Pré-requisitos - -Assumimos que completaste as lições anteriores e tens um conjunto de dados limpo na tua pasta `data`, chamado _cleaned_cuisines.csv_, na raiz desta pasta de 4 lições. - -### Preparação - -Carregámos o teu ficheiro _notebook.ipynb_ com o conjunto de dados limpo e dividimo-lo em dataframes X e y, prontos para o processo de construção do modelo. - -## Um mapa de classificação - -Anteriormente, aprendeste sobre as várias opções disponíveis para classificar dados utilizando o guia da Microsoft. O Scikit-learn oferece um guia semelhante, mas mais detalhado, que pode ajudar ainda mais a restringir os estimadores (outro termo para classificadores): - -![Mapa de ML do Scikit-learn](../../../../4-Classification/3-Classifiers-2/images/map.png) -> Dica: [visita este mapa online](https://scikit-learn.org/stable/tutorial/machine_learning_map/) e explora os caminhos para ler a documentação. - -### O plano - -Este mapa é muito útil quando tens uma compreensão clara dos teus dados, pois podes 'percorrer' os seus caminhos até uma decisão: - -- Temos >50 amostras -- Queremos prever uma categoria -- Temos dados rotulados -- Temos menos de 100K amostras -- ✨ Podemos escolher um Linear SVC -- Se isso não funcionar, como temos dados numéricos: - - Podemos tentar um ✨ KNeighbors Classifier - - Se isso não funcionar, tentar ✨ SVC e ✨ Ensemble Classifiers - -Este é um caminho muito útil a seguir. - -## Exercício - dividir os dados - -Seguindo este caminho, devemos começar por importar algumas bibliotecas para usar. - -1. Importa as bibliotecas necessárias: - - ```python - from sklearn.neighbors import KNeighborsClassifier - from sklearn.linear_model import LogisticRegression - from sklearn.svm import SVC - from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier - from sklearn.model_selection import train_test_split, cross_val_score - from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve - import numpy as np - ``` - -1. Divide os teus dados de treino e teste: - - ```python - X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) - ``` - -## Classificador Linear SVC - -O clustering por Support-Vector (SVC) é um membro da família de técnicas de ML chamadas Support-Vector Machines (aprende mais sobre estas abaixo). Neste método, podes escolher um 'kernel' para decidir como agrupar os rótulos. O parâmetro 'C' refere-se à 'regularização', que regula a influência dos parâmetros. O kernel pode ser um de [vários](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC); aqui definimos como 'linear' para garantir que utilizamos o Linear SVC. A probabilidade por padrão é 'falsa'; aqui definimos como 'verdadeira' para obter estimativas de probabilidade. Definimos o estado aleatório como '0' para embaralhar os dados e obter probabilidades. - -### Exercício - aplicar um Linear SVC - -Começa por criar um array de classificadores. Vais adicionar progressivamente a este array à medida que testamos. - -1. Começa com um Linear SVC: - - ```python - C = 10 - # Create different classifiers. - classifiers = { - 'Linear SVC': SVC(kernel='linear', C=C, probability=True,random_state=0) - } - ``` - -2. Treina o teu modelo utilizando o Linear SVC e imprime um relatório: - - ```python - n_classifiers = len(classifiers) - - for index, (name, classifier) in enumerate(classifiers.items()): - classifier.fit(X_train, np.ravel(y_train)) - - y_pred = classifier.predict(X_test) - accuracy = accuracy_score(y_test, y_pred) - print("Accuracy (train) for %s: %0.1f%% " % (name, accuracy * 100)) - print(classification_report(y_test,y_pred)) - ``` - - O resultado é bastante bom: - - ```output - Accuracy (train) for Linear SVC: 78.6% - precision recall f1-score support - - chinese 0.71 0.67 0.69 242 - indian 0.88 0.86 0.87 234 - japanese 0.79 0.74 0.76 254 - korean 0.85 0.81 0.83 242 - thai 0.71 0.86 0.78 227 - - accuracy 0.79 1199 - macro avg 0.79 0.79 0.79 1199 - weighted avg 0.79 0.79 0.79 1199 - ``` - -## Classificador K-Neighbors - -K-Neighbors faz parte da família de métodos de ML "neighbors", que podem ser usados tanto para aprendizagem supervisionada como não supervisionada. Neste método, é criado um número pré-definido de pontos e os dados são agrupados em torno desses pontos, de forma que rótulos generalizados possam ser previstos para os dados. - -### Exercício - aplicar o classificador K-Neighbors - -O classificador anterior foi bom e funcionou bem com os dados, mas talvez possamos obter uma melhor precisão. Experimenta um classificador K-Neighbors. - -1. Adiciona uma linha ao teu array de classificadores (adiciona uma vírgula após o item Linear SVC): - - ```python - 'KNN classifier': KNeighborsClassifier(C), - ``` - - O resultado é um pouco pior: - - ```output - Accuracy (train) for KNN classifier: 73.8% - precision recall f1-score support - - chinese 0.64 0.67 0.66 242 - indian 0.86 0.78 0.82 234 - japanese 0.66 0.83 0.74 254 - korean 0.94 0.58 0.72 242 - thai 0.71 0.82 0.76 227 - - accuracy 0.74 1199 - macro avg 0.76 0.74 0.74 1199 - weighted avg 0.76 0.74 0.74 1199 - ``` - - ✅ Aprende sobre [K-Neighbors](https://scikit-learn.org/stable/modules/neighbors.html#neighbors) - -## Classificador Support Vector - -Os classificadores Support-Vector fazem parte da família [Support-Vector Machine](https://wikipedia.org/wiki/Support-vector_machine) de métodos de ML que são usados para tarefas de classificação e regressão. Os SVMs "mapeiam exemplos de treino para pontos no espaço" para maximizar a distância entre duas categorias. Dados subsequentes são mapeados neste espaço para que a sua categoria possa ser prevista. - -### Exercício - aplicar um classificador Support Vector - -Vamos tentar obter uma precisão um pouco melhor com um classificador Support Vector. - -1. Adiciona uma vírgula após o item K-Neighbors e, em seguida, adiciona esta linha: - - ```python - 'SVC': SVC(), - ``` - - O resultado é muito bom! - - ```output - Accuracy (train) for SVC: 83.2% - precision recall f1-score support - - chinese 0.79 0.74 0.76 242 - indian 0.88 0.90 0.89 234 - japanese 0.87 0.81 0.84 254 - korean 0.91 0.82 0.86 242 - thai 0.74 0.90 0.81 227 - - accuracy 0.83 1199 - macro avg 0.84 0.83 0.83 1199 - weighted avg 0.84 0.83 0.83 1199 - ``` - - ✅ Aprende sobre [Support-Vectors](https://scikit-learn.org/stable/modules/svm.html#svm) - -## Classificadores Ensemble - -Vamos seguir o caminho até ao fim, mesmo que o teste anterior tenha sido muito bom. Vamos experimentar alguns 'Classificadores Ensemble', especificamente Random Forest e AdaBoost: - -```python - 'RFST': RandomForestClassifier(n_estimators=100), - 'ADA': AdaBoostClassifier(n_estimators=100) -``` - -O resultado é muito bom, especialmente para Random Forest: - -```output -Accuracy (train) for RFST: 84.5% - precision recall f1-score support - - chinese 0.80 0.77 0.78 242 - indian 0.89 0.92 0.90 234 - japanese 0.86 0.84 0.85 254 - korean 0.88 0.83 0.85 242 - thai 0.80 0.87 0.83 227 - - accuracy 0.84 1199 - macro avg 0.85 0.85 0.84 1199 -weighted avg 0.85 0.84 0.84 1199 - -Accuracy (train) for ADA: 72.4% - precision recall f1-score support - - chinese 0.64 0.49 0.56 242 - indian 0.91 0.83 0.87 234 - japanese 0.68 0.69 0.69 254 - korean 0.73 0.79 0.76 242 - thai 0.67 0.83 0.74 227 - - accuracy 0.72 1199 - macro avg 0.73 0.73 0.72 1199 -weighted avg 0.73 0.72 0.72 1199 -``` - -✅ Aprende sobre [Classificadores Ensemble](https://scikit-learn.org/stable/modules/ensemble.html) - -Este método de Machine Learning "combina as previsões de vários estimadores base" para melhorar a qualidade do modelo. No nosso exemplo, utilizámos Random Trees e AdaBoost. - -- [Random Forest](https://scikit-learn.org/stable/modules/ensemble.html#forest), um método de média, constrói uma 'floresta' de 'árvores de decisão' com infusão de aleatoriedade para evitar overfitting. O parâmetro n_estimators é definido como o número de árvores. - -- [AdaBoost](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html) ajusta um classificador a um conjunto de dados e, em seguida, ajusta cópias desse classificador ao mesmo conjunto de dados. Foca-se nos pesos dos itens classificados incorretamente e ajusta o ajuste para o próximo classificador corrigir. - ---- - -## 🚀Desafio - -Cada uma destas técnicas tem um grande número de parâmetros que podes ajustar. Pesquisa os parâmetros padrão de cada uma e pensa no que ajustar esses parâmetros significaria para a qualidade do modelo. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Há muito jargão nestas lições, por isso tira um momento para rever [esta lista](https://docs.microsoft.com/dotnet/machine-learning/resources/glossary?WT.mc_id=academic-77952-leestott) de terminologia útil! - -## Tarefa - -[Exploração de parâmetros](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/3-Classifiers-2/assignment.md b/translations/pt/4-Classification/3-Classifiers-2/assignment.md deleted file mode 100644 index ece892895..000000000 --- a/translations/pt/4-Classification/3-Classifiers-2/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Exploração de Parâmetros - -## Instruções - -Existem muitos parâmetros que são definidos por padrão ao trabalhar com estes classificadores. O Intellisense no VS Code pode ajudá-lo a explorá-los. Adote uma das Técnicas de Classificação de ML desta lição e reentreine os modelos ajustando vários valores de parâmetros. Crie um notebook explicando por que algumas alterações melhoram a qualidade do modelo enquanto outras a prejudicam. Seja detalhado na sua resposta. - -## Critérios de Avaliação - -| Critério | Exemplar | Adequado | Necessita Melhorias | -| -------- | --------------------------------------------------------------------------------------------------------------------- | ----------------------------------------------------- | ----------------------------- | -| | Um notebook é apresentado com um classificador completamente desenvolvido e seus parâmetros ajustados, com alterações explicadas em caixas de texto | Um notebook é apresentado parcialmente ou mal explicado | Um notebook contém erros ou falhas | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/3-Classifiers-2/notebook.ipynb b/translations/pt/4-Classification/3-Classifiers-2/notebook.ipynb deleted file mode 100644 index fb6e7c51f..000000000 --- a/translations/pt/4-Classification/3-Classifiers-2/notebook.ipynb +++ /dev/null @@ -1,163 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 9 - } - ], - "source": [ - "import pandas as pd\n", - "cuisines_df = pd.read_csv(\"../data/cleaned_cuisines.csv\")\n", - "cuisines_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian\n", - "Name: cuisine, dtype: object" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ], - "source": [ - "cuisines_label_df = cuisines_df['cuisine']\n", - "cuisines_label_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 11 - } - ], - "source": [ - "cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1)\n", - "cuisines_feature_df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "15a83277036572e0773229b5f21c1e12", - "translation_date": "2025-09-03T20:27:16+00:00", - "source_file": "4-Classification/3-Classifiers-2/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/pt/4-Classification/3-Classifiers-2/solution/Julia/README.md b/translations/pt/4-Classification/3-Classifiers-2/solution/Julia/README.md deleted file mode 100644 index 3411deebf..000000000 --- a/translations/pt/4-Classification/3-Classifiers-2/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb b/translations/pt/4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb deleted file mode 100644 index ebc87fa6a..000000000 --- a/translations/pt/4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb +++ /dev/null @@ -1,650 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 0, - "metadata": { - "colab": { - "name": "lesson_12-R.ipynb", - "provenance": [], - "collapsed_sections": [] - }, - "kernelspec": { - "name": "ir", - "display_name": "R" - }, - "language_info": { - "name": "R" - }, - "coopTranslator": { - "original_hash": "fab50046ca413a38939d579f8432274f", - "translation_date": "2025-09-03T20:30:42+00:00", - "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "jsFutf_ygqSx" - }, - "source": [ - "# Construir um modelo de classificação: Deliciosas Cozinhas Asiáticas e Indianas\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "HD54bEefgtNO" - }, - "source": [ - "## Classificadores de culinária 2\n", - "\n", - "Nesta segunda lição sobre classificação, vamos explorar `mais formas` de classificar dados categóricos. Também aprenderemos sobre as implicações de escolher um classificador em vez de outro.\n", - "\n", - "### [**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", - "\n", - "### **Pré-requisitos**\n", - "\n", - "Assumimos que você completou as lições anteriores, já que vamos utilizar alguns conceitos aprendidos anteriormente.\n", - "\n", - "Para esta lição, precisaremos dos seguintes pacotes:\n", - "\n", - "- `tidyverse`: O [tidyverse](https://www.tidyverse.org/) é uma [coleção de pacotes R](https://www.tidyverse.org/packages) projetada para tornar a ciência de dados mais rápida, fácil e divertida!\n", - "\n", - "- `tidymodels`: O [tidymodels](https://www.tidymodels.org/) é uma [estrutura de pacotes](https://www.tidymodels.org/packages/) para modelagem e aprendizagem de máquina.\n", - "\n", - "- `themis`: O [pacote themis](https://themis.tidymodels.org/) fornece passos extras de receitas para lidar com dados desbalanceados.\n", - "\n", - "Você pode instalá-los com o seguinte comando:\n", - "\n", - "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você possui os pacotes necessários para completar este módulo e os instala caso estejam ausentes.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "vZ57IuUxgyQt" - }, - "source": [ - "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "z22M-pj4g07x" - }, - "source": [ - "## **1. Um mapa de classificação**\n", - "\n", - "Na nossa [lição anterior](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1), tentámos responder à pergunta: como escolher entre vários modelos? Em grande parte, isso depende das características dos dados e do tipo de problema que queremos resolver (por exemplo, classificação ou regressão?).\n", - "\n", - "Anteriormente, aprendemos sobre as várias opções disponíveis para classificar dados utilizando o guia da Microsoft. O framework de Machine Learning em Python, Scikit-learn, oferece um guia semelhante, mas mais detalhado, que pode ajudar ainda mais a restringir os seus estimadores (outro termo para classificadores):\n", - "\n", - "

\n", - " \n", - "

\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "u1i3xRIVg7vG" - }, - "source": [ - "> Dica: [visite este mapa online](https://scikit-learn.org/stable/tutorial/machine_learning_map/) e clique ao longo do caminho para ler a documentação.\n", - ">\n", - "> O [site de referência do Tidymodels](https://www.tidymodels.org/find/parsnip/#models) também oferece uma excelente documentação sobre diferentes tipos de modelos.\n", - "\n", - "### **O plano** 🗺️\n", - "\n", - "Este mapa é muito útil quando se tem uma compreensão clara dos seus dados, pois pode 'percorrer' os seus caminhos até chegar a uma decisão:\n", - "\n", - "- Temos \\>50 amostras\n", - "\n", - "- Queremos prever uma categoria\n", - "\n", - "- Temos dados rotulados\n", - "\n", - "- Temos menos de 100K amostras\n", - "\n", - "- ✨ Podemos escolher um Linear SVC\n", - "\n", - "- Se isso não funcionar, como temos dados numéricos\n", - "\n", - " - Podemos tentar um ✨ KNeighbors Classifier\n", - "\n", - " - Se isso não funcionar, tentar ✨ SVC e ✨ Ensemble Classifiers\n", - "\n", - "Este é um caminho muito útil para seguir. Agora, vamos direto ao assunto utilizando o framework de modelagem [tidymodels](https://www.tidymodels.org/): uma coleção consistente e flexível de pacotes R desenvolvidos para incentivar boas práticas estatísticas 😊.\n", - "\n", - "## 2. Dividir os dados e lidar com conjuntos de dados desequilibrados.\n", - "\n", - "Nas nossas lições anteriores, aprendemos que havia um conjunto de ingredientes comuns entre as nossas cozinhas. Além disso, havia uma distribuição bastante desigual no número de cozinhas.\n", - "\n", - "Vamos lidar com isso da seguinte forma:\n", - "\n", - "- Eliminando os ingredientes mais comuns que criam confusão entre cozinhas distintas, usando `dplyr::select()`.\n", - "\n", - "- Utilizando uma `recipe` que pré-processa os dados para prepará-los para a modelagem, aplicando um algoritmo de `over-sampling`.\n", - "\n", - "Já vimos isso na lição anterior, então deve ser tranquilo 🥳!\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "6tj_rN00hClA" - }, - "source": [ - "# Load the core Tidyverse and Tidymodels packages\n", - "library(tidyverse)\n", - "library(tidymodels)\n", - "\n", - "# Load the original cuisines data\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/4-Classification/data/cuisines.csv\")\n", - "\n", - "# Drop id column, rice, garlic and ginger from our original data set\n", - "df_select <- df %>% \n", - " select(-c(1, rice, garlic, ginger)) %>%\n", - " # Encode cuisine column as categorical\n", - " mutate(cuisine = factor(cuisine))\n", - "\n", - "\n", - "# Create data split specification\n", - "set.seed(2056)\n", - "cuisines_split <- initial_split(data = df_select,\n", - " strata = cuisine,\n", - " prop = 0.7)\n", - "\n", - "# Extract the data in each split\n", - "cuisines_train <- training(cuisines_split)\n", - "cuisines_test <- testing(cuisines_split)\n", - "\n", - "# Display distribution of cuisines in the training set\n", - "cuisines_train %>% \n", - " count(cuisine) %>% \n", - " arrange(desc(n))" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "zFin5yw3hHb1" - }, - "source": [ - "### Lidar com dados desequilibrados\n", - "\n", - "Dados desequilibrados frequentemente têm efeitos negativos no desempenho do modelo. Muitos modelos funcionam melhor quando o número de observações é igual e, por isso, tendem a ter dificuldades com dados desequilibrados.\n", - "\n", - "Existem principalmente duas formas de lidar com conjuntos de dados desequilibrados:\n", - "\n", - "- adicionar observações à classe minoritária: `Over-sampling`, por exemplo, utilizando um algoritmo SMOTE que gera novos exemplos sintéticos da classe minoritária com base nos vizinhos mais próximos desses casos.\n", - "\n", - "- remover observações da classe majoritária: `Under-sampling`\n", - "\n", - "Na nossa lição anterior, demonstrámos como lidar com conjuntos de dados desequilibrados utilizando uma `recipe`. Uma recipe pode ser vista como um plano que descreve quais passos devem ser aplicados a um conjunto de dados para prepará-lo para análise. No nosso caso, queremos ter uma distribuição igual no número de nossas cozinhas para o nosso `training set`. Vamos começar!\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "cRzTnHolhLWd" - }, - "source": [ - "# Load themis package for dealing with imbalanced data\n", - "library(themis)\n", - "\n", - "# Create a recipe for preprocessing training data\n", - "cuisines_recipe <- recipe(cuisine ~ ., data = cuisines_train) %>%\n", - " step_smote(cuisine) \n", - "\n", - "# Print recipe\n", - "cuisines_recipe" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "KxOQ2ORhhO81" - }, - "source": [ - "Agora estamos prontos para treinar modelos 👩‍💻👨‍💻!\n", - "\n", - "## 3. Para além dos modelos de regressão multinomial\n", - "\n", - "Na nossa lição anterior, analisámos os modelos de regressão multinomial. Vamos explorar alguns modelos mais flexíveis para classificação.\n", - "\n", - "### Máquinas de Vetores de Suporte\n", - "\n", - "No contexto de classificação, `Máquinas de Vetores de Suporte` são uma técnica de aprendizagem automática que tenta encontrar um *hiperplano* que \"melhor\" separa as classes. Vamos observar um exemplo simples:\n", - "\n", - "

\n", - " \n", - "

https://commons.wikimedia.org/w/index.php?curid=22877598
\n" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "C4Wsd0vZhXYu" - }, - "source": [ - "H1~ não separa as classes. H2~ separa, mas apenas com uma margem pequena. H3~ separa-as com a margem máxima.\n", - "\n", - "#### Classificador Linear de Vetores de Suporte\n", - "\n", - "O clustering de Vetores de Suporte (SVC) é uma técnica derivada da família de máquinas de Vetores de Suporte (SVM) em Aprendizagem Automática. No SVC, o hiperplano é escolhido para separar corretamente `a maioria` das observações de treino, mas `pode classificar incorretamente` algumas observações. Ao permitir que alguns pontos fiquem do lado errado, o SVM torna-se mais robusto a outliers, proporcionando assim uma melhor generalização para novos dados. O parâmetro que regula esta violação é chamado de `cost`, que tem um valor padrão de 1 (consulte `help(\"svm_poly\")`).\n", - "\n", - "Vamos criar um SVC linear definindo `degree = 1` num modelo SVM polinomial.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "vJpp6nuChlBz" - }, - "source": [ - "# Make a linear SVC specification\n", - "svc_linear_spec <- svm_poly(degree = 1) %>% \n", - " set_engine(\"kernlab\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle specification and recipe into a worklow\n", - "svc_linear_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(svc_linear_spec)\n", - "\n", - "# Print out workflow\n", - "svc_linear_wf" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "rDs8cWNkhoqu" - }, - "source": [ - "Agora que capturámos os passos de pré-processamento e a especificação do modelo num *workflow*, podemos avançar e treinar o SVC linear, avaliando os resultados ao mesmo tempo. Para métricas de desempenho, vamos criar um conjunto de métricas que avalie: `accuracy`, `sensitivity`, `Positive Predicted Value` e `F Measure`.\n", - "\n", - "> `augment()` irá adicionar coluna(s) com as previsões aos dados fornecidos.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "81wiqcwuhrnq" - }, - "source": [ - "# Train a linear SVC model\n", - "svc_linear_fit <- svc_linear_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "# Create a metric set\n", - "eval_metrics <- metric_set(ppv, sens, accuracy, f_meas)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "svc_linear_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "0UFQvHf-huo3" - }, - "source": [ - "#### Máquina de Vetores de Suporte\n", - "\n", - "A máquina de vetores de suporte (SVM) é uma extensão do classificador de vetores de suporte para acomodar uma fronteira não linear entre as classes. Essencialmente, as SVMs utilizam o *truque do kernel* para ampliar o espaço de características e assim se adaptar a relações não lineares entre as classes. Uma função kernel popular e extremamente flexível usada pelas SVMs é a *função de base radial.* Vamos ver como ela se comporta com os nossos dados.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "-KX4S8mzhzmp" - }, - "source": [ - "set.seed(2056)\n", - "\n", - "# Make an RBF SVM specification\n", - "svm_rbf_spec <- svm_rbf() %>% \n", - " set_engine(\"kernlab\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle specification and recipe into a worklow\n", - "svm_rbf_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(svm_rbf_spec)\n", - "\n", - "\n", - "# Train an RBF model\n", - "svm_rbf_fit <- svm_rbf_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "svm_rbf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "QBFSa7WSh4HQ" - }, - "source": [ - "Muito melhor 🤩!\n", - "\n", - "> ✅ Por favor veja:\n", - ">\n", - "> - [*Support Vector Machines*](https://bradleyboehmke.github.io/HOML/svm.html), Hands-on Machine Learning with R\n", - ">\n", - "> - [*Support Vector Machines*](https://www.statlearning.com/), An Introduction to Statistical Learning with Applications in R\n", - ">\n", - "> para leitura adicional.\n", - "\n", - "### Classificadores de Vizinhos Mais Próximos\n", - "\n", - "O algoritmo *K*-nearest neighbor (KNN) prevê cada observação com base na sua *semelhança* com outras observações.\n", - "\n", - "Vamos ajustar um ao nosso conjunto de dados.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "k4BxxBcdh9Ka" - }, - "source": [ - "# Make a KNN specification\n", - "knn_spec <- nearest_neighbor() %>% \n", - " set_engine(\"kknn\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle recipe and model specification into a workflow\n", - "knn_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(knn_spec)\n", - "\n", - "# Train a boosted tree model\n", - "knn_wf_fit <- knn_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "knn_wf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "HaegQseriAcj" - }, - "source": [ - "Parece que este modelo não está a ter um desempenho muito bom. Provavelmente, alterar os argumentos do modelo (ver `help(\"nearest_neighbor\")`) irá melhorar o desempenho do modelo. Certifique-se de experimentar.\n", - "\n", - "> ✅ Por favor veja:\n", - ">\n", - "> - [Hands-on Machine Learning with R](https://bradleyboehmke.github.io/HOML/)\n", - ">\n", - "> - [An Introduction to Statistical Learning with Applications in R](https://www.statlearning.com/)\n", - ">\n", - "> para aprender mais sobre classificadores *K*-Nearest Neighbors.\n", - "\n", - "### Classificadores em ensemble\n", - "\n", - "Os algoritmos de ensemble funcionam combinando múltiplos estimadores base para produzir um modelo otimizado, seja através de:\n", - "\n", - "`bagging`: aplicação de uma *função de média* a uma coleção de modelos base\n", - "\n", - "`boosting`: construção de uma sequência de modelos que se complementam para melhorar o desempenho preditivo.\n", - "\n", - "Vamos começar por experimentar um modelo Random Forest, que constrói uma grande coleção de árvores de decisão e depois aplica uma função de média para obter um modelo geral melhor.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "49DPoVs6iK1M" - }, - "source": [ - "# Make a random forest specification\n", - "rf_spec <- rand_forest() %>% \n", - " set_engine(\"ranger\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle recipe and model specification into a workflow\n", - "rf_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(rf_spec)\n", - "\n", - "# Train a random forest model\n", - "rf_wf_fit <- rf_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "rf_wf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "RGVYwC_aiUWc" - }, - "source": [ - "Bom trabalho 👏!\n", - "\n", - "Vamos também experimentar com um modelo de Árvore Reforçada.\n", - "\n", - "Árvore Reforçada define um método de conjunto que cria uma série de árvores de decisão sequenciais, onde cada árvore depende dos resultados das árvores anteriores, numa tentativa de reduzir o erro de forma incremental. Este método foca-se nos pesos dos itens classificados incorretamente e ajusta o modelo do próximo classificador para corrigir.\n", - "\n", - "Existem diferentes formas de ajustar este modelo (veja `help(\"boost_tree\")`). Neste exemplo, vamos ajustar Árvores Reforçadas através do motor `xgboost`.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Py1YWo-micWs" - }, - "source": [ - "# Make a boosted tree specification\n", - "boost_spec <- boost_tree(trees = 200) %>% \n", - " set_engine(\"xgboost\") %>% \n", - " set_mode(\"classification\")\n", - "\n", - "# Bundle recipe and model specification into a workflow\n", - "boost_wf <- workflow() %>% \n", - " add_recipe(cuisines_recipe) %>% \n", - " add_model(boost_spec)\n", - "\n", - "# Train a boosted tree model\n", - "boost_wf_fit <- boost_wf %>% \n", - " fit(data = cuisines_train)\n", - "\n", - "\n", - "# Make predictions and Evaluate model performance\n", - "boost_wf_fit %>% \n", - " augment(new_data = cuisines_test) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class)" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "zNQnbuejigZM" - }, - "source": [ - "> ✅ Por favor veja:\n", - ">\n", - "> - [Machine Learning for Social Scientists](https://cimentadaj.github.io/ml_socsci/tree-based-methods.html#random-forests)\n", - ">\n", - "> - [Hands-on Machine Learning with R](https://bradleyboehmke.github.io/HOML/)\n", - ">\n", - "> - [An Introduction to Statistical Learning with Applications in R](https://www.statlearning.com/)\n", - ">\n", - "> - - Explora o modelo AdaBoost, que é uma boa alternativa ao xgboost.\n", - ">\n", - "> para aprender mais sobre classificadores Ensemble.\n", - "\n", - "## 4. Extra - comparando múltiplos modelos\n", - "\n", - "Testámos vários modelos neste laboratório 🙌. Pode tornar-se cansativo ou trabalhoso criar muitos fluxos de trabalho a partir de diferentes conjuntos de pré-processadores e/ou especificações de modelos e depois calcular as métricas de desempenho uma a uma.\n", - "\n", - "Vamos ver se conseguimos resolver isso criando uma função que ajusta uma lista de fluxos de trabalho no conjunto de treino e depois retorna as métricas de desempenho com base no conjunto de teste. Vamos usar `map()` e `map_dfr()` do pacote [purrr](https://purrr.tidyverse.org/) para aplicar funções a cada elemento de uma lista.\n", - "\n", - "> As funções [`map()`](https://purrr.tidyverse.org/reference/map.html) permitem substituir muitos ciclos \"for\" por código que é mais conciso e mais fácil de ler. O melhor lugar para aprender sobre as funções [`map()`](https://purrr.tidyverse.org/reference/map.html) é o [capítulo de iteração](http://r4ds.had.co.nz/iteration.html) em R for Data Science.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Qzb7LyZnimd2" - }, - "source": [ - "set.seed(2056)\n", - "\n", - "# Create a metric set\n", - "eval_metrics <- metric_set(ppv, sens, accuracy, f_meas)\n", - "\n", - "# Define a function that returns performance metrics\n", - "compare_models <- function(workflow_list, train_set, test_set){\n", - " \n", - " suppressWarnings(\n", - " # Fit each model to the train_set\n", - " map(workflow_list, fit, data = train_set) %>% \n", - " # Make predictions on the test set\n", - " map_dfr(augment, new_data = test_set, .id = \"model\") %>%\n", - " # Select desired columns\n", - " select(model, cuisine, .pred_class) %>% \n", - " # Evaluate model performance\n", - " group_by(model) %>% \n", - " eval_metrics(truth = cuisine, estimate = .pred_class) %>% \n", - " ungroup()\n", - " )\n", - " \n", - "} # End of function" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Fwa712sNisDA" - }, - "source": [] - }, - { - "cell_type": "code", - "metadata": { - "id": "3i4VJOi2iu-a" - }, - "source": [ - "# Make a list of workflows\n", - "workflow_list <- list(\n", - " \"svc\" = svc_linear_wf,\n", - " \"svm\" = svm_rbf_wf,\n", - " \"knn\" = knn_wf,\n", - " \"random_forest\" = rf_wf,\n", - " \"xgboost\" = boost_wf)\n", - "\n", - "# Call the function\n", - "set.seed(2056)\n", - "perf_metrics <- compare_models(workflow_list = workflow_list, train_set = cuisines_train, test_set = cuisines_test)\n", - "\n", - "# Print out performance metrics\n", - "perf_metrics %>% \n", - " group_by(.metric) %>% \n", - " arrange(desc(.estimate)) %>% \n", - " slice_head(n=7)\n", - "\n", - "# Compare accuracy\n", - "perf_metrics %>% \n", - " filter(.metric == \"accuracy\") %>% \n", - " arrange(desc(.estimate))\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "KuWK_lEli4nW" - }, - "source": [ - "O pacote [**workflowset**](https://workflowsets.tidymodels.org/) permite aos utilizadores criar e ajustar facilmente um grande número de modelos, mas foi principalmente concebido para funcionar com técnicas de reamostragem, como a `validação cruzada`, uma abordagem que ainda iremos abordar.\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Cada uma destas técnicas tem um grande número de parâmetros que podem ser ajustados, como por exemplo `cost` em SVMs, `neighbors` em KNN, `mtry` (Preditores Selecionados Aleatoriamente) em Random Forest.\n", - "\n", - "Pesquise os parâmetros padrão de cada técnica e reflita sobre o que ajustar esses parâmetros significaria para a qualidade do modelo.\n", - "\n", - "Para saber mais sobre um modelo específico e os seus parâmetros, utilize: `help(\"model\")`, por exemplo, `help(\"rand_forest\")`.\n", - "\n", - "> Na prática, geralmente *estimamos* os *melhores valores* para estes parâmetros treinando vários modelos num `conjunto de dados simulado` e medindo o desempenho de todos esses modelos. Este processo é chamado de **otimização**.\n", - "\n", - "### [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/24/)\n", - "\n", - "### **Revisão & Estudo Individual**\n", - "\n", - "Há muito jargão nestas lições, por isso reserve um momento para rever [esta lista](https://docs.microsoft.com/dotnet/machine-learning/resources/glossary?WT.mc_id=academic-77952-leestott) de terminologia útil!\n", - "\n", - "#### AGRADECIMENTOS A:\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "[Cassie Breviu](https://www.twitter.com/cassieview) e [Jen Looper](https://www.twitter.com/jenlooper) por criarem a versão original deste módulo em Python ♥️\n", - "\n", - "Boas aprendizagens,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Embaixador Estudante Gold da Microsoft Learn.\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/3-Classifiers-2/solution/notebook.ipynb b/translations/pt/4-Classification/3-Classifiers-2/solution/notebook.ipynb deleted file mode 100644 index 128e376a1..000000000 --- a/translations/pt/4-Classification/3-Classifiers-2/solution/notebook.ipynb +++ /dev/null @@ -1,302 +0,0 @@ -{ - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 1 - } - ], - "source": [ - "import pandas as pd\n", - "cuisines_df = pd.read_csv(\"../../data/cleaned_cuisines.csv\")\n", - "cuisines_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian\n", - "Name: cuisine, dtype: object" - ] - }, - "metadata": {}, - "execution_count": 2 - } - ], - "source": [ - "cuisines_label_df = cuisines_df['cuisine']\n", - "cuisines_label_df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 3 - } - ], - "source": [ - "cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1)\n", - "cuisines_feature_df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Experimente diferentes classificadores\n" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.neighbors import KNeighborsClassifier\n", - "from sklearn.linear_model import LogisticRegression\n", - "from sklearn.svm import SVC\n", - "from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier\n", - "from sklearn.model_selection import train_test_split, cross_val_score\n", - "from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report, precision_recall_curve\n", - "import numpy as np" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "\n", - "C = 10\n", - "# Create different classifiers.\n", - "classifiers = {\n", - " 'Linear SVC': SVC(kernel='linear', C=C, probability=True,random_state=0),\n", - " 'KNN classifier': KNeighborsClassifier(C),\n", - " 'SVC': SVC(),\n", - " 'RFST': RandomForestClassifier(n_estimators=100),\n", - " 'ADA': AdaBoostClassifier(n_estimators=100)\n", - " \n", - "}\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Accuracy (train) for Linear SVC: 76.4% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.64 0.66 0.65 242\n", - " indian 0.91 0.86 0.89 236\n", - " japanese 0.72 0.73 0.73 245\n", - " korean 0.83 0.75 0.79 234\n", - " thai 0.75 0.82 0.78 242\n", - "\n", - " accuracy 0.76 1199\n", - " macro avg 0.77 0.76 0.77 1199\n", - "weighted avg 0.77 0.76 0.77 1199\n", - "\n", - "Accuracy (train) for KNN classifier: 70.7% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.65 0.63 0.64 242\n", - " indian 0.84 0.81 0.82 236\n", - " japanese 0.60 0.81 0.69 245\n", - " korean 0.89 0.53 0.67 234\n", - " thai 0.69 0.75 0.72 242\n", - "\n", - " accuracy 0.71 1199\n", - " macro avg 0.73 0.71 0.71 1199\n", - "weighted avg 0.73 0.71 0.71 1199\n", - "\n", - "Accuracy (train) for SVC: 80.1% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.71 0.69 0.70 242\n", - " indian 0.92 0.92 0.92 236\n", - " japanese 0.77 0.78 0.77 245\n", - " korean 0.87 0.77 0.82 234\n", - " thai 0.75 0.86 0.80 242\n", - "\n", - " accuracy 0.80 1199\n", - " macro avg 0.80 0.80 0.80 1199\n", - "weighted avg 0.80 0.80 0.80 1199\n", - "\n", - "Accuracy (train) for RFST: 82.8% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.80 0.75 0.77 242\n", - " indian 0.90 0.91 0.90 236\n", - " japanese 0.82 0.78 0.80 245\n", - " korean 0.85 0.82 0.83 234\n", - " thai 0.78 0.89 0.83 242\n", - "\n", - " accuracy 0.83 1199\n", - " macro avg 0.83 0.83 0.83 1199\n", - "weighted avg 0.83 0.83 0.83 1199\n", - "\n", - "Accuracy (train) for ADA: 71.1% \n", - " precision recall f1-score support\n", - "\n", - " chinese 0.60 0.57 0.58 242\n", - " indian 0.87 0.84 0.86 236\n", - " japanese 0.71 0.60 0.65 245\n", - " korean 0.68 0.78 0.72 234\n", - " thai 0.70 0.78 0.74 242\n", - "\n", - " accuracy 0.71 1199\n", - " macro avg 0.71 0.71 0.71 1199\n", - "weighted avg 0.71 0.71 0.71 1199\n", - "\n" - ] - } - ], - "source": [ - "n_classifiers = len(classifiers)\n", - "\n", - "for index, (name, classifier) in enumerate(classifiers.items()):\n", - " classifier.fit(X_train, np.ravel(y_train))\n", - "\n", - " y_pred = classifier.predict(X_test)\n", - " accuracy = accuracy_score(y_test, y_pred)\n", - " print(\"Accuracy (train) for %s: %0.1f%% \" % (name, accuracy * 100))\n", - " print(classification_report(y_test,y_pred))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "7ea2b714669c823a596d986ba2d5739f", - "translation_date": "2025-09-03T20:27:39+00:00", - "source_file": "4-Classification/3-Classifiers-2/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 4 -} \ No newline at end of file diff --git a/translations/pt/4-Classification/4-Applied/README.md b/translations/pt/4-Classification/4-Applied/README.md deleted file mode 100644 index 2079bbc28..000000000 --- a/translations/pt/4-Classification/4-Applied/README.md +++ /dev/null @@ -1,329 +0,0 @@ - -# Construir uma Aplicação Web de Recomendação de Culinária - -Nesta lição, vais construir um modelo de classificação utilizando algumas das técnicas que aprendeste em lições anteriores e com o delicioso conjunto de dados de culinária usado ao longo desta série. Além disso, vais criar uma pequena aplicação web para usar um modelo guardado, aproveitando o runtime web do Onnx. - -Uma das utilizações mais práticas da aprendizagem automática é a construção de sistemas de recomendação, e hoje podes dar o primeiro passo nessa direção! - -[![Apresentando esta aplicação web](https://img.youtube.com/vi/17wdM9AHMfg/0.jpg)](https://youtu.be/17wdM9AHMfg "ML Aplicada") - -> 🎥 Clica na imagem acima para ver um vídeo: Jen Looper constrói uma aplicação web usando dados de culinária classificados - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -Nesta lição vais aprender: - -- Como construir um modelo e guardá-lo como um modelo Onnx -- Como usar o Netron para inspecionar o modelo -- Como usar o teu modelo numa aplicação web para inferência - -## Construir o teu modelo - -Construir sistemas de ML aplicados é uma parte importante para aproveitar estas tecnologias nos sistemas empresariais. Podes usar modelos dentro das tuas aplicações web (e assim utilizá-los num contexto offline, se necessário) ao usar Onnx. - -Numa [lição anterior](../../3-Web-App/1-Web-App/README.md), construíste um modelo de regressão sobre avistamentos de OVNIs, "pickled" o modelo e usaste-o numa aplicação Flask. Embora esta arquitetura seja muito útil, trata-se de uma aplicação Python full-stack, e os teus requisitos podem incluir o uso de uma aplicação JavaScript. - -Nesta lição, podes construir um sistema básico baseado em JavaScript para inferência. Primeiro, no entanto, precisas de treinar um modelo e convertê-lo para uso com Onnx. - -## Exercício - treinar modelo de classificação - -Primeiro, treina um modelo de classificação usando o conjunto de dados de culinária limpo que utilizámos. - -1. Começa por importar bibliotecas úteis: - - ```python - !pip install skl2onnx - import pandas as pd - ``` - - Vais precisar de '[skl2onnx](https://onnx.ai/sklearn-onnx/)' para ajudar a converter o teu modelo Scikit-learn para o formato Onnx. - -1. Depois, trabalha com os teus dados da mesma forma que fizeste em lições anteriores, lendo um ficheiro CSV usando `read_csv()`: - - ```python - data = pd.read_csv('../data/cleaned_cuisines.csv') - data.head() - ``` - -1. Remove as duas primeiras colunas desnecessárias e guarda os dados restantes como 'X': - - ```python - X = data.iloc[:,2:] - X.head() - ``` - -1. Guarda os rótulos como 'y': - - ```python - y = data[['cuisine']] - y.head() - - ``` - -### Iniciar a rotina de treino - -Vamos usar a biblioteca 'SVC', que tem boa precisão. - -1. Importa as bibliotecas apropriadas do Scikit-learn: - - ```python - from sklearn.model_selection import train_test_split - from sklearn.svm import SVC - from sklearn.model_selection import cross_val_score - from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report - ``` - -1. Separa os conjuntos de treino e teste: - - ```python - X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3) - ``` - -1. Constrói um modelo de classificação SVC como fizeste na lição anterior: - - ```python - model = SVC(kernel='linear', C=10, probability=True,random_state=0) - model.fit(X_train,y_train.values.ravel()) - ``` - -1. Agora, testa o teu modelo, chamando `predict()`: - - ```python - y_pred = model.predict(X_test) - ``` - -1. Imprime um relatório de classificação para verificar a qualidade do modelo: - - ```python - print(classification_report(y_test,y_pred)) - ``` - - Como vimos antes, a precisão é boa: - - ```output - precision recall f1-score support - - chinese 0.72 0.69 0.70 257 - indian 0.91 0.87 0.89 243 - japanese 0.79 0.77 0.78 239 - korean 0.83 0.79 0.81 236 - thai 0.72 0.84 0.78 224 - - accuracy 0.79 1199 - macro avg 0.79 0.79 0.79 1199 - weighted avg 0.79 0.79 0.79 1199 - ``` - -### Converter o teu modelo para Onnx - -Certifica-te de fazer a conversão com o número correto de tensores. Este conjunto de dados tem 380 ingredientes listados, por isso precisas de indicar esse número em `FloatTensorType`: - -1. Converte usando um número de tensor de 380. - - ```python - from skl2onnx import convert_sklearn - from skl2onnx.common.data_types import FloatTensorType - - initial_type = [('float_input', FloatTensorType([None, 380]))] - options = {id(model): {'nocl': True, 'zipmap': False}} - ``` - -1. Cria o ficheiro onx e guarda-o como **model.onnx**: - - ```python - onx = convert_sklearn(model, initial_types=initial_type, options=options) - with open("./model.onnx", "wb") as f: - f.write(onx.SerializeToString()) - ``` - - > Nota, podes passar [opções](https://onnx.ai/sklearn-onnx/parameterized.html) no teu script de conversão. Neste caso, passámos 'nocl' como True e 'zipmap' como False. Como este é um modelo de classificação, tens a opção de remover ZipMap, que produz uma lista de dicionários (não necessário). `nocl` refere-se à inclusão de informações de classe no modelo. Reduz o tamanho do teu modelo ao definir `nocl` como 'True'. - -Executar o notebook completo agora irá construir um modelo Onnx e guardá-lo nesta pasta. - -## Visualizar o teu modelo - -Os modelos Onnx não são muito visíveis no Visual Studio Code, mas há um software gratuito muito bom que muitos investigadores utilizam para visualizar o modelo e garantir que foi construído corretamente. Faz o download do [Netron](https://github.com/lutzroeder/Netron) e abre o ficheiro model.onnx. Podes ver o teu modelo simples visualizado, com os seus 380 inputs e o classificador listado: - -![Visualização Netron](../../../../4-Classification/4-Applied/images/netron.png) - -Netron é uma ferramenta útil para visualizar os teus modelos. - -Agora estás pronto para usar este modelo interessante numa aplicação web. Vamos construir uma aplicação que será útil quando olhares para o teu frigorífico e tentares descobrir qual combinação de ingredientes sobrantes podes usar para cozinhar um prato específico, conforme determinado pelo teu modelo. - -## Construir uma aplicação web de recomendação - -Podes usar o teu modelo diretamente numa aplicação web. Esta arquitetura também permite que o modelo seja executado localmente e até offline, se necessário. Começa por criar um ficheiro `index.html` na mesma pasta onde guardaste o teu ficheiro `model.onnx`. - -1. Neste ficheiro _index.html_, adiciona a seguinte marcação: - - ```html - - -
- Cuisine Matcher -
- - ... - - - ``` - -1. Agora, dentro das tags `body`, adiciona uma pequena marcação para mostrar uma lista de caixas de seleção que refletem alguns ingredientes: - - ```html -

Check your refrigerator. What can you create?

-
-
- - -
- -
- - -
- -
- - -
- -
- - -
- -
- - -
- -
- - -
- -
- - -
-
-
- -
- ``` - - Repara que cada caixa de seleção tem um valor. Este valor reflete o índice onde o ingrediente é encontrado de acordo com o conjunto de dados. A maçã, por exemplo, nesta lista alfabética, ocupa a quinta coluna, por isso o seu valor é '4', já que começamos a contar a partir de 0. Podes consultar a [folha de cálculo de ingredientes](../../../../4-Classification/data/ingredient_indexes.csv) para descobrir o índice de um determinado ingrediente. - - Continuando o teu trabalho no ficheiro index.html, adiciona um bloco de script onde o modelo é chamado após o último ``. - -1. Primeiro, importa o [Onnx Runtime](https://www.onnxruntime.ai/): - - ```html - - ``` - - > O Onnx Runtime é usado para permitir a execução dos teus modelos Onnx em uma ampla gama de plataformas de hardware, incluindo otimizações e uma API para uso. - -1. Uma vez que o Runtime esteja em funcionamento, podes chamá-lo: - - ```html - - ``` - -Neste código, várias coisas estão a acontecer: - -1. Criaste um array de 380 valores possíveis (1 ou 0) para serem definidos e enviados ao modelo para inferência, dependendo de se uma caixa de seleção de ingrediente está marcada. -2. Criaste um array de caixas de seleção e uma forma de determinar se foram marcadas numa função `init` que é chamada quando a aplicação começa. Quando uma caixa de seleção é marcada, o array `ingredients` é alterado para refletir o ingrediente escolhido. -3. Criaste uma função `testCheckboxes` que verifica se alguma caixa de seleção foi marcada. -4. Usas a função `startInference` quando o botão é pressionado e, se alguma caixa de seleção estiver marcada, inicias a inferência. -5. A rotina de inferência inclui: - 1. Configurar um carregamento assíncrono do modelo - 2. Criar uma estrutura Tensor para enviar ao modelo - 3. Criar 'feeds' que refletem o input `float_input` que criaste ao treinar o teu modelo (podes usar o Netron para verificar esse nome) - 4. Enviar esses 'feeds' ao modelo e aguardar uma resposta - -## Testar a tua aplicação - -Abre uma sessão de terminal no Visual Studio Code na pasta onde o teu ficheiro index.html está localizado. Certifica-te de que tens [http-server](https://www.npmjs.com/package/http-server) instalado globalmente e escreve `http-server` no prompt. Um localhost deve abrir e podes visualizar a tua aplicação web. Verifica qual culinária é recomendada com base em vários ingredientes: - -![Aplicação web de ingredientes](../../../../4-Classification/4-Applied/images/web-app.png) - -Parabéns, criaste uma aplicação web de 'recomendação' com alguns campos. Dedica algum tempo a expandir este sistema! - -## 🚀Desafio - -A tua aplicação web é muito minimalista, por isso continua a expandi-la usando ingredientes e os seus índices a partir dos dados [ingredient_indexes](../../../../4-Classification/data/ingredient_indexes.csv). Quais combinações de sabores funcionam para criar um prato nacional específico? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Embora esta lição tenha apenas tocado na utilidade de criar um sistema de recomendação para ingredientes alimentares, esta área de aplicações de ML é muito rica em exemplos. Lê mais sobre como estes sistemas são construídos: - -- https://www.sciencedirect.com/topics/computer-science/recommendation-engine -- https://www.technologyreview.com/2014/08/25/171547/the-ultimate-challenge-for-recommendation-engines/ -- https://www.technologyreview.com/2015/03/23/168831/everything-is-a-recommendation/ - -## Tarefa - -[Constrói um novo sistema de recomendação](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/4-Applied/assignment.md b/translations/pt/4-Classification/4-Applied/assignment.md deleted file mode 100644 index 3ffcfed53..000000000 --- a/translations/pt/4-Classification/4-Applied/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Construir um recomendador - -## Instruções - -Com base nos exercícios desta lição, agora sabe como criar uma aplicação web em JavaScript utilizando Onnx Runtime e um modelo Onnx convertido. Experimente criar um novo recomendador usando dados destas lições ou obtidos de outras fontes (dê crédito, por favor). Pode criar, por exemplo, um recomendador de animais de estimação com base em vários atributos de personalidade, ou um recomendador de géneros musicais baseado no estado de espírito de uma pessoa. Seja criativo! - -## Critérios de Avaliação - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | --------------------------------------------------------------------- | ------------------------------------- | --------------------------------- | -| | Uma aplicação web e um notebook são apresentados, ambos bem documentados e funcionais | Um dos dois está em falta ou apresenta falhas | Ambos estão em falta ou apresentam falhas | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/4-Classification/4-Applied/notebook.ipynb b/translations/pt/4-Classification/4-Applied/notebook.ipynb deleted file mode 100644 index 6793b8da2..000000000 --- a/translations/pt/4-Classification/4-Applied/notebook.ipynb +++ /dev/null @@ -1,39 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 4, - "coopTranslator": { - "original_hash": "2f3e0d9e9ac5c301558fb8bf733ac0cb", - "translation_date": "2025-09-03T20:26:34+00:00", - "source_file": "4-Classification/4-Applied/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/4-Applied/solution/notebook.ipynb b/translations/pt/4-Classification/4-Applied/solution/notebook.ipynb deleted file mode 100644 index 987be9d86..000000000 --- a/translations/pt/4-Classification/4-Applied/solution/notebook.ipynb +++ /dev/null @@ -1,290 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "49325d6dd12a3628fc64fa7ccb1a80ff", - "translation_date": "2025-09-03T20:26:56+00:00", - "source_file": "4-Classification/4-Applied/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 58, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: skl2onnx in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (1.8.0)\n", - "Requirement already satisfied: protobuf in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (3.8.0)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.19.2)\n", - "Requirement already satisfied: onnx>=1.2.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.9.0)\n", - "Requirement already satisfied: six in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from skl2onnx) (1.12.0)\n", - "Requirement already satisfied: onnxconverter-common<1.9,>=1.6.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.8.1)\n", - "Requirement already satisfied: scikit-learn>=0.19 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (0.24.2)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from skl2onnx) (1.4.1)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from protobuf->skl2onnx) (45.1.0)\n", - "Requirement already satisfied: typing-extensions>=3.6.2.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from onnx>=1.2.1->skl2onnx) (3.10.0.0)\n", - "Requirement already satisfied: threadpoolctl>=2.0.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from scikit-learn>=0.19->skl2onnx) (2.1.0)\n", - "Requirement already satisfied: joblib>=0.11 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from scikit-learn>=0.19->skl2onnx) (0.16.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "!pip install skl2onnx" - ] - }, - { - "cell_type": "code", - "execution_count": 59, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd \n" - ] - }, - { - "cell_type": "code", - "execution_count": 60, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " Unnamed: 0 cuisine almond angelica anise anise_seed apple \\\n", - "0 0 indian 0 0 0 0 0 \n", - "1 1 indian 1 0 0 0 0 \n", - "2 2 indian 0 0 0 0 0 \n", - "3 3 indian 0 0 0 0 0 \n", - "4 4 indian 0 0 0 0 0 \n", - "\n", - " apple_brandy apricot armagnac ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 382 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
Unnamed: 0cuisinealmondangelicaaniseanise_seedappleapple_brandyapricotarmagnac...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00indian00000000...0000000000
11indian10000000...0000000000
22indian00000000...0000000000
33indian00000000...0000000000
44indian00000000...0000000010
\n

5 rows × 382 columns

\n
" - }, - "metadata": {}, - "execution_count": 60 - } - ], - "source": [ - "data = pd.read_csv('../../data/cleaned_cuisines.csv')\n", - "data.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 61, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " almond angelica anise anise_seed apple apple_brandy apricot \\\n", - "0 0 0 0 0 0 0 0 \n", - "1 1 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 0 0 \n", - "\n", - " armagnac artemisia artichoke ... whiskey white_bread white_wine \\\n", - "0 0 0 0 ... 0 0 0 \n", - "1 0 0 0 ... 0 0 0 \n", - "2 0 0 0 ... 0 0 0 \n", - "3 0 0 0 ... 0 0 0 \n", - "4 0 0 0 ... 0 0 0 \n", - "\n", - " whole_grain_wheat_flour wine wood yam yeast yogurt zucchini \n", - "0 0 0 0 0 0 0 0 \n", - "1 0 0 0 0 0 0 0 \n", - "2 0 0 0 0 0 0 0 \n", - "3 0 0 0 0 0 0 0 \n", - "4 0 0 0 0 0 1 0 \n", - "\n", - "[5 rows x 380 columns]" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
almondangelicaaniseanise_seedappleapple_brandyapricotarmagnacartemisiaartichoke...whiskeywhite_breadwhite_winewhole_grain_wheat_flourwinewoodyamyeastyogurtzucchini
00000000000...0000000000
11000000000...0000000000
20000000000...0000000000
30000000000...0000000000
40000000000...0000000010
\n

5 rows × 380 columns

\n
" - }, - "metadata": {}, - "execution_count": 61 - } - ], - "source": [ - "X = data.iloc[:,2:]\n", - "X.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 62, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " cuisine\n", - "0 indian\n", - "1 indian\n", - "2 indian\n", - "3 indian\n", - "4 indian" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
cuisine
0indian
1indian
2indian
3indian
4indian
\n
" - }, - "metadata": {}, - "execution_count": 62 - } - ], - "source": [ - "y = data[['cuisine']]\n", - "y.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 63, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.model_selection import train_test_split\n", - "from sklearn.svm import SVC\n", - "from sklearn.model_selection import cross_val_score\n", - "from sklearn.metrics import accuracy_score,precision_score,confusion_matrix,classification_report" - ] - }, - { - "cell_type": "code", - "execution_count": 64, - "metadata": {}, - "outputs": [], - "source": [ - "X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3)" - ] - }, - { - "cell_type": "code", - "execution_count": 65, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "SVC(C=10, kernel='linear', probability=True, random_state=0)" - ] - }, - "metadata": {}, - "execution_count": 65 - } - ], - "source": [ - "model = SVC(kernel='linear', C=10, probability=True,random_state=0)\n", - "model.fit(X_train,y_train.values.ravel())\n" - ] - }, - { - "cell_type": "code", - "execution_count": 66, - "metadata": {}, - "outputs": [], - "source": [ - "y_pred = model.predict(X_test)" - ] - }, - { - "cell_type": "code", - "execution_count": 67, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " precision recall f1-score support\n\n chinese 0.72 0.70 0.71 236\n indian 0.91 0.88 0.89 243\n japanese 0.80 0.75 0.77 240\n korean 0.80 0.81 0.81 230\n thai 0.76 0.85 0.80 250\n\n accuracy 0.80 1199\n macro avg 0.80 0.80 0.80 1199\nweighted avg 0.80 0.80 0.80 1199\n\n" - ] - } - ], - "source": [ - "print(classification_report(y_test,y_pred))" - ] - }, - { - "cell_type": "code", - "execution_count": 68, - "metadata": {}, - "outputs": [], - "source": [ - "from skl2onnx import convert_sklearn\n", - "from skl2onnx.common.data_types import FloatTensorType\n", - "\n", - "initial_type = [('float_input', FloatTensorType([None, 380]))]\n", - "options = {id(model): {'nocl': True, 'zipmap': False}}\n", - "onx = convert_sklearn(model, initial_types=initial_type, options=options)\n", - "with open(\"./model.onnx\", \"wb\") as f:\n", - " f.write(onx.SerializeToString())\n", - "\n", - "\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/4-Classification/README.md b/translations/pt/4-Classification/README.md deleted file mode 100644 index 41dcf68ef..000000000 --- a/translations/pt/4-Classification/README.md +++ /dev/null @@ -1,41 +0,0 @@ - -# Introdução à classificação - -## Tema regional: Deliciosas culinárias asiáticas e indianas 🍜 - -Na Ásia e na Índia, as tradições culinárias são extremamente diversas e muito deliciosas! Vamos analisar dados sobre culinárias regionais para tentar entender os seus ingredientes. - -![Vendedor de comida tailandesa](../../../translated_images/pt-PT/thai-food.c47a7a7f9f05c218.webp) -> Foto por Lisheng Chang no Unsplash - -## O que irá aprender - -Nesta seção, irá aprofundar o seu estudo sobre Regressão e aprender sobre outros classificadores que pode usar para compreender melhor os dados. - -> Existem ferramentas úteis de baixo código que podem ajudá-lo a aprender a trabalhar com modelos de classificação. Experimente [Azure ML para esta tarefa](https://docs.microsoft.com/learn/modules/create-classification-model-azure-machine-learning-designer/?WT.mc_id=academic-77952-leestott) - -## Lições - -1. [Introdução à classificação](1-Introduction/README.md) -2. [Mais classificadores](2-Classifiers-1/README.md) -3. [Outros classificadores](3-Classifiers-2/README.md) -4. [ML aplicado: criar uma aplicação web](4-Applied/README.md) - -## Créditos - -"Introdução à classificação" foi escrito com ♥️ por [Cassie Breviu](https://www.twitter.com/cassiebreviu) e [Jen Looper](https://www.twitter.com/jenlooper) - -O conjunto de dados sobre deliciosas culinárias foi obtido de [Kaggle](https://www.kaggle.com/hoandan/asian-and-indian-cuisines). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/1-Visualize/README.md b/translations/pt/5-Clustering/1-Visualize/README.md deleted file mode 100644 index 6ecb21d2e..000000000 --- a/translations/pt/5-Clustering/1-Visualize/README.md +++ /dev/null @@ -1,347 +0,0 @@ - -# Introdução à Clustering - -Clustering é um tipo de [Aprendizagem Não Supervisionada](https://wikipedia.org/wiki/Unsupervised_learning) que parte do pressuposto de que um conjunto de dados não está rotulado ou que suas entradas não estão associadas a saídas predefinidas. Ele utiliza vários algoritmos para organizar dados não rotulados e fornecer agrupamentos com base nos padrões identificados nos dados. - -[![No One Like You by PSquare](https://img.youtube.com/vi/ty2advRiWJM/0.jpg)](https://youtu.be/ty2advRiWJM "No One Like You by PSquare") - -> 🎥 Clique na imagem acima para assistir a um vídeo. Enquanto estuda machine learning com clustering, aproveite algumas faixas de Dance Hall nigeriano - esta é uma música muito bem avaliada de 2014 por PSquare. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Introdução - -[Clustering](https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-30164-8_124) é muito útil para exploração de dados. Vamos ver se ele pode ajudar a descobrir tendências e padrões na forma como o público nigeriano consome música. - -✅ Reserve um momento para pensar sobre os usos do clustering. Na vida real, clustering acontece sempre que você tem uma pilha de roupa suja e precisa separar as roupas dos membros da sua família 🧦👕👖🩲. Em ciência de dados, clustering ocorre ao tentar analisar as preferências de um usuário ou determinar as características de qualquer conjunto de dados não rotulado. Clustering, de certa forma, ajuda a dar sentido ao caos, como uma gaveta de meias. - -[![Introdução ao ML](https://img.youtube.com/vi/esmzYhuFnds/0.jpg)](https://youtu.be/esmzYhuFnds "Introdução ao Clustering") - -> 🎥 Clique na imagem acima para assistir a um vídeo: John Guttag do MIT apresenta clustering. - -No ambiente profissional, clustering pode ser usado para determinar coisas como segmentação de mercado, identificando quais faixas etárias compram quais itens, por exemplo. Outro uso seria a detecção de anomalias, talvez para identificar fraudes em um conjunto de dados de transações com cartão de crédito. Ou você pode usar clustering para identificar tumores em um lote de exames médicos. - -✅ Pense por um momento sobre como você pode ter encontrado clustering 'na prática', em um ambiente bancário, de e-commerce ou empresarial. - -> 🎓 Curiosamente, a análise de clusters teve origem nos campos de Antropologia e Psicologia na década de 1930. Consegue imaginar como ela pode ter sido usada? - -Alternativamente, você poderia usá-lo para agrupar resultados de pesquisa - por links de compras, imagens ou avaliações, por exemplo. Clustering é útil quando você tem um grande conjunto de dados que deseja reduzir e sobre o qual deseja realizar uma análise mais detalhada, então a técnica pode ser usada para aprender sobre os dados antes de construir outros modelos. - -✅ Uma vez que seus dados estão organizados em clusters, você atribui a eles um Id de cluster, e essa técnica pode ser útil para preservar a privacidade de um conjunto de dados; você pode, em vez disso, referir-se a um ponto de dados pelo seu Id de cluster, em vez de por dados identificáveis mais reveladores. Consegue pensar em outros motivos pelos quais você preferiria usar um Id de cluster em vez de outros elementos do cluster para identificá-lo? - -Aprofunde seu entendimento sobre técnicas de clustering neste [módulo de aprendizado](https://docs.microsoft.com/learn/modules/train-evaluate-cluster-models?WT.mc_id=academic-77952-leestott). - -## Começando com clustering - -[Scikit-learn oferece uma ampla gama](https://scikit-learn.org/stable/modules/clustering.html) de métodos para realizar clustering. O tipo que você escolhe dependerá do seu caso de uso. De acordo com a documentação, cada método tem vários benefícios. Aqui está uma tabela simplificada dos métodos suportados pelo Scikit-learn e seus casos de uso apropriados: - -| Nome do método | Caso de uso | -| :---------------------------- | :-------------------------------------------------------------------- | -| K-Means | propósito geral, indutivo | -| Propagação de afinidade | muitos clusters desiguais, indutivo | -| Mean-shift | muitos clusters desiguais, indutivo | -| Clustering espectral | poucos clusters iguais, transdutivo | -| Clustering hierárquico Ward | muitos clusters restritos, transdutivo | -| Clustering aglomerativo | muitos clusters restritos, distâncias não euclidianas, transdutivo | -| DBSCAN | geometria não plana, clusters desiguais, transdutivo | -| OPTICS | geometria não plana, clusters desiguais com densidade variável, transdutivo | -| Misturas Gaussianas | geometria plana, indutivo | -| BIRCH | grande conjunto de dados com outliers, indutivo | - -> 🎓 Como criamos clusters tem muito a ver com como agrupamos os pontos de dados. Vamos explorar alguns vocabulários: -> -> 🎓 ['Transdutivo' vs. 'indutivo'](https://wikipedia.org/wiki/Transduction_(machine_learning)) -> -> Inferência transdutiva é derivada de casos de treinamento observados que mapeiam para casos de teste específicos. Inferência indutiva é derivada de casos de treinamento que mapeiam para regras gerais que só então são aplicadas aos casos de teste. -> -> Um exemplo: Imagine que você tem um conjunto de dados parcialmente rotulado. Algumas coisas são 'discos', outras 'CDs', e algumas estão em branco. Sua tarefa é fornecer rótulos para os itens em branco. Se você escolher uma abordagem indutiva, treinaria um modelo procurando por 'discos' e 'CDs', e aplicaria esses rótulos aos dados não rotulados. Essa abordagem terá dificuldade em classificar coisas que são, na verdade, 'cassetes'. Uma abordagem transdutiva, por outro lado, lida com esses dados desconhecidos de forma mais eficaz, agrupando itens semelhantes e aplicando um rótulo ao grupo. Nesse caso, os clusters podem refletir 'coisas musicais redondas' e 'coisas musicais quadradas'. -> -> 🎓 ['Geometria não plana' vs. 'plana'](https://datascience.stackexchange.com/questions/52260/terminology-flat-geometry-in-the-context-of-clustering) -> -> Derivado da terminologia matemática, geometria não plana vs. plana refere-se à medida de distâncias entre pontos por métodos geométricos 'planos' ([Euclidianos](https://wikipedia.org/wiki/Euclidean_geometry)) ou 'não planos' (não Euclidianos). -> ->'Plana' neste contexto refere-se à geometria Euclidiana (partes da qual são ensinadas como 'geometria plana'), e não plana refere-se à geometria não Euclidiana. O que a geometria tem a ver com machine learning? Bem, como dois campos que têm raízes na matemática, deve haver uma maneira comum de medir distâncias entre pontos em clusters, e isso pode ser feito de forma 'plana' ou 'não plana', dependendo da natureza dos dados. [Distâncias Euclidianas](https://wikipedia.org/wiki/Euclidean_distance) são medidas como o comprimento de um segmento de linha entre dois pontos. [Distâncias não Euclidianas](https://wikipedia.org/wiki/Non-Euclidean_geometry) são medidas ao longo de uma curva. Se seus dados, visualizados, parecem não existir em um plano, você pode precisar usar um algoritmo especializado para lidar com isso. -> -![Infográfico Geometria Plana vs Não Plana](../../../../5-Clustering/1-Visualize/images/flat-nonflat.png) -> Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) -> -> 🎓 ['Distâncias'](https://web.stanford.edu/class/cs345a/slides/12-clustering.pdf) -> -> Clusters são definidos por sua matriz de distâncias, ou seja, as distâncias entre pontos. Essa distância pode ser medida de algumas maneiras. Clusters Euclidianos são definidos pela média dos valores dos pontos e contêm um 'centroide' ou ponto central. As distâncias são, portanto, medidas pela distância até esse centroide. Distâncias não Euclidianas referem-se a 'clustroids', o ponto mais próximo de outros pontos. Clustroids, por sua vez, podem ser definidos de várias maneiras. -> -> 🎓 ['Restrito'](https://wikipedia.org/wiki/Constrained_clustering) -> -> [Clustering Restrito](https://web.cs.ucdavis.edu/~davidson/Publications/ICDMTutorial.pdf) introduz aprendizado 'semi-supervisionado' neste método não supervisionado. As relações entre pontos são marcadas como 'não pode vincular' ou 'deve vincular', então algumas regras são impostas ao conjunto de dados. -> -> Um exemplo: Se um algoritmo é liberado em um lote de dados não rotulados ou semi-rotulados, os clusters que ele produz podem ser de baixa qualidade. No exemplo acima, os clusters podem agrupar 'coisas musicais redondas', 'coisas musicais quadradas', 'coisas triangulares' e 'biscoitos'. Se forem dadas algumas restrições ou regras para seguir ("o item deve ser feito de plástico", "o item precisa ser capaz de produzir música"), isso pode ajudar a 'restringir' o algoritmo para fazer escolhas melhores. -> -> 🎓 'Densidade' -> -> Dados que são 'ruidosos' são considerados 'densos'. As distâncias entre pontos em cada um de seus clusters podem, ao serem examinadas, provar ser mais ou menos densas, ou 'aglomeradas', e assim esses dados precisam ser analisados com o método de clustering apropriado. [Este artigo](https://www.kdnuggets.com/2020/02/understanding-density-based-clustering.html) demonstra a diferença entre usar clustering K-Means vs. algoritmos HDBSCAN para explorar um conjunto de dados ruidoso com densidade de cluster desigual. - -## Algoritmos de clustering - -Existem mais de 100 algoritmos de clustering, e seu uso depende da natureza dos dados em questão. Vamos discutir alguns dos principais: - -- **Clustering hierárquico**. Se um objeto é classificado por sua proximidade a um objeto próximo, em vez de a um mais distante, os clusters são formados com base na distância de seus membros para outros objetos. O clustering aglomerativo do Scikit-learn é hierárquico. - - ![Infográfico Clustering Hierárquico](../../../../5-Clustering/1-Visualize/images/hierarchical.png) - > Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -- **Clustering por centroide**. Este algoritmo popular exige a escolha de 'k', ou o número de clusters a serem formados, após o qual o algoritmo determina o ponto central de um cluster e reúne dados ao redor desse ponto. [Clustering K-means](https://wikipedia.org/wiki/K-means_clustering) é uma versão popular de clustering por centroide. O centro é determinado pela média mais próxima, daí o nome. A distância quadrada do cluster é minimizada. - - ![Infográfico Clustering por Centroide](../../../../5-Clustering/1-Visualize/images/centroid.png) - > Infográfico por [Dasani Madipalli](https://twitter.com/dasani_decoded) - -- **Clustering baseado em distribuição**. Baseado em modelagem estatística, clustering baseado em distribuição centra-se em determinar a probabilidade de um ponto de dados pertencer a um cluster e atribuí-lo de acordo. Métodos de mistura Gaussianas pertencem a este tipo. - -- **Clustering baseado em densidade**. Pontos de dados são atribuídos a clusters com base em sua densidade, ou seu agrupamento ao redor uns dos outros. Pontos de dados distantes do grupo são considerados outliers ou ruídos. DBSCAN, Mean-shift e OPTICS pertencem a este tipo de clustering. - -- **Clustering baseado em grade**. Para conjuntos de dados multidimensionais, uma grade é criada e os dados são divididos entre as células da grade, criando assim clusters. - -## Exercício - agrupe seus dados - -Clustering como técnica é muito auxiliado por uma boa visualização, então vamos começar visualizando nossos dados musicais. Este exercício nos ajudará a decidir qual dos métodos de clustering devemos usar de forma mais eficaz para a natureza desses dados. - -1. Abra o arquivo [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/notebook.ipynb) nesta pasta. - -1. Importe o pacote `Seaborn` para uma boa visualização de dados. - - ```python - !pip install seaborn - ``` - -1. Adicione os dados das músicas do arquivo [_nigerian-songs.csv_](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/data/nigerian-songs.csv). Carregue um dataframe com alguns dados sobre as músicas. Prepare-se para explorar esses dados importando as bibliotecas e exibindo os dados: - - ```python - import matplotlib.pyplot as plt - import pandas as pd - - df = pd.read_csv("../data/nigerian-songs.csv") - df.head() - ``` - - Verifique as primeiras linhas de dados: - - | | nome | álbum | artista | género_principal_artista | data_lançamento | duração | popularidade | dançabilidade | acústica | energia | instrumentalidade | vivacidade | volume | discurso | tempo | assinatura_tempo | - | --- | ------------------------ | ---------------------------- | ------------------- | ------------------------- | ---------------- | ------- | ------------ | ------------- | -------- | ------- | ------------------ | ---------- | -------- | ---------- | ------- | ---------------- | - | 0 | Sparky | Mandy & The Jungle | Cruel Santino | r&b alternativo | 2019 | 144000 | 48 | 0.666 | 0.851 | 0.42 | 0.534 | 0.11 | -6.699 | 0.0829 | 133.015 | 5 | - | 1 | shuga rush | EVERYTHING YOU HEARD IS TRUE | Odunsi (The Engine) | afropop | 2020 | 89488 | 30 | 0.71 | 0.0822 | 0.683 | 0.000169 | 0.101 | -5.64 | 0.36 | 129.993 | 3 | -| 2 | LITT! | LITT! | AYLØ | indie r&b | 2018 | 207758 | 40 | 0.836 | 0.272 | 0.564 | 0.000537 | 0.11 | -7.127 | 0.0424 | 130.005 | 4 | -| 3 | Confident / Feeling Cool | Enjoy Your Life | Lady Donli | nigerian pop | 2019 | 175135 | 14 | 0.894 | 0.798 | 0.611 | 0.000187 | 0.0964 | -4.961 | 0.113 | 111.087 | 4 | -| 4 | wanted you | rare. | Odunsi (The Engine) | afropop | 2018 | 152049 | 25 | 0.702 | 0.116 | 0.833 | 0.91 | 0.348 | -6.044 | 0.0447 | 105.115 | 4 | - -1. Obtenha algumas informações sobre o dataframe, chamando `info()`: - - ```python - df.info() - ``` - - O resultado será semelhante a: - - ```output - - RangeIndex: 530 entries, 0 to 529 - Data columns (total 16 columns): - # Column Non-Null Count Dtype - --- ------ -------------- ----- - 0 name 530 non-null object - 1 album 530 non-null object - 2 artist 530 non-null object - 3 artist_top_genre 530 non-null object - 4 release_date 530 non-null int64 - 5 length 530 non-null int64 - 6 popularity 530 non-null int64 - 7 danceability 530 non-null float64 - 8 acousticness 530 non-null float64 - 9 energy 530 non-null float64 - 10 instrumentalness 530 non-null float64 - 11 liveness 530 non-null float64 - 12 loudness 530 non-null float64 - 13 speechiness 530 non-null float64 - 14 tempo 530 non-null float64 - 15 time_signature 530 non-null int64 - dtypes: float64(8), int64(4), object(4) - memory usage: 66.4+ KB - ``` - -1. Verifique novamente se há valores nulos, chamando `isnull()` e verificando se a soma é 0: - - ```python - df.isnull().sum() - ``` - - Tudo certo: - - ```output - name 0 - album 0 - artist 0 - artist_top_genre 0 - release_date 0 - length 0 - popularity 0 - danceability 0 - acousticness 0 - energy 0 - instrumentalness 0 - liveness 0 - loudness 0 - speechiness 0 - tempo 0 - time_signature 0 - dtype: int64 - ``` - -1. Descreva os dados: - - ```python - df.describe() - ``` - - | | release_date | length | popularity | danceability | acousticness | energy | instrumentalness | liveness | loudness | speechiness | tempo | time_signature | - | ----- | ------------ | ----------- | ---------- | ------------ | ------------ | -------- | ---------------- | -------- | --------- | ----------- | ---------- | -------------- | - | count | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | 530 | - | mean | 2015.390566 | 222298.1698 | 17.507547 | 0.741619 | 0.265412 | 0.760623 | 0.016305 | 0.147308 | -4.953011 | 0.130748 | 116.487864 | 3.986792 | - | std | 3.131688 | 39696.82226 | 18.992212 | 0.117522 | 0.208342 | 0.148533 | 0.090321 | 0.123588 | 2.464186 | 0.092939 | 23.518601 | 0.333701 | - | min | 1998 | 89488 | 0 | 0.255 | 0.000665 | 0.111 | 0 | 0.0283 | -19.362 | 0.0278 | 61.695 | 3 | - | 25% | 2014 | 199305 | 0 | 0.681 | 0.089525 | 0.669 | 0 | 0.07565 | -6.29875 | 0.0591 | 102.96125 | 4 | - | 50% | 2016 | 218509 | 13 | 0.761 | 0.2205 | 0.7845 | 0.000004 | 0.1035 | -4.5585 | 0.09795 | 112.7145 | 4 | - | 75% | 2017 | 242098.5 | 31 | 0.8295 | 0.403 | 0.87575 | 0.000234 | 0.164 | -3.331 | 0.177 | 125.03925 | 4 | - | max | 2020 | 511738 | 73 | 0.966 | 0.954 | 0.995 | 0.91 | 0.811 | 0.582 | 0.514 | 206.007 | 5 | - -> 🤔 Se estamos a trabalhar com clustering, um método não supervisionado que não requer dados rotulados, por que estamos a mostrar estes dados com rótulos? Na fase de exploração de dados, eles são úteis, mas não são necessários para os algoritmos de clustering funcionarem. Poderíamos simplesmente remover os cabeçalhos das colunas e referir-nos aos dados pelo número da coluna. - -Observe os valores gerais dos dados. Note que a popularidade pode ser '0', o que indica músicas que não têm classificação. Vamos remover esses valores em breve. - -1. Use um gráfico de barras para descobrir os géneros mais populares: - - ```python - import seaborn as sns - - top = df['artist_top_genre'].value_counts() - plt.figure(figsize=(10,7)) - sns.barplot(x=top[:5].index,y=top[:5].values) - plt.xticks(rotation=45) - plt.title('Top genres',color = 'blue') - ``` - - ![most popular](../../../../5-Clustering/1-Visualize/images/popular.png) - -✅ Se quiser ver mais valores principais, altere o top `[:5]` para um valor maior ou remova-o para ver todos. - -Note que, quando o género principal é descrito como 'Missing', isso significa que o Spotify não o classificou, então vamos eliminá-lo. - -1. Elimine os dados ausentes filtrando-os: - - ```python - df = df[df['artist_top_genre'] != 'Missing'] - top = df['artist_top_genre'].value_counts() - plt.figure(figsize=(10,7)) - sns.barplot(x=top.index,y=top.values) - plt.xticks(rotation=45) - plt.title('Top genres',color = 'blue') - ``` - - Agora verifique novamente os géneros: - - ![most popular](../../../../5-Clustering/1-Visualize/images/all-genres.png) - -1. De longe, os três géneros principais dominam este conjunto de dados. Vamos concentrar-nos em `afro dancehall`, `afropop` e `nigerian pop`, e adicionalmente filtrar o conjunto de dados para remover qualquer valor de popularidade igual a 0 (o que significa que não foi classificado com uma popularidade no conjunto de dados e pode ser considerado ruído para os nossos propósitos): - - ```python - df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')] - df = df[(df['popularity'] > 0)] - top = df['artist_top_genre'].value_counts() - plt.figure(figsize=(10,7)) - sns.barplot(x=top.index,y=top.values) - plt.xticks(rotation=45) - plt.title('Top genres',color = 'blue') - ``` - -1. Faça um teste rápido para ver se os dados têm alguma correlação particularmente forte: - - ```python - corrmat = df.corr(numeric_only=True) - f, ax = plt.subplots(figsize=(12, 9)) - sns.heatmap(corrmat, vmax=.8, square=True) - ``` - - ![correlations](../../../../5-Clustering/1-Visualize/images/correlation.png) - - A única correlação forte é entre `energy` e `loudness`, o que não é muito surpreendente, dado que música alta geralmente é bastante energética. Fora isso, as correlações são relativamente fracas. Será interessante ver o que um algoritmo de clustering pode fazer com estes dados. - - > 🎓 Note que correlação não implica causalidade! Temos prova de correlação, mas não prova de causalidade. Um [site divertido](https://tylervigen.com/spurious-correlations) tem alguns visuais que enfatizam este ponto. - -Há alguma convergência neste conjunto de dados em torno da popularidade percebida de uma música e sua capacidade de dança? Um FacetGrid mostra que há círculos concêntricos que se alinham, independentemente do género. Poderia ser que os gostos nigerianos convergem a um certo nível de capacidade de dança para este género? - -✅ Experimente diferentes pontos de dados (energia, loudness, speechiness) e mais ou diferentes géneros musicais. O que consegue descobrir? Veja a tabela `df.describe()` para observar a distribuição geral dos pontos de dados. - -### Exercício - distribuição de dados - -Estes três géneros são significativamente diferentes na perceção da sua capacidade de dança, com base na sua popularidade? - -1. Examine a distribuição de dados dos nossos três géneros principais para popularidade e capacidade de dança ao longo de um eixo x e y dado. - - ```python - sns.set_theme(style="ticks") - - g = sns.jointplot( - data=df, - x="popularity", y="danceability", hue="artist_top_genre", - kind="kde", - ) - ``` - - Pode descobrir círculos concêntricos em torno de um ponto geral de convergência, mostrando a distribuição dos pontos. - - > 🎓 Note que este exemplo usa um gráfico KDE (Kernel Density Estimate) que representa os dados usando uma curva de densidade de probabilidade contínua. Isso permite interpretar os dados ao trabalhar com múltiplas distribuições. - - Em geral, os três géneros alinham-se vagamente em termos de sua popularidade e capacidade de dança. Determinar clusters nestes dados vagamente alinhados será um desafio: - - ![distribution](../../../../5-Clustering/1-Visualize/images/distribution.png) - -1. Crie um gráfico de dispersão: - - ```python - sns.FacetGrid(df, hue="artist_top_genre", height=5) \ - .map(plt.scatter, "popularity", "danceability") \ - .add_legend() - ``` - - Um gráfico de dispersão dos mesmos eixos mostra um padrão semelhante de convergência. - - ![Facetgrid](../../../../5-Clustering/1-Visualize/images/facetgrid.png) - -Em geral, para clustering, pode usar gráficos de dispersão para mostrar clusters de dados, por isso dominar este tipo de visualização é muito útil. Na próxima lição, vamos pegar neste conjunto de dados filtrado e usar clustering k-means para descobrir grupos nestes dados que parecem sobrepor-se de formas interessantes. - ---- - -## 🚀Desafio - -Em preparação para a próxima lição, crie um gráfico sobre os vários algoritmos de clustering que pode descobrir e usar num ambiente de produção. Que tipos de problemas o clustering está a tentar resolver? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -Antes de aplicar algoritmos de clustering, como aprendemos, é uma boa ideia entender a natureza do seu conjunto de dados. Leia mais sobre este tópico [aqui](https://www.kdnuggets.com/2019/10/right-clustering-algorithm.html) - -[Este artigo útil](https://www.freecodecamp.org/news/8-clustering-algorithms-in-machine-learning-that-all-data-scientists-should-know/) explica os diferentes comportamentos de vários algoritmos de clustering, dados diferentes formatos de dados. - -## Tarefa - -[Pesquise outras visualizações para clustering](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/1-Visualize/assignment.md b/translations/pt/5-Clustering/1-Visualize/assignment.md deleted file mode 100644 index 0aa89e143..000000000 --- a/translations/pt/5-Clustering/1-Visualize/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Pesquisar outras visualizações para clustering - -## Instruções - -Nesta lição, trabalhou com algumas técnicas de visualização para compreender como representar os seus dados em preparação para o clustering. Os gráficos de dispersão, em particular, são úteis para identificar grupos de objetos. Pesquise diferentes formas e diferentes bibliotecas para criar gráficos de dispersão e documente o seu trabalho num notebook. Pode usar os dados desta lição, de outras lições ou dados que obtenha por conta própria (por favor, credite a sua fonte no notebook). Plote alguns dados utilizando gráficos de dispersão e explique o que descobriu. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | ------------------------------------------------------------- | ---------------------------------------------------------------------------------------- | ----------------------------------- | -| | Um notebook é apresentado com cinco gráficos de dispersão bem documentados | Um notebook é apresentado com menos de cinco gráficos de dispersão e está menos bem documentado | Um notebook incompleto é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/1-Visualize/notebook.ipynb b/translations/pt/5-Clustering/1-Visualize/notebook.ipynb deleted file mode 100644 index cef1df33b..000000000 --- a/translations/pt/5-Clustering/1-Visualize/notebook.ipynb +++ /dev/null @@ -1,50 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.3" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python383jvsc74a57bd0e134e05457d34029b6460cd73bbf1ed73f339b5b6d98c95be70b69eba114fe95", - "display_name": "Python 3.8.3 64-bit (conda)" - }, - "coopTranslator": { - "original_hash": "40e0707e96b3e1899a912776006264f9", - "translation_date": "2025-09-03T20:01:45+00:00", - "source_file": "5-Clustering/1-Visualize/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/1-Visualize/solution/Julia/README.md b/translations/pt/5-Clustering/1-Visualize/solution/Julia/README.md deleted file mode 100644 index 357a7e767..000000000 --- a/translations/pt/5-Clustering/1-Visualize/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb b/translations/pt/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb deleted file mode 100644 index f23b0b9d3..000000000 --- a/translations/pt/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb +++ /dev/null @@ -1,500 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "source": [ - "## **Música Nigeriana extraída do Spotify - uma análise**\n", - "\n", - "Clustering é um tipo de [Aprendizagem Não Supervisionada](https://wikipedia.org/wiki/Unsupervised_learning) que parte do pressuposto de que um conjunto de dados não está rotulado ou que suas entradas não estão associadas a saídas predefinidas. Ele utiliza vários algoritmos para analisar dados não rotulados e fornecer agrupamentos com base nos padrões identificados nos dados.\n", - "\n", - "[**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/27/)\n", - "\n", - "### **Introdução**\n", - "\n", - "[Clustering](https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-30164-8_124) é muito útil para explorar dados. Vamos ver se ele pode ajudar a descobrir tendências e padrões no modo como o público nigeriano consome música.\n", - "\n", - "> ✅ Reserve um minuto para pensar sobre os usos do clustering. Na vida real, clustering acontece sempre que você tem uma pilha de roupa suja e precisa separar as roupas dos membros da sua família 🧦👕👖🩲. Na ciência de dados, clustering ocorre ao tentar analisar as preferências de um usuário ou determinar as características de qualquer conjunto de dados não rotulado. Clustering, de certa forma, ajuda a dar sentido ao caos, como uma gaveta de meias.\n", - "\n", - "No ambiente profissional, clustering pode ser usado para determinar coisas como segmentação de mercado, identificando quais faixas etárias compram determinados itens, por exemplo. Outro uso seria a detecção de anomalias, talvez para identificar fraudes em um conjunto de dados de transações com cartão de crédito. Ou você pode usar clustering para identificar tumores em um lote de exames médicos.\n", - "\n", - "✅ Pense por um momento sobre como você pode ter encontrado clustering 'na prática', em um contexto bancário, de e-commerce ou empresarial.\n", - "\n", - "> 🎓 Curiosamente, a análise de clusters teve origem nos campos de Antropologia e Psicologia na década de 1930. Consegue imaginar como ela pode ter sido utilizada?\n", - "\n", - "Alternativamente, você poderia usá-lo para agrupar resultados de pesquisa - por links de compras, imagens ou avaliações, por exemplo. Clustering é útil quando você tem um grande conjunto de dados que deseja reduzir e sobre o qual deseja realizar uma análise mais detalhada, então a técnica pode ser usada para aprender sobre os dados antes de construir outros modelos.\n", - "\n", - "✅ Uma vez que seus dados estejam organizados em clusters, você atribui a eles um Id de cluster, e essa técnica pode ser útil para preservar a privacidade de um conjunto de dados; você pode, em vez disso, referir-se a um ponto de dados pelo seu Id de cluster, em vez de por dados identificáveis mais reveladores. Consegue pensar em outros motivos pelos quais você preferiria usar um Id de cluster em vez de outros elementos do cluster para identificá-lo?\n", - "\n", - "### Começando com clustering\n", - "\n", - "> 🎓 A forma como criamos clusters tem muito a ver com a maneira como agrupamos os pontos de dados. Vamos explorar alguns termos:\n", - ">\n", - "> 🎓 ['Transdutivo' vs. 'indutivo'](https://wikipedia.org/wiki/Transduction_(machine_learning))\n", - ">\n", - "> Inferência transdutiva é derivada de casos de treinamento observados que mapeiam para casos de teste específicos. Inferência indutiva é derivada de casos de treinamento que mapeiam para regras gerais que só então são aplicadas aos casos de teste.\n", - ">\n", - "> Um exemplo: Imagine que você tem um conjunto de dados parcialmente rotulado. Alguns itens são 'discos', outros 'CDs', e alguns estão em branco. Sua tarefa é fornecer rótulos para os itens em branco. Se você escolher uma abordagem indutiva, treinaria um modelo procurando por 'discos' e 'CDs' e aplicaria esses rótulos aos dados não rotulados. Essa abordagem teria dificuldade em classificar itens que na verdade são 'cassetes'. Uma abordagem transdutiva, por outro lado, lida com esses dados desconhecidos de forma mais eficaz, agrupando itens semelhantes e aplicando um rótulo ao grupo. Nesse caso, os clusters poderiam refletir 'coisas musicais redondas' e 'coisas musicais quadradas'.\n", - ">\n", - "> 🎓 ['Geometria plana' vs. 'não plana'](https://datascience.stackexchange.com/questions/52260/terminology-flat-geometry-in-the-context-of-clustering)\n", - ">\n", - "> Derivado da terminologia matemática, geometria plana vs. não plana refere-se à medida de distâncias entre pontos por métodos geométricos 'planos' ([Euclidianos](https://wikipedia.org/wiki/Euclidean_geometry)) ou 'não planos' (não Euclidianos).\n", - ">\n", - "> 'Plano' neste contexto refere-se à geometria Euclidiana (partes da qual são ensinadas como geometria 'plana'), e 'não plano' refere-se à geometria não Euclidiana. O que a geometria tem a ver com aprendizado de máquina? Bem, como dois campos que têm raízes na matemática, deve haver uma maneira comum de medir distâncias entre pontos em clusters, e isso pode ser feito de forma 'plana' ou 'não plana', dependendo da natureza dos dados. [Distâncias Euclidianas](https://wikipedia.org/wiki/Euclidean_distance) são medidas como o comprimento de um segmento de linha entre dois pontos. [Distâncias não Euclidianas](https://wikipedia.org/wiki/Non-Euclidean_geometry) são medidas ao longo de uma curva. Se seus dados, visualizados, parecem não existir em um plano, você pode precisar usar um algoritmo especializado para lidar com eles.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "> 🎓 ['Distâncias'](https://web.stanford.edu/class/cs345a/slides/12-clustering.pdf)\n", - ">\n", - "> Clusters são definidos por sua matriz de distâncias, ou seja, as distâncias entre pontos. Essa distância pode ser medida de algumas maneiras. Clusters Euclidianos são definidos pela média dos valores dos pontos e contêm um 'centroide' ou ponto central. As distâncias são medidas pela distância até esse centroide. Distâncias não Euclidianas referem-se a 'clustroids', o ponto mais próximo de outros pontos. Clustroids, por sua vez, podem ser definidos de várias maneiras.\n", - ">\n", - "> 🎓 ['Com restrições'](https://wikipedia.org/wiki/Constrained_clustering)\n", - ">\n", - "> [Clustering com restrições](https://web.cs.ucdavis.edu/~davidson/Publications/ICDMTutorial.pdf) introduz aprendizado 'semi-supervisionado' neste método não supervisionado. As relações entre pontos são marcadas como 'não pode vincular' ou 'deve vincular', então algumas regras são impostas ao conjunto de dados.\n", - ">\n", - "> Um exemplo: Se um algoritmo é liberado em um lote de dados não rotulados ou semi-rotulados, os clusters que ele produz podem ser de baixa qualidade. No exemplo acima, os clusters podem agrupar 'coisas musicais redondas', 'coisas musicais quadradas', 'coisas triangulares' e 'biscoitos'. Se forem dadas algumas restrições ou regras para seguir (\"o item deve ser feito de plástico\", \"o item precisa ser capaz de produzir música\"), isso pode ajudar a 'restringir' o algoritmo para fazer escolhas melhores.\n", - ">\n", - "> 🎓 'Densidade'\n", - ">\n", - "> Dados que são 'ruidosos' são considerados 'densos'. As distâncias entre pontos em cada um de seus clusters podem, ao serem examinadas, ser mais ou menos densas, ou 'aglomeradas', e assim esses dados precisam ser analisados com o método de clustering apropriado. [Este artigo](https://www.kdnuggets.com/2020/02/understanding-density-based-clustering.html) demonstra a diferença entre usar clustering K-Means e algoritmos HDBSCAN para explorar um conjunto de dados ruidoso com densidade de cluster desigual.\n", - "\n", - "Aprofunde seu entendimento sobre técnicas de clustering neste [módulo de aprendizado](https://docs.microsoft.com/learn/modules/train-evaluate-cluster-models?WT.mc_id=academic-77952-leestott)\n", - "\n", - "### **Algoritmos de clustering**\n", - "\n", - "Existem mais de 100 algoritmos de clustering, e seu uso depende da natureza dos dados em questão. Vamos discutir alguns dos principais:\n", - "\n", - "- **Clustering hierárquico**. Se um objeto é classificado pela sua proximidade a um objeto próximo, em vez de um mais distante, os clusters são formados com base na distância entre seus membros. O clustering hierárquico é caracterizado pela combinação repetida de dois clusters.\n", - "\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "- **Clustering por centroide**. Este algoritmo popular requer a escolha de 'k', ou o número de clusters a serem formados, após o qual o algoritmo determina o ponto central de um cluster e reúne dados ao redor desse ponto. [Clustering K-means](https://wikipedia.org/wiki/K-means_clustering) é uma versão popular de clustering por centroide que separa um conjunto de dados em K grupos predefinidos. O centro é determinado pela média mais próxima, daí o nome. A distância quadrada do cluster é minimizada.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Dasani Madipalli
\n", - "\n", - "\n", - "\n", - "- **Clustering baseado em distribuição**. Baseado em modelagem estatística, o clustering baseado em distribuição centra-se em determinar a probabilidade de um ponto de dados pertencer a um cluster e atribuí-lo de acordo. Métodos de mistura Gaussiana pertencem a este tipo.\n", - "\n", - "- **Clustering baseado em densidade**. Pontos de dados são atribuídos a clusters com base na sua densidade, ou no agrupamento ao redor uns dos outros. Pontos de dados distantes do grupo são considerados outliers ou ruído. DBSCAN, Mean-shift e OPTICS pertencem a este tipo de clustering.\n", - "\n", - "- **Clustering baseado em grade**. Para conjuntos de dados multidimensionais, uma grade é criada e os dados são divididos entre as células da grade, criando assim clusters.\n", - "\n", - "A melhor maneira de aprender sobre clustering é experimentá-lo você mesmo, e é isso que você fará neste exercício.\n", - "\n", - "Vamos precisar de alguns pacotes para concluir este módulo. Você pode instalá-los com: `install.packages(c('tidyverse', 'tidymodels', 'DataExplorer', 'summarytools', 'plotly', 'paletteer', 'corrplot', 'patchwork'))`\n", - "\n", - "Alternativamente, o script abaixo verifica se você tem os pacotes necessários para completar este módulo e os instala para você caso algum esteja faltando.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\r\n", - "\r\n", - "pacman::p_load('tidyverse', 'tidymodels', 'DataExplorer', 'summarytools', 'plotly', 'paletteer', 'corrplot', 'patchwork')\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "## Exercício - agrupe os seus dados\n", - "\n", - "O clustering como técnica é muito beneficiado por uma boa visualização, por isso vamos começar por visualizar os nossos dados de música. Este exercício vai ajudar-nos a decidir qual dos métodos de clustering devemos usar de forma mais eficaz, tendo em conta a natureza destes dados.\n", - "\n", - "Vamos começar rapidamente importando os dados.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Load the core tidyverse and make it available in your current R session\r\n", - "library(tidyverse)\r\n", - "\r\n", - "# Import the data into a tibble\r\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/5-Clustering/data/nigerian-songs.csv\")\r\n", - "\r\n", - "# View the first 5 rows of the data set\r\n", - "df %>% \r\n", - " slice_head(n = 5)\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Às vezes, podemos querer um pouco mais de informação sobre os nossos dados. Podemos observar os `dados` e a `sua estrutura` utilizando a função [*glimpse()*](https://pillar.r-lib.org/reference/glimpse.html):\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Glimpse into the data set\r\n", - "df %>% \r\n", - " glimpse()\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Bom trabalho!💪\n", - "\n", - "Podemos observar que `glimpse()` fornece o número total de linhas (observações) e colunas (variáveis), seguido pelas primeiras entradas de cada variável numa linha após o nome da variável. Além disso, o *tipo de dados* da variável é apresentado imediatamente após o nome da variável dentro de `< >`.\n", - "\n", - "`DataExplorer::introduce()` pode resumir esta informação de forma organizada:\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Describe basic information for our data\r\n", - "df %>% \r\n", - " introduce()\r\n", - "\r\n", - "# A visual display of the same\r\n", - "df %>% \r\n", - " plot_intro()\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Fantástico! Acabámos de descobrir que os nossos dados não têm valores em falta.\n", - "\n", - "Enquanto estamos nisto, podemos explorar estatísticas comuns de tendência central (por exemplo, [média](https://en.wikipedia.org/wiki/Arithmetic_mean) e [mediana](https://en.wikipedia.org/wiki/Median)) e medidas de dispersão (por exemplo, [desvio padrão](https://en.wikipedia.org/wiki/Standard_deviation)) utilizando `summarytools::descr()`\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Describe common statistics\r\n", - "df %>% \r\n", - " descr(stats = \"common\")\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vamos analisar os valores gerais dos dados. Note que a popularidade pode ser `0`, o que indica músicas que não têm classificação. Vamos removê-las em breve.\n", - "\n", - "> 🤔 Se estamos a trabalhar com clustering, um método não supervisionado que não requer dados rotulados, por que estamos a mostrar estes dados com rótulos? Na fase de exploração de dados, eles são úteis, mas não são necessários para que os algoritmos de clustering funcionem.\n", - "\n", - "### 1. Explorar géneros populares\n", - "\n", - "Vamos descobrir os géneros mais populares 🎶 contando o número de vezes que aparecem.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Popular genres\r\n", - "top_genres <- df %>% \r\n", - " count(artist_top_genre, sort = TRUE) %>% \r\n", - "# Encode to categorical and reorder the according to count\r\n", - " mutate(artist_top_genre = factor(artist_top_genre) %>% fct_inorder())\r\n", - "\r\n", - "# Print the top genres\r\n", - "top_genres\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Isso correu bem! Dizem que uma imagem vale mais do que mil linhas de um data frame (na verdade, ninguém diz isso 😅). Mas percebes a ideia, certo?\n", - "\n", - "Uma forma de visualizar dados categóricos (variáveis de texto ou fatores) é utilizando gráficos de barras. Vamos criar um gráfico de barras com os 10 géneros principais:\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Change the default gray theme\r\n", - "theme_set(theme_light())\r\n", - "\r\n", - "# Visualize popular genres\r\n", - "top_genres %>%\r\n", - " slice(1:10) %>% \r\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\r\n", - " fill = artist_top_genre)) +\r\n", - " geom_col(alpha = 0.8) +\r\n", - " paletteer::scale_fill_paletteer_d(\"rcartocolor::Vivid\") +\r\n", - " ggtitle(\"Top genres\") +\r\n", - " theme(plot.title = element_text(hjust = 0.5),\r\n", - " # Rotates the X markers (so we can read them)\r\n", - " axis.text.x = element_text(angle = 90))\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Agora é muito mais fácil identificar que temos géneros `missing` 🧐!\n", - "\n", - "> Uma boa visualização irá mostrar-lhe coisas que não esperava ou levantar novas questões sobre os dados - Hadley Wickham e Garrett Grolemund, [R For Data Science](https://r4ds.had.co.nz/introduction.html)\n", - "\n", - "Nota: quando o género principal é descrito como `Missing`, isso significa que o Spotify não o classificou, por isso vamos eliminá-lo.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Visualize popular genres\r\n", - "top_genres %>%\r\n", - " filter(artist_top_genre != \"Missing\") %>% \r\n", - " slice(1:10) %>% \r\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\r\n", - " fill = artist_top_genre)) +\r\n", - " geom_col(alpha = 0.8) +\r\n", - " paletteer::scale_fill_paletteer_d(\"rcartocolor::Vivid\") +\r\n", - " ggtitle(\"Top genres\") +\r\n", - " theme(plot.title = element_text(hjust = 0.5),\r\n", - " # Rotates the X markers (so we can read them)\r\n", - " axis.text.x = element_text(angle = 90))\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "A partir da pequena exploração de dados, aprendemos que os três géneros principais dominam este conjunto de dados. Vamos concentrar-nos em `afro dancehall`, `afropop` e `nigerian pop`, e adicionalmente filtrar o conjunto de dados para remover qualquer entrada com um valor de popularidade igual a 0 (o que significa que não foi classificada com uma popularidade no conjunto de dados e pode ser considerada ruído para os nossos propósitos):\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "nigerian_songs <- df %>% \r\n", - " # Concentrate on top 3 genres\r\n", - " filter(artist_top_genre %in% c(\"afro dancehall\", \"afropop\",\"nigerian pop\")) %>% \r\n", - " # Remove unclassified observations\r\n", - " filter(popularity != 0)\r\n", - "\r\n", - "\r\n", - "\r\n", - "# Visualize popular genres\r\n", - "nigerian_songs %>%\r\n", - " count(artist_top_genre) %>%\r\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\r\n", - " fill = artist_top_genre)) +\r\n", - " geom_col(alpha = 0.8) +\r\n", - " paletteer::scale_fill_paletteer_d(\"ggsci::category10_d3\") +\r\n", - " ggtitle(\"Top genres\") +\r\n", - " theme(plot.title = element_text(hjust = 0.5))\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vamos verificar se existe alguma relação linear aparente entre as variáveis numéricas no nosso conjunto de dados. Esta relação é quantificada matematicamente pelo [estatístico de correlação](https://en.wikipedia.org/wiki/Correlation).\n", - "\n", - "O estatístico de correlação é um valor entre -1 e 1 que indica a força de uma relação. Valores acima de 0 indicam uma correlação *positiva* (valores altos de uma variável tendem a coincidir com valores altos da outra), enquanto valores abaixo de 0 indicam uma correlação *negativa* (valores altos de uma variável tendem a coincidir com valores baixos da outra).\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Narrow down to numeric variables and fid correlation\r\n", - "corr_mat <- nigerian_songs %>% \r\n", - " select(where(is.numeric)) %>% \r\n", - " cor()\r\n", - "\r\n", - "# Visualize correlation matrix\r\n", - "corrplot(corr_mat, order = 'AOE', col = c('white', 'black'), bg = 'gold2') \r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Os dados não estão fortemente correlacionados, exceto entre `energy` e `loudness`, o que faz sentido, dado que música alta geralmente é bastante energética. `Popularity` tem uma correspondência com `release date`, o que também faz sentido, já que músicas mais recentes provavelmente são mais populares. Comprimento e energia parecem ter uma correlação também.\n", - "\n", - "Será interessante ver o que um algoritmo de clustering pode fazer com esses dados!\n", - "\n", - "> 🎓 Note que correlação não implica causalidade! Temos prova de correlação, mas nenhuma prova de causalidade. Um [site divertido](https://tylervigen.com/spurious-correlations) tem alguns visuais que enfatizam este ponto.\n", - "\n", - "### 2. Explorar a distribuição dos dados\n", - "\n", - "Vamos fazer perguntas mais subtis. Os géneros são significativamente diferentes na perceção da sua capacidade de dança, com base na sua popularidade? Vamos examinar a distribuição dos dados dos nossos três principais géneros em relação à popularidade e capacidade de dança ao longo de um eixo x e y usando [gráficos de densidade](https://www.khanacademy.org/math/ap-statistics/density-curves-normal-distribution-ap/density-curves/v/density-curves).\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# Perform 2D kernel density estimation\r\n", - "density_estimate_2d <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = popularity, y = danceability, color = artist_top_genre)) +\r\n", - " geom_density_2d(bins = 5, size = 1) +\r\n", - " paletteer::scale_color_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " xlim(-20, 80) +\r\n", - " ylim(0, 1.2)\r\n", - "\r\n", - "# Density plot based on the popularity\r\n", - "density_estimate_pop <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = popularity, fill = artist_top_genre, color = artist_top_genre)) +\r\n", - " geom_density(size = 1, alpha = 0.5) +\r\n", - " paletteer::scale_fill_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " paletteer::scale_color_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " theme(legend.position = \"none\")\r\n", - "\r\n", - "# Density plot based on the danceability\r\n", - "density_estimate_dance <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = danceability, fill = artist_top_genre, color = artist_top_genre)) +\r\n", - " geom_density(size = 1, alpha = 0.5) +\r\n", - " paletteer::scale_fill_paletteer_d(\"RSkittleBrewer::wildberry\") +\r\n", - " paletteer::scale_color_paletteer_d(\"RSkittleBrewer::wildberry\")\r\n", - "\r\n", - "\r\n", - "# Patch everything together\r\n", - "library(patchwork)\r\n", - "density_estimate_2d / (density_estimate_pop + density_estimate_dance)\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Observamos que há círculos concêntricos que se alinham, independentemente do género. Será que os gostos nigerianos convergem a um certo nível de dançabilidade para este género?\n", - "\n", - "De forma geral, os três géneros alinham-se em termos de popularidade e dançabilidade. Determinar agrupamentos nestes dados pouco alinhados será um desafio. Vamos ver se um gráfico de dispersão pode ajudar nisso.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [ - "# A scatter plot of popularity and danceability\r\n", - "scatter_plot <- nigerian_songs %>% \r\n", - " ggplot(mapping = aes(x = popularity, y = danceability, color = artist_top_genre, shape = artist_top_genre)) +\r\n", - " geom_point(size = 2, alpha = 0.8) +\r\n", - " paletteer::scale_color_paletteer_d(\"futurevisions::mars\")\r\n", - "\r\n", - "# Add a touch of interactivity\r\n", - "ggplotly(scatter_plot)\r\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Um gráfico de dispersão dos mesmos eixos mostra um padrão semelhante de convergência.\n", - "\n", - "De forma geral, para clustering, pode-se usar gráficos de dispersão para mostrar agrupamentos de dados, por isso dominar este tipo de visualização é muito útil. Na próxima lição, vamos pegar estes dados filtrados e usar o clustering k-means para descobrir grupos neste conjunto de dados que parecem se sobrepor de maneiras interessantes.\n", - "\n", - "## **🚀 Desafio**\n", - "\n", - "Em preparação para a próxima lição, crie um gráfico sobre os vários algoritmos de clustering que pode descobrir e usar num ambiente de produção. Que tipos de problemas o clustering está tentando resolver?\n", - "\n", - "## [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/28/)\n", - "\n", - "## **Revisão e Estudo Individual**\n", - "\n", - "Antes de aplicar algoritmos de clustering, como aprendemos, é uma boa ideia entender a natureza do seu conjunto de dados. Leia mais sobre este tópico [aqui](https://www.kdnuggets.com/2019/10/right-clustering-algorithm.html).\n", - "\n", - "Aprofunde o seu entendimento sobre técnicas de clustering:\n", - "\n", - "- [Treinar e Avaliar Modelos de Clustering usando Tidymodels e amigos](https://rpubs.com/eR_ic/clustering)\n", - "\n", - "- Bradley Boehmke & Brandon Greenwell, [*Hands-On Machine Learning with R*](https://bradleyboehmke.github.io/HOML/)*.*\n", - "\n", - "## **Tarefa**\n", - "\n", - "[Investigue outras visualizações para clustering](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/assignment.md)\n", - "\n", - "## AGRADECIMENTOS A:\n", - "\n", - "[Jen Looper](https://www.twitter.com/jenlooper) por criar a versão original em Python deste módulo ♥️\n", - "\n", - "[`Dasani Madipalli`](https://twitter.com/dasani_decoded) por criar as ilustrações incríveis que tornam os conceitos de machine learning mais interpretáveis e fáceis de entender.\n", - "\n", - "Boas aprendizagens,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Gold Microsoft Learn Student Ambassador.\n" - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos pela precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "anaconda-cloud": "", - "kernelspec": { - "display_name": "R", - "language": "R", - "name": "ir" - }, - "language_info": { - "codemirror_mode": "r", - "file_extension": ".r", - "mimetype": "text/x-r-source", - "name": "R", - "pygments_lexer": "r", - "version": "3.4.1" - }, - "coopTranslator": { - "original_hash": "99c36449cad3708a435f6798cfa39972", - "translation_date": "2025-09-03T20:06:44+00:00", - "source_file": "5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/1-Visualize/solution/notebook.ipynb b/translations/pt/5-Clustering/1-Visualize/solution/notebook.ipynb deleted file mode 100644 index b71d3b46e..000000000 --- a/translations/pt/5-Clustering/1-Visualize/solution/notebook.ipynb +++ /dev/null @@ -1,817 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Defaulting to user installation because normal site-packages is not writeable\n", - "Requirement already satisfied: seaborn in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (0.11.2)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (3.5.0)\n", - "Requirement already satisfied: numpy>=1.15 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (1.21.4)\n", - "Requirement already satisfied: pandas>=0.23 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (1.3.4)\n", - "Requirement already satisfied: scipy>=1.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from seaborn) (1.7.2)\n", - "Requirement already satisfied: fonttools>=4.22.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (4.28.1)\n", - "Requirement already satisfied: pyparsing>=2.2.1 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (2.4.7)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (1.3.2)\n", - "Requirement already satisfied: pillow>=6.2.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (8.4.0)\n", - "Requirement already satisfied: cycler>=0.10 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (0.11.0)\n", - "Requirement already satisfied: packaging>=20.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (21.2)\n", - "Requirement already satisfied: setuptools-scm>=4 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (6.3.2)\n", - "Requirement already satisfied: python-dateutil>=2.7 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from matplotlib>=2.2->seaborn) (2.8.2)\n", - "Requirement already satisfied: pytz>=2017.3 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from pandas>=0.23->seaborn) (2021.3)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from python-dateutil>=2.7->matplotlib>=2.2->seaborn) (1.16.0)\n", - "Requirement already satisfied: tomli>=1.0.0 in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from setuptools-scm>=4->matplotlib>=2.2->seaborn) (1.2.2)\n", - "Requirement already satisfied: setuptools in /Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages (from setuptools-scm>=4->matplotlib>=2.2->seaborn) (59.1.1)\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "!pip install seaborn" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import pandas as pd" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n", - "
" - ], - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ] - }, - "execution_count": 4, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df = pd.read_csv(\"../../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Obter informações sobre o dataframe\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "\n", - "RangeIndex: 530 entries, 0 to 529\n", - "Data columns (total 16 columns):\n", - " # Column Non-Null Count Dtype \n", - "--- ------ -------------- ----- \n", - " 0 name 530 non-null object \n", - " 1 album 530 non-null object \n", - " 2 artist 530 non-null object \n", - " 3 artist_top_genre 530 non-null object \n", - " 4 release_date 530 non-null int64 \n", - " 5 length 530 non-null int64 \n", - " 6 popularity 530 non-null int64 \n", - " 7 danceability 530 non-null float64\n", - " 8 acousticness 530 non-null float64\n", - " 9 energy 530 non-null float64\n", - " 10 instrumentalness 530 non-null float64\n", - " 11 liveness 530 non-null float64\n", - " 12 loudness 530 non-null float64\n", - " 13 speechiness 530 non-null float64\n", - " 14 tempo 530 non-null float64\n", - " 15 time_signature 530 non-null int64 \n", - "dtypes: float64(8), int64(4), object(4)\n", - "memory usage: 66.4+ KB\n" - ] - } - ], - "source": [ - "df.info()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "name 0\n", - "album 0\n", - "artist 0\n", - "artist_top_genre 0\n", - "release_date 0\n", - "length 0\n", - "popularity 0\n", - "danceability 0\n", - "acousticness 0\n", - "energy 0\n", - "instrumentalness 0\n", - "liveness 0\n", - "loudness 0\n", - "speechiness 0\n", - "tempo 0\n", - "time_signature 0\n", - "dtype: int64" - ] - }, - "execution_count": 6, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.isnull().sum()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Olhe para os valores gerais dos dados. Note que a popularidade pode ser '0' - e há muitas linhas com esse valor\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
release_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
count530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000530.000000
mean2015.390566222298.16981117.5075470.7416190.2654120.7606230.0163050.147308-4.9530110.130748116.4878643.986792
std3.13168839696.82225918.9922120.1175220.2083420.1485330.0903210.1235882.4641860.09293923.5186010.333701
min1998.00000089488.0000000.0000000.2550000.0006650.1110000.0000000.028300-19.3620000.02780061.6950003.000000
25%2014.000000199305.0000000.0000000.6810000.0895250.6690000.0000000.075650-6.2987500.059100102.9612504.000000
50%2016.000000218509.00000013.0000000.7610000.2205000.7845000.0000040.103500-4.5585000.097950112.7145004.000000
75%2017.000000242098.50000031.0000000.8295000.4030000.8757500.0002340.164000-3.3310000.177000125.0392504.000000
max2020.000000511738.00000073.0000000.9660000.9540000.9950000.9100000.8110000.5820000.514000206.0070005.000000
\n", - "
" - ], - "text/plain": [ - " release_date length popularity danceability acousticness \\\n", - "count 530.000000 530.000000 530.000000 530.000000 530.000000 \n", - "mean 2015.390566 222298.169811 17.507547 0.741619 0.265412 \n", - "std 3.131688 39696.822259 18.992212 0.117522 0.208342 \n", - "min 1998.000000 89488.000000 0.000000 0.255000 0.000665 \n", - "25% 2014.000000 199305.000000 0.000000 0.681000 0.089525 \n", - "50% 2016.000000 218509.000000 13.000000 0.761000 0.220500 \n", - "75% 2017.000000 242098.500000 31.000000 0.829500 0.403000 \n", - "max 2020.000000 511738.000000 73.000000 0.966000 0.954000 \n", - "\n", - " energy instrumentalness liveness loudness speechiness \\\n", - "count 530.000000 530.000000 530.000000 530.000000 530.000000 \n", - "mean 0.760623 0.016305 0.147308 -4.953011 0.130748 \n", - "std 0.148533 0.090321 0.123588 2.464186 0.092939 \n", - "min 0.111000 0.000000 0.028300 -19.362000 0.027800 \n", - "25% 0.669000 0.000000 0.075650 -6.298750 0.059100 \n", - "50% 0.784500 0.000004 0.103500 -4.558500 0.097950 \n", - "75% 0.875750 0.000234 0.164000 -3.331000 0.177000 \n", - "max 0.995000 0.910000 0.811000 0.582000 0.514000 \n", - "\n", - " tempo time_signature \n", - "count 530.000000 530.000000 \n", - "mean 116.487864 3.986792 \n", - "std 23.518601 0.333701 \n", - "min 61.695000 3.000000 \n", - "25% 102.961250 4.000000 \n", - "50% 112.714500 4.000000 \n", - "75% 125.039250 4.000000 \n", - "max 206.007000 5.000000 " - ] - }, - "execution_count": 7, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df.describe()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "execution_count": 8, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "import seaborn as sns\n", - "\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top[:5].index,y=top[:5].values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Remover géneros 'Missing', pois não estão classificados no Spotify\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAmkAAAHuCAYAAADELJsvAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAABZdklEQVR4nO3debytc9n48c/lHENmcsxzREqGjBkbRMgYGRJShqg0e2gQ9aSJRkoTqUilqJSkNOjXQElFnlQkKZ4iPWnC9fvj+q72sjucs89ea6/7nPN5v177tde613B/73vdw/WdIzORJElStyww6gRIkiTpPxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSRqaCP6v7++BCP7W9/zgUadPkrosHMxW0lSI4GbgeZl8ddRpmRMRTM/kvlGnQ9L8w5I0SVMugoUjeEcEv2t/74hg4fbajhH8NoITI/jfCG5+uFK3CNaK4JsR/CWCr0bw3gg+1vf6VhF8J4K7I/hxBDv2vXZlBKdGcFX7/FciWK69tmYEGcEREfwG+Fpb/twIbojgrggui2CNtjwiOCOCOyK4J4KfRPC44exBSfMDgzRJo3ASsBWwMbARsAXw6r7XVwSWA1YBDgXOjmC9h/iuTwDfBx4JnAwc0nshglWALwJvAJYFXg58JoIZfZ8/CDgcWB5YqL2n3w7AY4CdI9gTOBHYB5gBfAs4v73vacD2wKOBpYD9gT/OYj9I0kMySJM0CgcDp2RyRyZ3Aq+nL7hqXpPJPzL5BhVo7T/+SyJYHdgceG0m/8zk28AlfW95NnBpJpdm8kAmlwNXA7v2vecjmfxPJn8DLqQCx34nZ/LX9vrRwJsyuaFVff43sHErTfsXsASwPhDtPbdPfNdIUjFIkzQKKwO39D2/pS3ruSuTvz7M6/3f86dM7u1bdmvf4zWA/VpV590R3A1sC6zU957f9z2+F1h83DrGf987+77rT0AAq2TyNeA9wHuBOyI4O4IlZ5JmSZotBmmSRuF3VMDTs3pb1rNMBIs9zOs9twPLRrBo37LV+h7fCpyXydJ9f4tlctoE0trfu+pW4Khx3/eITL4DkMm7MnkCsAFV7fmKCaxHkh7EIE3SKJwPvDqCGa2h/mthrLF/8/oIFopgO2B34FPjvySTW6jqy5Pbe7cGntH3lo8Bz4hg5wimRbBI65iw6hym+33Af0XwWIAIlopgv/Z48wi2jGBB4K/A34EH5nA9ksT0USdA0nzpDcCSwHXt+afasp7fA3dRpWf3Akdn8vOH+K6DgXOoRvrfBz4JTAPI5NbW2P8tVGB4f3vPMXOS6Ew+G8HiwAWtHdqfgctb+pcEzgDWpgK0y4C3zsl6JAkcJ01Sx7QhMj6WOWelXRF8Evh5Jq8baMIkaYpZ3SlprtaqGR8VwQIR7ALsCXxuxMmSpEmzulPS3G5F4CJqnLTfAsdk8qPRJkmSJs/qTkmSpA6yulOSJKmDOlHdudxyy+Waa6456mRIkiTN0jXXXPO/mTlj1u+cnE4EaWuuuSZXX331qJMhSZI0SxFxy6zfNXlWd0qSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSB00fdQLGu/Osjw19HTOOefbQ1yFJkjQZlqRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkddAsg7SIWCQivh8RP46In0XE69vytSLiexFxU0R8MiIWassXbs9vaq+vOeRtkCRJmufMTknaP4AnZ+ZGwMbALhGxFfBm4IzMXAe4Cziivf8I4K62/Iz2PkmSJE3ALIO0LP/Xni7Y/hJ4MvDptvxcYK/2eM/2nPb6UyIiBpVgSZKk+cFstUmLiGkRcS1wB3A58Evg7sy8r73lt8Aq7fEqwK0A7fU/A4+cyXceGRFXR8TVd95556Q2QpIkaV4zW0FaZt6fmRsDqwJbAOtPdsWZeXZmbpaZm82YMWOyXydJkjRPmVDvzsy8G/g6sDWwdERMby+tCtzWHt8GrAbQXl8K+OMgEitJkjS/mJ3enTMiYun2+BHATsANVLD2zPa2Q4GL2+NL2nPa61/LzBxgmiVJkuZ502f9FlYCzo2IaVRQd2FmfiEirgcuiIg3AD8CPtTe/yHgvIi4CfgTcMAQ0i1JkjRPm2WQlpnXAZvMZPmvqPZp45f/HdhvIKmTJEmaTznjgCRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSB80ySIuI1SLi6xFxfUT8LCJe3JafHBG3RcS17W/Xvs/8V0TcFBE3RsTOw9wASZKkedH02XjPfcDLMvOHEbEEcE1EXN5eOyMz39b/5ojYADgAeCywMvDViHh0Zt4/yIRLkiTNy2ZZkpaZt2fmD9vjvwA3AKs8zEf2BC7IzH9k5q+Bm4AtBpFYSZKk+cWE2qRFxJrAJsD32qLjIuK6iPhwRCzTlq0C3Nr3sd8yk6AuIo6MiKsj4uo777xz4imXJEmah812kBYRiwOfAY7PzHuAs4BHARsDtwNvn8iKM/PszNwsMzebMWPGRD4qSZI0z5utIC0iFqQCtI9n5kUAmfmHzLw/Mx8APsBYleZtwGp9H1+1LZMkSdJsmp3enQF8CLghM0/vW75S39v2Bn7aHl8CHBARC0fEWsC6wPcHl2RJkqR53+z07twGOAT4SURc25adCBwYERsDCdwMHAWQmT+LiAuB66meocfas1OSJGliZhmkZea3gZjJS5c+zGfeCLxxEumSJEmarznjgCRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR1kEGaJElSBxmkSZIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR10CyDtIhYLSK+HhHXR8TPIuLFbfmyEXF5RPyi/V+mLY+IeFdE3BQR10XEpsPeCEmSpHnN7JSk3Qe8LDM3ALYCjo2IDYATgCsyc13givYc4OnAuu3vSOCsgadakiRpHjfLIC0zb8/MH7bHfwFuAFYB9gTObW87F9irPd4T+GiW7wJLR8RKg064JEnSvGxCbdIiYk1gE+B7wAqZeXt76ffACu3xKsCtfR/7bVs2/ruOjIirI+LqO++8c6LpliRJmqfNdpAWEYsDnwGOz8x7+l/LzARyIivOzLMzc7PM3GzGjBkT+agkSdI8b7aCtIhYkArQPp6ZF7XFf+hVY7b/d7TltwGr9X181bZMkiRJs2l2encG8CHghsw8ve+lS4BD2+NDgYv7lj+n9fLcCvhzX7WoJEmSZsP02XjPNsAhwE8i4tq27ETgNODCiDgCuAXYv712KbArcBNwL3D4IBMsSZI0P5hlkJaZ3wbiIV5+ykzen8Cxk0yXJEnSfM0ZByRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOsggTZIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpg2YZpEXEhyPijoj4ad+ykyPitoi4tv3t2vfaf0XETRFxY0TsPKyES5IkzctmpyTtHGCXmSw/IzM3bn+XAkTEBsABwGPbZ86MiGmDSqwkSdL8YpZBWmZ+E/jTbH7fnsAFmfmPzPw1cBOwxSTSJ0mSNF+aTJu04yLiulYdukxbtgpwa997ftuW/YeIODIiro6Iq++8885JJEOSJGneM6dB2lnAo4CNgduBt0/0CzLz7MzcLDM3mzFjxhwmQ5Ikad40R0FaZv4hM+/PzAeADzBWpXkbsFrfW1dtyyRJkjQBcxSkRcRKfU/3Bno9Py8BDoiIhSNiLWBd4PuTS6IkSdL8Z/qs3hAR5wM7AstFxG+B1wE7RsTGQAI3A0cBZObPIuJC4HrgPuDYzLx/KCmXJEmah80ySMvMA2ey+EMP8/43Am+cTKIkSZLmd844IEmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdNMsgLSI+HBF3RMRP+5YtGxGXR8Qv2v9l2vKIiHdFxE0RcV1EbDrMxEuSJM2rZqck7Rxgl3HLTgCuyMx1gSvac4CnA+u2vyOBswaTTEmSpPnLLIO0zPwm8Kdxi/cEzm2PzwX26lv+0SzfBZaOiJUGlFZJkqT5xpy2SVshM29vj38PrNAerwLc2ve+37Zl/yEijoyIqyPi6jvvvHMOkyFJkjRvmnTHgcxMIOfgc2dn5maZudmMGTMmmwxJkqR5ypwGaX/oVWO2/3e05bcBq/W9b9W2TJIkSRMwp0HaJcCh7fGhwMV9y5/TenluBfy5r1pUkiRJs2n6rN4QEecDOwLLRcRvgdcBpwEXRsQRwC3A/u3tlwK7AjcB9wKHDyHNkiRJ87xZBmmZeeBDvPSUmbw3gWMnmyhJkqT5nTMOSJIkdZBBmiRJUgcZpEmSJHWQQZokSVIHGaRJkiR10Cx7d85Pfn/m64a+jhVf8Pqhr0OSJM39LEmTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA6aPpkPR8TNwF+A+4H7MnOziFgW+CSwJnAzsH9m3jW5ZEqSJM1fBlGS9qTM3DgzN2vPTwCuyMx1gSvac0mSJE3AMKo79wTObY/PBfYawjokSZLmaZMN0hL4SkRcExFHtmUrZObt7fHvgRVm9sGIODIiro6Iq++8885JJkOSJGneMqk2acC2mXlbRCwPXB4RP+9/MTMzInJmH8zMs4GzATbbbLOZvkeSJGl+NamStMy8rf2/A/gssAXwh4hYCaD9v2OyiZQkSZrfzHGQFhGLRcQSvcfA04CfApcAh7a3HQpcPNlESpIkzW8mU925AvDZiOh9zycy88sR8QPgwog4ArgF2H/yyZQkSZq/zHGQlpm/AjaayfI/Ak+ZTKIkSZLmd844IEmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQQZpkiRJHWSQJkmS1EEGaZIkSR1kkCZJktRBBmmSJEkdZJAmSZLUQdNHnQCV687aY+jrePwxlwx9HZIkaTAsSZMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6iCDNEmSpA4ySJMkSeoggzRJkqQOMkiTJEnqIIM0SZKkDjJIkyRJ6qDpo06ARu+yD+069HXsfMSlQ1+HJEnzEoM0jdR55+w89HUccthlQ1+HJEmDZnWnJElSBxmkSZIkdZDVnZpvvf384Ve1vuxAq1olSXPGIE0agcM/u8vQ1/GRvb880+W7fu41Q1/3pXudOvR1SNK8bmjVnRGxS0TcGBE3RcQJw1qPJEnSvGgoQVpETAPeCzwd2AA4MCI2GMa6JEmS5kXDqu7cArgpM38FEBEXAHsC1w9pfZLmArtddObQ1/HFfV4w0+W7f/rjQ1/3F5558EyX7/HpLwx93Zc8c/eZLt/nM98d+rov2nermS5/0WdvHfq637X3ajNdfv5n7hz6ug/cd8ZMl1/10eGve5vnzHzdN7/j90Nf95rHrzjT5X8447qhr3uFlzx+psvvePdXh77u5V/41KGvY7zIzMF/acQzgV0y83nt+SHAlpl5XN97jgSObE/XA26cxCqXA/53Ep+fDNftul2363bdrtt1z1/rXiMzZx4pD9DIOg5k5tnA2YP4roi4OjM3G8R3uW7X7bpdt+t23a7bdXfBsDoO3Ab0l0Gv2pZJkiRpNgwrSPsBsG5ErBURCwEHAJcMaV2SJEnznKFUd2bmfRFxHHAZMA34cGb+bBjragZSbeq6Xbfrdt2u23W7btfdFUPpOCBJkqTJce5OSZKkDjJIkyRJ6iCDtJmIiLUjYuFRp0OSJM2/DNLGiYhlgJcDJ83rgVpExKjT0AUz2w+T3TcRMeXnlr9nt4ziGJhbeex2X//x3EZt0GyIiKUiYpX2eJ2IWHRCn7fjwJiIWDMzb46IpwB7AHcAb8vMfwxwHZEd2Om9dETENsD6wM3AtzLzn1O17vZ4WmbeP+x1PkxaFsjMB9rjVYH7M/P2SX7nv7cpItYD7s3Moc2P0ztu2+ODqd/z+8CPM/M3w1rvIIw7FnrH5L9/kzn5nlGLiMcBv83Mu+dkWya57t4+3A5YjLrGf2mq1j9Z7fh9NHAtcG1m/rotf9DvO4rfu2/fLgzcN8rr1ihFxHOAv2TmZ0ew7ik9nyYrIqYD2wOPBdYB1gSelZl/n93vMKfXRMTSwNsi4qTMvAK4CFgZePmclKj1coYRsWFEbNOLpNtJPvJcY0vHk4DzqIPnHcCLImKdYa533E35MOBpo8qVRcQTqBOIiHgp8Hnggog4u+89E/qtImJ94IT2+Bhq/34hIl7dbpwDFREzgFdGxEsj4lDgpcC9wPOA50fEJoNe5yC14/AZbZ+fGxGPz8wHZrXfI2LbiNi1BUQjP6/6zvfHAKcA74qIpdq2TNl1tu2H3YEzqevXmyLiJVO1/slo58sxwI+p69GT2/L+a8a67ca34BSnrReg7QZcALw3Io4d9jrb/8dGxNYRsdyISui3jIjP9y16AnBPfxqHuO6DIuKoiHghwFSfT5OVmfcBvwD2AZ4FnDORAA0M0vr9FXgX8NiIeHlmfgO4kDkI1PpO6Ke27zgVODUiXtaVHH8r4TkaOD4z/ws4FFgX2GmY6+272B4LvBi4cSpK7x7CtsApLWf4RGBX6mR6dC9Qm4Pfam1gzYh4O7BX+97DgH9SAenyg0n6v/0FuII6Tg8FnpeZbwJeQ41RuDV0tzopIh4LvB74CnAT8JmI2LJXovYQn9kS+Ci1X49rwf5IA7W27r2AjwC/A2ZQgdoyU3ljaaXBLwf2BP5GHXdHRMRrpmL9cyLKMsDjgN2BxYH/Ac5p+22h9r7jgfdR1+lDh3AuzSxtK0bE6u333ZE6Vl9DZYQOjYhFhrXuts49gXOBw4EP0zKVUykzv0dd0y5uixYDHtFL47DW24L244GFgadHxDfbOmeZiRu1/vS1WpSPAp+m4ovt+t4368xGZs7Xf7Qq3/Z4IWCbtjNf3pbtALwTeCOw8AS+d1NqMN/12vOnU7nDvUa9ve3v+cDVwHuBxdprOwI/ApYZchqWB74LrEdlFPalAsbNRrA/jgb+X/vNF+87Dq4D9puD75sO7AKc1fZlr0nBBsC3gKcOYRsWpqrnvwt8CJjWlu8MfA1YdJTH3MOkexPgc8CpfcuOpKreV3qIzywNHAVs354fBLwfOHTE27IQ8BngiX2/9+nAB4Gl2rIYchpWpCaMXgfYgiqRWrIdG/8HnDzq37wvrf+xL4BXA98GLutbdhwVmBwEXNnOry+1xycByw8xjesAVwGPbc/3oDJdu7Vrxhpt+doDXOfjgEPa41Xbti4GHAz8EFh22MdR/2/Uu5a059+mgo3XAvu3ffHYdqytPMhjov3OFwDb9C37HDUw/siP3wlsx07tWrAqsBTwJuA0qknKrlRc8LC/53xdkjauGH0pgMy8irq4bt1XovYF6iK8+Gx+70JUcPckYJW2+NtUEfHmA92I2dQX2S8HTM/MD1CBZ1DTdgH8niqZGWguJSJmRMRW7fEu1M3kcuAM4BzqhN+YVr0xTFE9d/+dA8/M9wEfoE6iJ0TEElkle18B/jWb37lhb/9mFW9/FfgUNV/tqyNikcy8nrpprjuAbdglIl7fHk/LajP5ZerieT9wYnvrQu35tMmuc0juoC7Gm0TEqm1bzga+Tt2MHqSVKnwceAmwYVv8ZeqG/ZSIOGJKUj1z04BlGPt9f0FNj7chcHJELNa71gxaK4laHvgksHpm3kRlhC7JzHuA+6jqzyuHsf6JGnfdfUlEvKZVYf4a+AdVAhkRcQAVkN8OJPBs4AXUvn4nlQl5UUSsNOj0tYf7Ar8C7oiInan5qM8FXgXslpm3RMTTWhqWGMB6l6Wa2fTaQN8BXE+VJh0LPDMz/wRsFxFLTnZ9s0hLZLk/InaPave6LbAScDKVET2Kqtp/HXWdmcz6plOBCxGxOXWP+BewQt/bTqBKMDut79h+EfAGqnbmfcAawFuo7TqVysD9cpbXhVFHnV34A14EXEwVJx/Qlj2Ruui9tj1/xOxEz1RbiaBukKdQpWmbtNf2oUpsFmWKckPj0rgrVXp2MfAJqsj62VTAdAXwDWD3Iax3ZSrQ/XzbH0tRua/DaLlQKsd8DrDAELd/b6pk6YlUoNr/2qFUcPVm6oL4S1op6Cy+8+nAz4Anz+S17akA8ItUW5ufAetOchueRpXy7dm/DcDefen5ZnvPl4HHT/Vx9jBp750jGwNbtovWI6gSqNOoIH1rKrjdcNxnN6EC582pavKfA5u315Ztx/HjRrAt69JK/ahc82XArn2//wep0ocnTEGaXgV8FliCuoleQd1QbwO27k93F/7a7/gtYP32fEkqg3Fu+61/QAVlm/S9fj5jJcVfAN4GLDfgdPVK1BcEfgPcDazVln2Kuk5Op66n1wNPH9B6l2vb84J27q5G1b5c1zt+qIz/z3r7bAp+oxdRNQLr9S27FPhc3/MlBrCezYFXtt/+e23ZwcCdwBbt+eHUNbqTNQPjtucpVGZzOlXo85123PSO5fWpDNWsv2vUGzPqP6q66xtUScr57YJ2bHtt+3bQLDub3/UMKtD7AlWS9rh2IbqVasvwTeAZI9rOx1DF5U+kgsTPARe0155JBRMv6nv/QC/mVNXE3cAbZvLaYVRvrg2GuP0rUwHq5uOW7wq8uj0+isrNv6l3UZ7Fd67SLphP6d9n7SL70fZ4h/a7n88kA7T2fScCr5jJ8h+03zGoAO7NwKqjONZmkf7d2kW/dyM+ngrULgSuoarfe0FOb3+u0I7PK/u+5/i273vVi9OncBt66doZuIGqZn4RVWq2N1Vd+17gt1Szhw8Aew4pLWsDS7bHi7b1rtue7wc8F3jaqH/3/v3WHi8EfKxdl9YCjmCss8AMqhrt1VQv5XX7PvND4K1U6fu3gVUGmT4qEPwkVZKzOFWSdgPVdrf3vgupYO3y3rE6yfXO6NvGD1JtCY9vz59CNWH4YDv3b2AIGemHSNfj2j5errf/+177OXBhezzpjDUVEH+Mqm06rm/5UVQNxIeoe8RjR30cz+rYbs/Xp4Ls51LB2lJtG35Ga6oxu39DmWB9btEaff6DurA+h7GSpQ9FxAOZeVZEfD9nozdGVE/BN1O96rYHDqF+nPOoE/4pwFmZ+fkYzbAT/6ByfT9s27NXRHyjNeB/P9XWZ+tWxfDJbEfanJpJB4kvUCfbqyPi7sx8W3vfNlSJyrOzqgSHZWHqInzTuP3/QHuNzHx/RNxJ7aObZ+M776EC/L9GxHLAn6hqmfOAx7Qi/O9SDY2vz8w75zTxffvzLmDTiHgVddFajLqRfIS62G9O3Ty+mpl/ndP1DUNELE41an9hZn47ItaiSk9/T7VFO4dqO3UFPKhR8l1UKeyxEfGyzHx7Zr6jNbr9WFQP1numajsyMyNiM+pcfwYVRB5M5ZrPB55KBU/voEpHtgT+e5BpiIhp1HH7QeD6iPgzFdTcR+3jozLzU33vH3mHpd76I2KjzPxxRNxLNbl4BBUMrEyVSn2tnU9PBXbOzLsiYnpm/jMi9qVKJjagMtO3DTCJ0zPznqjesEtSbc7WjoiVgc9FxJKZeUpm7h811tX0rOrkOdaqVg+jeoAvRF0v/gqsERFPyswrIuL3VEnyMsCRmfmtYfyeM/nOu6iMBhGxcLahqFqTkPUjYg2ohvyTXV9m/isiTgd+AqwaNRTLBe2a/APgf6lhT343xxs4JOOq7x8D3J2ZP2/P16ba3P45In5D3SNumdAKRh2BTuUfDxHxUxHvl2m5MqrK4CfA0hP47mdT3Wt7z59JlW6sTF2oX0RVtU1JlQxjuf1pVC5laermt23fe44Bjm6PF6Sq/FYY1Lrb42dRxdTbtudPbPvlGKrq7m0T2c+TTMvJVEBwAxUQXNx+63uoXNzJzEYJYt++DaptwUVUCdwXqRLK71HF9BcA75md75zANizU9t33qRKFi6kq9Cup3O236EgJ2vjtpkomvgCsM+74eEt7vGpL/4ntuH0SFbwdAyxCNRd4N/Divs+vOUXbsjZwSnu8GNXG5Jd9r29Ptft6bS9NVCna54GNBr1PGeuM8AiqBO8CKkB8PnVj3XZQ6xzwflyJaoz/XCrIfFL73VelArUvU9W1q1LVamvx4Mbry7f/A63yoqrMfw48pj0/hKrqfEZ7vklL9xsHuM7lGOtYtmK7lmzanv8XVfKyA7DgFPwu/deYRdu5uhBV2r1H32sHU22JB5YmWq90WokvVbv1bqqjxqFUU5jOVNM/zHYcR2Xa3w1c3pa9E7iEak93/Zxcm0e+YVO4A1fte/xCKjf2cirHtCBVfL1tuym8D5gxi+/rXSwXaP83pdp5bdb3nvOAHdrjldqPuNoUbvOeVHufi6i2PvtQVU3HtZPiZwyht2Hf+o+jcobPBv4OHNi3r75DBRpDq+Icl5Zem5w9aUOttAvgZlSQ81pmo43AuItZ7zuf2o6ZRalSlc2Bs9tF5lED3IaXAC9oj99KNV7uvXYEVZIy2z2Qp/A47D/3Tmm/e69H8f5t/y/anq9MZZqeRA3JcRRVDfoWapDT3ak2Xi9r7x9aG8Zx2zAd2Kq3LVTPv8uo6sXeNWBHqmqz185yKQbYXqrvmrMbFZSPD1iPoNqlPUC72Xftj7rW7kD1Wjy2b/kLqJvYv6tn2++8B2MB6cHt3H3Y9sGTSNupVHOXR7fnB1CZ9d3b802pJhOPYvIZrwWpzMi72jVoaapU9C19638FdQ/ZidYrfwp+nxdRGYsrqYKGbdr5987291MGWNDQft9fUBnkzzNWzfv8di79io5WcY7bjp2pQpAlqNLhy/teezlVkj5H7YNHvnFTsPOiXSx/TQVgW1E3iSOpUo4LqBzdi6jSlZ/M7s6kbs6voYK+9anqjVdRQcnm1E3m8X3vnzaMbXyItK1P5Ux3o3Ijv6aC0C2pgORshthWBdiIsbr4Y6m2JL9irORuUWazrd8A0rI/Yx0WNqVubou0155GlaYtPcHvPJgqEVySCswuogW8bX1fZYDDA1Bt575EK+mkep6dTpVSPrul5dFTdXzNIq1rAM9tj3cBbqQyMIdTpVBvbMteSZVe7NLeu0D7m0YFvUe15QtTN6v3tOf7MLWdBPo7aPwI+HR7vC7VBvUdjAVqy7T/A7uhjlv/U6mG5Bu1/fgHalaU/vevOOpjYCbbsB9jJYwLUiXql1FV31ABy7btWP4fqnRwK6qk+CNUgHAjQ7hh0xfoUxmdOxgLlA5qv/le7fmkG8n3ras3RuCbqeGIlqSCtrcx1kbtxGEe6zw407lPu46sw1gm6ZlUxukAqn31OgNc9yHUtbhXevkEqqT9+PZ8YWZRWDLC43l8LcFWbV8dT5U+LtSWbzPpdY16Y6dwpz6Rqub6DK0nXjv43tkuAr2c/FKz+X3btIvGkVQwdAJwIBXsXUDlCvaY2Q86Bdv6uHYBfFffsp2pruwDO8nGrXNm4x4tRw3oemV7fjiVy99nCvfF3lTw3QsEprcLwReoG/8PmWAOhwp0v9M7Aalc8KsYG3rjhkHeTKipRD5G6/XUlq1PlT58hhqWYsNBrW8A6d2Cajx/MlVls027IJ9OzYgQVA76mYxrRNt3Hr6SygAt0Z4vTlWFLsEUlZ6NS9djqEB5OnXT/nBbvg5VzXhmez7QtFEZi48wVjr3rHZ+P713DFIl4m/q+0z0/x/RMRDj/r+XKoVZoz1fuB0fd1IlJgdRwe6CVGnadVQQs2K7hhzLAEulZ5Lexfsejw/UDm3n9IxB/L48ODBajwq239rO6aWo6sT3MORM17h0LEe1mz6tb9lGVKe3gV5b+o6Jk4A/Avu259OoQO2bwCtHdezO5jb0MmW9bdmQasP3g773HEZ1MllyUusa9cYOeUeOv1A8gcq5v63vPStRxcwfmd0TkKp2+ThjvUCXaydZ/4Xykf3rnuLtXojqPXc5ldtfuC1/D62Kbhj7uT3egbqZ9UoUngW8vz3el7qhzbLn5ADTdnS7ObyMVk1Cldb0BhKcUFqoAGNXxjqF9KrtZrSL7JMZcJuw9nvuQrV3exVjQxD0jutFpvoYm400b0UN+HlJ37K9qEDtBGYyYDLweKo932rt85+jcvRLU4HJ9xjwcAsT2J79gXf2/R7XA2e3549mCEOdtO99BjXW0vm06njqRv5Z4Ent+QepxshdKUntvx6s2ff4BCpTtGZ7/jzg7dQMDbfz4EDpue29TxpSGpdjbAiX3lRP/QNan0BVffZKeWY6uPKc7huqjdvjqVLnXhXZW6mgbWkqqJ2qYTaOou4Vh1All4v2vfbeQR/bPPie9Nx2LvUGDJ5ODdEzZc2CJpj2Tfsev7idl2+mqqyf1I7lA6kS0B8ygFLQkW/0EHdm/4XiqVSuYLl2gNxEq0ppr6/IBBrMUzf3L7WbSG/8nCWpHPZIL5SM3cAXpNp0vJ+qatihHUCbD3HdL6FKFc9sB+gmbb3nUiU+P2UKA7S+dB1KFUE/hQEENFSQtyNVCvsahjhuT99FfUGqPda7qTYOU1Z1Pom0b0dVx/V3qX9m229rj3vvLlRJyk+pDjbLUaWg51MByfdpY8FN8TZs1C6+C7UbWC9jthAVGJ07pPWuQjVR2IkqSX05lStfo73+ESro3ZkKMCY9vMsQtuFYqm3TJ6lx8Bah2ll9l5qR41dUoHJh+31PGPf5I6jG+osywBLKdi79VzveDmrpeQpVJX85LUCgBmm9a1DrZ6z05cntWvxBqmp3H6oDyClUdef6U3V+t+vYlYy1+/tk+9udCt6uZzbH85rN9R1HlZR9ul0HlqZqo65jgB1shri//h9VS7VF+79vO85/0n7XHaiMx9sYUJA98o2egp36EqrHxclU6ccMqrrq5/SNfTOL7+jdKNemArqFqOLN91DVMo+iqj2uY4Q5gL50Tm//F6KqEq5tJ8TT+t834HU/Hvhse/xixnq39HJGhzAbg8MOYNsfNLVI3+OjqcD66bN7AZzZfmIsCJ5GtWd7OzWu2iCCv5n+Ln3rXIgqxfsIfWPadfmPamd0Da3DQ1u2wrj3rEvdtLajgqLXUVV5M6gb5GNoHUyGcew+TNqXpIL729tNa5t2ju/YXl+QCY55NIF1b0kF5Nu1C/56VMP2C4FHUm2EPtZuDvuO+neeSfp3bGlbrT1+TTtugwo896cC85XaflyRanj9hvb5HdrvvviQ0rch1R7sQ8Bb+5a/h7r59kotJ13FSl9nHqqE+DTGpjXbmhpeYicqMH8TU1eCtgR1/7odOKhv+SktHZ9hgB272rXgJ+233opq+nB+OyZObuf8QoNa34D3Vf995fJ2vTqwb9nuVO/+gWfYR77xQ96xGwBfbo/PoBp3L9ieb9FuHkvP5nc9ncpVfIIa72v1dtG+kCo1uowBjTw90QOHusmtyEwClHYB/CAVrC3HgG5y47+HuqGe3NZzWd/69x32iTduu1ejAqherrU/UDu+HQOzPJHGfefy9AUWfd89rZ2cb2KS1XDj1rcnVUqyx0zWuRBVetK5xuEPc2w8kWq/+R+BJXWT3gh4X287qfZKF1E57kfN7DunYBt6zRW2pHLPX6HGUvwaVQKzTN97h5HpCap6957edYUaluJUqpq9N8DojFHsn4f6zfv+P50aF7J3DVqbaiLSG3H9lVSp+7VUELozVb17DZWZ+gGt1HBI6ZxOBbuntd92+773fJAqXVqESZagUZ2KXsTYgMOfpNq7bdeXlkMY6xQzlKD0YdK3IhUsfYDWbrfvtYH2FKcC0vN6vwN1Dz0P2KotG0lThgkcM/3X6CuAH/c9X5JqjzzwuWRHvgOGsTP7nq9D9WI8kYpyez369mz/Z+sgbAfyNYw1FH91u7gsT1XpvYcqPl9kZukY8oHTP+r5cTx4DKr+ErWLqVKfSY9vw4PHLVqWCv6mUQ30v04LIKib2o8ZUHuO2UjXC6gA8b+pm1kvsOnvvbX0BL/zJe3YuYIHTwTePw7dYgPchqOp0ppXUeM0vbLvtc5Vcfbth02ogHWmVSNULnrbccseT/XifBXV/ueIvteOb8fsd5iikoW+dS9P3ahfS5UCb0vdaHdox/hfh3lMM1Zy+h4qUD2BsaBsFart0meoIKIT40f1nWu9tkZrtevS/r3jhMrg7kt1CPgWFZCvQvWOf3PfteRlDKGDU9+xuj4VmG1Cte97Y7tm9I8hOZCOP1R13npUJ7Vej82Pt9+v10b2QKr6b9qwfk8e3M5s8XGvrd5+g7Pom81gUGlp3/3Gti9+Ahze99q5wKGDXN8wjpn2eFuq9mTZ9vwbVKbtUVSV9Y3DuC6MfCcMaWfuSeXeF2gX+v9hLGB5XrtAPHIW39e76GxOlRJ9iAeP9/Ru4B3t8W7URf1YpnZ6ms2o6H0dqlTvLKrtSn+g1l9VtvIA1rkBYw2WX0rlOK+nOgjsTbUfOptqC/eTQV3sZiNd+7STZoWWhg+Oe312qzj7A7r92sV8ASqYuOyh3jug43aRdtL3ShvWasfuCya7niHt8945shPVfuoTVGbmUGaRo6QaxH+DylycSzWOv4XKUD2Tat/5OCpQuoI2J+4Qt6V3A9+eKt3bmirhuJpqPH0KY5mwKQsaqerez1NBRO/msCodaYNGBVy9HrnHUCWgz6MC3V2oHs8ntmPih1Sv3idTJWVLtc+tQmXunj0Fv+/uVOnN96nBcjejgsNTqNqWgVVf05chppqbvJuxQO3iloYT2zk/tB7vVM/op1FVjAdRvQ7Hz128OlW6+Q4GWGVHjXd2M3BRe74zVV14GtVp4FpG0E55Drbjle1a9SWqrffz2/KvMjZh+lCa84x844ewM4+jSiLWac+fTAUNn6NypNfyMD0u6BsokYqcr6MaDl/MgzsbPIsH9+Z8GgMYrX8C27lEu3n0j3q+HdVo/yT6OjAw2Ea3vXYcz20n2zJUo9tLqaBmdaqq49CpPPnaunenhvnoH6dmowl8xwbjfuPdqdKTV1EldL2q8o0HmO7ezePodpy9j5bB6DuuPjxV+3E207xk3+P1qFKB3hyae1MZlt6YcTNr17cCVdXVm1j7uHbMnky1UXk7fTctpqgahGrv9ytam7O2bMt2bP8L+ERb9qDetUNIx787/7T/K1MZj7czRWMLzmY6F6VK+86lSoMub+ffRdRNbSOqtOoj1M3/KKrqeEbf814J4cmMDdQ8yDHm+tuDrd1+301buo6hSskf347JgbQHo28stXZOH0AFrO+ngsHe0B7nUTUNvZ6NAy8ppzKvZ1LB8dVUwNTreb/AuPeuykx6XU9i3c+lMm3b06oCqWrmx1IFCm+mQ0MHjUt7f+Z5RSo4691TntL2aa938GcY0tBWmfNYkEaVKH2DvhIjKgc+g6q2OoyHiXapnPtXqRKNtagbcy9i3pzK3b+Fyv38mL4R36f6wGnP1+OhRz0faIDEWDCxANUI+CLaBO1t+VZUA9QnTPE+2Zu6uW5Jjbl0Vd9rx1DtXWa3Wvtx7WL9GCr3uRdVuvOpvvccSTXYnlRus/84bBfSK9pF7I3tgtYbtPYIqvdeJ6o62345o124plHV/DcCL+97z4vbeTTTUmUqsO8fZ67XbvJzVLA95eN8UaVnP2JsWp4N+9L3SKrqflidBHrbuyTjmiMwFrCtQgWLnRhmoy99j6GCm+8xNv7k5u2adCJjPSUPbtfMXin8gVS17ZfaMfRrBlw6yFh7sN6wGo8CvtT3+spUoHQZbaiNAaxzUaqK+plUW+Hr27XydCqD+xGqY0yvI8xFVEnpwGtg2vXkGirzvjfwSyoTtOMUHBfLUcFpb6rFzzPWLm+NUR+3E9iO3ahCh5/3XRsWpXrhvnoq0rAAc7E2OW2//6UChYUiYqE28em/qFHO35GZ52TmjQ/xXQtS7WA+SdWdb0c12n1WRKySmT+giop/RbWveElmfnEmaRiK3iSuEbFTRBwREc9r2/JCqvv26RGxQGZeSbVj+vWg1w3/nkz3jVRQsUxEPDkiFs3M71KljUsOar0PlZa+xwtQAfgTqKqU9wM3R8S2EXEEVdR+TraJgR/mOx8fEa/LzJ9SE3y/AnhpZn6ONuxBRGwdES+j9vebMvPeSWzDzsCXImLpNiHv86gJ2O/IzJOAvwDvi4iPUSVsb8ixCeFH7T7q91+EqrI8jSqpXj0i9mjvuYrahoVn9gWZeRdtUOmIeFw7Rz/F2DAji7T35RC3Y7z7qVLzbSPi/VQu/8yIOCgz/wh8PDO/OYzzvZ3Xz6BmL/hCRDw7Ih7dXrs/IqZlTSS+V2b+z6DXPxmZeQNVknY7cFJELNaulR+i2n49KyKWp6qK1qNuemTm+dRx82ngH9RE6r8YcPL+QQVgS0TEJpn5S2CRiHh9S8PvqCDmd8CREbFUu6bMsXZdOIO6hryL6gG4T1vPA1Q708dQ9xLaa/dSmZ5B+yd1nT6gre8Z1DX62RGxN9SE4BExY5ArjYjjqAB9UyrjDNWOc/GIOAT4TDsmOiciVo6IRdrj7akMxJepY/XQiNig/cY3Ufe/6UOPAUYdqU4iwh0/WvIjqIv8Z4Fj+l47iLp5P2zj7vbZ11OlJN+iqr42pEpiTmOKGr8/RNp6pWS7UTeSnakLy9va8nWo0paBj3o+bj8fRDXOP6I9P55qSP1GKtC4hSluX0BVZ19FlYQsTZWefZ66ccxyIEGqZHBL6mbx6rZsO9rwKu35Ce04+AiTzHFTxf2voUoWntj25yuo6r9n9L1vy/b6GqM67h7umKBKCr5JXfgXbPvom+38+S59PVMf4jt6PRW/xNg0UVtQkxFvNBXb0P6vRZVSTWvH9xnAru21o6lqmaHOm0hV/9xA3dQOo9qfnci42U+GmYYBbMOjqHZXH2RsgOeNGLvJvZAqXfsbcNIUpGd8e7DefL2bUG0nz2vH7vVUKem5DLYt1k7UGGuvaM+nU6WHb2IS8zjOQTreTmU8j2/Pl6NqAz5Mta26nMHOL/uCdh1YhRoj8WNUDcU5VMbs/zFF8zXPQdp3owpplqXatf8YOLK9tjFjtQZvpUp+p2aolFHvmDncmf2Bw0upRqgfpHLhq1BVKR+mot9rmUW9d98Feyfg9zy4Gm+bdmK9kylsc9bWvRZjQxAsR93Q1qfaF3yHCoo+1F5fb5gnPhX8fJ+qPrgMuLQtP4oKHN/OEKtiqNzn49vj7YHT+147kQqger2l/j0ExwSOowOoXOeL2vMnUjfoVzDWY20gVRJUMHA91bFiOaoK8bh2vO46lcfYHKT93z0KqZ56l7bjcYG2r84Bnjeb37Uk1VbnVVSGaMt2LE3JecbYsDrnU1Wda/W9tnX7fXaagnTsTBtjsD3flqou7lR7HWYSJPLgjjbrUUHuJ6kqob2oG/YyjE2dtx6VwTx5SGl8uPZgJ1HNMlZo5/YZVND2xJbOh+1MNgdp2YuasuvA9nwaNTfp0Dp9jP+NqEzsoVTJ5nOowoylqHZV72ewk6UvSd2HV6LuE1+mguHPUm3xrqWDARqVCXsE1T7xudQsEOtRhTWf63vftLY/n8FUtrce9Q6a5M7dnIrUt6Lq3L9KRcCLtxPzcMaNbD6zH6j9X5u6eT6RquJ6A2MNLLejgpChDcb6EGk7mCpd6AUJq1GNXH9E3RTXporQ3zOEdfdffKdTJXXb9C37PPDu9vgVDHlIAqrUbjmqncX2VK7sc1SQuAcVqM3RyNhUj9hLqZv11xkrUduaCjpOYIClKVTO8mpa9+22bGUqF3o+8JSpPM5mkdYVaL2a28Xp0nYh3q4t248q/XpmO05eRd0AJ7QN1A31u0zRqOP857A6J1E31FXbefZ5+ko2h5SGNdv/lagbRP+4eO8HnjXq378vPf0ZmpXoC2h48JA8G9BqHqjgYB+qdPArjPUC3YuqLnrkoM6p9r0P1x7sFCoj92r6AhOqDe/QRrun2steQxtmYgp/o31718b2fOd2bTmICQ5DNME0LEyVoH69lyaqyvN0hjCG2IDTvlO7Bvyh73j6Lq2GamTpGvWOmcQO3ZYaFPCk9vwR1PRPl9FX3Tmb37UHFeV/muoY0Out+DrGArWlR7Sdi7eLSK8UaUva8BJUQPk2Bpzbp6oNew1bN283rvN4cI+79WkDkA55+/sHo30c1aum14BzT6oX2U3A34H/noPvX4GqLl2KsarPTwEv7tvfkyrZGXfxXIixxuC94LDXS2hVqh3dyKrWZ5L2M6mqoG2pksZntjT+ggc3Av8K1eN4Nap0e0IXZOqmvsaQt2VWw+q8k7H5OXuB6UCrGBnLFG5MteM6oz1/IVWN8moqc3ATU9wJZ1Zpbo9fRmUwLuHB0331B2q9Xqk7UI3VvzXu88czvJkE9qY6MXyJFnhRmd3XUc1ZLmj/l2qv7cSQS0Wo+8v1VEZsYE1RHmZ9x7d98FYqQ3U+Vcq1K9UmbT+GOybbulQp1IZUxu6TdHQuznHp3o0KKK9gbBikJalS4KFM/zZb6Rr1jpnADpxZUfvbqXrjXjfu3rQ5F1FF7LM8CKlSuB9QN+uDqfr7N1PFml+jStSmbOyz/m2lcj9bUSVV32Os9+GnqJvn7YyVaAwyR7olFfycC3yvLTu4HcBbtOeHUyWXiw7xZF+GsWBxR6rdyzuom+kT+t63PZVTm2VR+vi0UoHRzxgbDmIxKtf9P7RAbVDHLVWleSZtHsO27MR24dy6Pe9EL86+NC9Ma9DOgwfzPbDto53a8xX7XuvaNszRsDpDTM9ubd1vBP5EBRBLUKX/57fz7mHb9I1oP/YyMI+mmoH8jOpANdPfncpgnk5lJHekqtuuYYBVbA+Rzk60BxuXphlTtJ7pVO1Sr1ftiu16dmJ7vj8DGC9zFmlYmCpRv7wdI52r4mzpHH8vWICqqTmIyjz3hhFaqm3LSGZ5GfmOmujOpEq59mKsceoZVGPE5dvzBZlAA1DqJr05NR7V96lG+F+lqjx3ZYgTks8iXVu07epNmfFSKge7avvbFdhhSOtesJ3o9/Dg3PJRVFD8IarkcagD1VLtRU6jqil+0ZYtSuUQ30GVOPRKpWYZSI87jjZgrBr5lVTV6dp92/kG+kpZBrAtL6CGh+k1qP04Y1Wdb6By+JOe/3PA+79/IOT3U21M1mAsE3EocCsdGrtrJtvQmWF1qKqfxaic+n5t2YpUadOb+963xPjjddR/VID2Q+Bdfcs2pdrtnfgwn1upnU9fpBqqT0k7O0bQHmxEv0v/NW3pdox9h74p2Kiqzw9McboWpErVVxn1PpqN/XYkVbr6YqrTwALten0xY52IRnYujnxnTXDHvoQqevwIFenu0Ja/leodNce5FSpX++L2+DlUQLTGiLZzNarq9exxy1/atnPgOVH+c2DDTanc0GlUKdq0vuWrM+TcWF863kqVbvb32F2ipesDwJYT3T6qROtnVBXdvlSnhJdRHTHe1v4PbHBCZt6gttezqjfo8kAbLQ8w7f2B2nlUSeDqfa9PyXEwh2nvjb/2fCoYeg5VEvRVxsZvegzVi/Mkxsb5GuoFmcpg7NL3fDtquIRXDnO9E0zjzGoueqPjb9h3XGxBlfIv+3D7rf0Wk56SboLbMGXtwUb9G1FBxQnt8Q7t/nhIe34w1Xh/sWEf23PbH1U1/DWq0+E3qMzyyu21lzLWCWbo1dQPmcZR76RZ7MAVGSvt2ImxHoUnUF1hz6ENMEmVRqw5iXUdQDUafzl9A22OaLtXoqbDuYb/nPT2FYybA3HA6z6UGk7jae350dR0Jnu0144b5ok+/rupzhHPo3o+HsDYxNcrUqOUT6i9GJXD/gSV63w+NSzAYVQR/Q5UVdQw5g2cWYPa/6UyB1N685rob8GD54D9SDvv1hh1+mYj/SMfVqdvHz6Kagc3rZ1TX2FswOJNWxpv7p13Xfjd2+M923nXK2V+NVXqvBFjgdpAJ+Ie8LZMaXuwEW3jUVSg3KviXJyqcfpFO65uZIqm55ub/qjCkHe3a/MrqHaMb6Mycr35p5cedTp7F5BOaYPDzaBKkz5IHWjLUAfftlSwsAd1w1iHyoF+fZLrXJJqdLoHNQ3PFyfzfRNcd2+g2q2p7f4NNWjuYdTYPhdm5hVTkI49qHZ+H6cGiP1aZp4REc+jqjueQvV4+9mQ1v/vQXMj4tlUidnNmfmliNiPumFcSO2TacBbMvOfs/jOp1EjXX86IlalSrDuzczd2+uHUMfUj4DzM/PPw9i2tq51qfZdL6CqDQ+h2s38ZljrnIi+43BdajDaP/T9HtMz876IWJg67/47a/DfTuof/JkqAbwyMw9or21D5ZwXpbbjD0NOyy5UE4ErqIFLj6XGytuKOtd3okp99gW+nTUg9chFxEuo3pnfpc65j2bmBRFxAtVe9kWZ+ZNRpnF2RMSMzLxz1u+c+0TEI6h2jGdRtT/7UQH0t6nOHSsBf8nM20eWyI5qA9gvS8UQp1Ht0LeiCgR+CDwnOzCI+PRRJ+AhRGbeERGnUkWO/8jMTwJ/jIjnUlN7/D0irgISmPTNIjPvAc6NiI+3m9G/A4ZhazeTp1EN4k+niqZ3p06y+4HD2qjjXxlWGlqwsgXVYPmGiHgC8Pq2G94REedRwc7QLnZ9AcFLqIDsU8CrImJLqsTpASpQ3JoaZPBhA7Tmt8DfImL1zPxNRLwVODUiXpyZ78zM81rgseEwtmmc31AN8E+ncvb7dTBA25mqjvsz8LGI+HJm3tTOiemZ+Y+IOHiqzo050bcta1OZnn2A4yPiDcDbM/OqNrL8XlSJ6tCCtIjYkGo0fyD1+7+I6hhwONUAf3WqTdxqVMeFC4aVlologex2mbldRJxI3eyfGhFk5mkR8U/g7pEmcjbNqwEaQGb+LSIupYKMWxkbf3E74JPZsRkquiRrppM/RMQGwHWZ+a+IWIu6/767CwEa0Pnqzj2BK6kpJQ5vy3amGtqeRTVeH/R8b1NaZ081UlyWGvdrfWpYjZ8wVhWyPBWoDrTBLWPVML3/JwF/BPZtz6dRpWnfZArbylANvT9KVQe+kqqmOouqtuoNVrvkBL9zaSrAO6Y934mqsulvXDuh75zE9nW2QS2wGRUYr0P13juLqv4f2uTBQ9yWkQ6r086fJakqpyupWoAFqGDn7dQ4bL2q+3WpUpAp73XYl97+Ks7F29/q1JArV1Dtmd5JlTAcNOrf178H/XaLUJ1glm3Pe013BjaDwtz8N6t7OmM9/D8K3EbHeqOOPAEPs+Oe1S4IK1B17ldRDSCnU22H3sAUTcswRdv7Kqp7+HcZ6/V3GNUma6BtKcZdkNdlrN3fc6mc2GPb8+nUeE5DG+Nm/AlEVXGuQlX/XEm1gzq6nUSnzum+YGwC9ue1509tF7KjR/3bd+Gv7ff3Ar/sW7Yd1VHgJDo2sfcstmVkw+rwn5mfx1GZrhf2vWdlqld6b7y/abTAcdR/VE+3kxnrPf8KxoayeAEVuHd6UNL59Y/KBBzRjrehDnMyt/yNu9dt0869pfuW9dpVLk8VSnRuPLeuVndCjUb9zaz2Iu+PiD9SdcWLZuYHqJ4Yc7WI2BjYMzNfT+VUD6EGCP1lRGxEBW43ZeavBrne7B29NRHu/sAdEXEbVcowHTg/Ig7JzB9TpRFDMa4N2s5UQ/rfZuZtbXLb72fmP1vVypepmRUemJN1Zeb3ImJX4CsR8UBmfjgi7qdKOuZL/fs/M/8SEe8C1omI91JBxbciYhoV6PxrlGmdoN9SAcVGVLf6jYH3UUNwvA24MzPvG/RK+6pZdwT2joibqKBwD+DL7bh7b2b+LiJela26Pqta5a5Bp2cC6V4gMx+IiF7HoD0z86/t5e9T58w61Nhyu2fmHaNKqx7WIlSNwf5ZE9/P18bdX46keif/BPhuRFyUmTdk5v2tKdEd1OD4ndPJjgMAEbE7dXE7BbitXfwuaS8fnJl/GV3q5lzfhXw7qpHnzsA7MvOsiLgQ+AdwH3VjeV1mXvLQ3zapdGxL5Yp3Atakqlk3pwbyex01btyOOXvtviablsOpXmM3UifRp6kT5gaqGnhHatDUnw9gXZtRN55DM/O8yX7f3Gpcw/rVqWvBByPi0VTv6XuAl7ab9zKZObIgYk5FxBuBOzLznRHxHKo92L6ZecsQ1/kU6rw6k8qdb0iVmt1KNR14Y2a+Z1jrn4jWUennmXlXa0T9XuDzmfn59vz+9vtvSpVCXJa2ceq0qWxLPbdonc6eRBV6PJ665y4AfGwQ95Rh63JJ2reoHPxxwI8iYlGqk8CL58YArXfytBvj9lQPyuOoOvAnRcTCmbl/C56WoUqNrhnUSTeT77kfuDYzfx8Rf6AmPd6EGnfs5Ih4z7ACtHE5nGdRN4DHUu11nkX97qdTweMWVLA6kNLEzLy6dYq4dxDfNzfqKznZjRqF/RXARyJi/cx8eUT8N1Ul+B6qRGpoPV6H7CfAUS3g2Ie6dgwtQGs2oAKxcyNiKSrzc3hmHhIRe1HT13XF5sAtEfG3rI5YdwKPjoiFeud+K+H+aWa+e6Qp1WwxQHuwiFiMai6zYosbrooIqNk9joqIs7qe8VhglCuPtrdmsnx61lAIx1I3iG2pm/dJmXnz1KVwMCJiZeDJreoIquTiPZl5MZV7fRewX+tx+O3M/HxmXgODOenGBUUvbCUMNwAbR8ThLXb8DVVUvl772B8nu97ZSEuvCmUfarT9X1OjPP+BGidutcz8whCqe3+UmTcO8jvnBhGxVkQ8qgVoy1GZhP2pcYJupo7BD2XmTVRp6vsA5rSKuQMupcZ025oKnK4a9Ar6zumeRal2XbRr2LXAUhGxVmZ+LzOvfKjr3lTprT8z30W1+bwmIh5JtQHdCtgmIpZtJRCvoa4LUueNP7datf1zgL9GxFlt2VVUZ5g/MsJmBrNrZNWd427We1K9+R7oVe/F2LhMvVz/Yn3tJOYqbft+QbWVuY/qaXYGVYX366jhAM6l2qV9OjM/MaR0PJ9qBP7DzNyn5ZJfTg2a+z9UddDeLVgaqlb9dAhV5ft+quH6Xllt0DakqmE/nkMew2p+EhEHU8fhj7OG0liNKrU9l2o0uyY1sfeZmXncyBI6YH3XkoFVBUXEEr0S/dZ0YR3g59T+fTk1n/DzIuKx1Bhpzxl1jr2virv3/zCq6v+5VLXs3lSGaWeqTfDi1LRw140qzdLsGhdTPJe6tv25NeNYhToPf5mZx7b3PCIz/za6FM+ekZWk9e3Mo6lee+sB74mIV7bX72vBS++iOtdWT7USs99T7VT2okYbfx/wzohYn6onX4m6wK8yjDS0g/ZoKldxf0QsT+UmjqcmkF2PmkZkKgK0/akqzRdk5t3UjAK3AZ9uVS0/oUoaDdAGKDM/TvXe/UFEPD4zb6Wq365ppWUrUtXMF48wmcNwPwyuKqg1vfhiROzbzt+zqXaTR1NjzF0EPBAR36C69b951AFaszr8e1zG/ajg7O7MfDk16fwlwCWZeQhwDLCPAZrmIgH/7hB3BDULw1kR8ZrMvI063jeNiNOhxpgbWUonYMrbpI2LdhehqlsOzcwfRTWcvywi/i8zz+yvZpkb69r7tzUz/9Qu2k+j5un7LHVQnUeVrh1BTQ+zU2tDc99ktnncfl6OCnL3yOo5+Qrg7y0Q/r/MPGYSmzmhtDSLUyVlG1MTp/8lIo5nbHaJ/Zm7ehN2Wl/Jyc5U84HzgA9ExBFUNedSEXEmVZKyf1avznmmAfKgtyMz742IM6gOFn8FjsjM70QNhHk4NZXbkVEzXPwrM/8w6v3Z2h++JSI2p4b1eQHwxayepgtQPd9OBb4VETvl8NvuSQMREU+iaof+3M7BpwPPoDrBfRt4VkQsm5kviYh9qLEq5xoj6zjQStBupKrZHtGqNX/douADRpWuQWo3xh2oqoSvZeYHIuL/qF6rD2TmW9vNEaqB/Gup6sZJBSjjArTjqIvyfVQOH+rGsnirhn1xROyaQ+pWP5M2aHfm2PAXp0TEHZn5jcz8awsaloK5MyjvqnYcbkGNf/WSdtzdT7XX2gt4CVWa+8nM/FbvM6NJ7dwhMz8bEX+heh8/mZrv91Yq975fe89v+94/ygBtIaqJxaupDjobUYPn7hYRX8vMH1Alf68B/ka1q5PmFpsCv4zqAPPrqKFknkBlOLePmrHm/0XEL7MjPasnYsqCtIhYLzNvbDeMfagL2YFU472XUI2Y/0CNxr5o1Ngl3ZiWYYL6Si62pKo4rwc2i4irWqB2P/DsiJhOXeSXpnqB7ZkDGN+mLyh6AVUqdSA1MPDKEXEa8HdqYtmVqbYyQxsfpi8tL6c6CdwTET8EPkCVJJ4RNWbU5Zl5L3NxtXZXtbZnrwR+kpnfBcjM06Pa2F5OTU916QiTOFfKzK+2dl1vbTeA81smbIPWnODOLgS7We08f0O1R02qZ9uCVKnfc6PGb7umZQ5fP8KkShOWmW+Pmm/4TxGxRmb+b1SHntvaW1ai5hueK69xU9ImrVWzfCkilo6Ix1BtkK7PzDsy8yRqMuf3RcTHqHYdb5hbAzR4UMnF64EDM3M/ajDWDSPi+Zl5ITX9zo2ZeX9m/hF46yACtJ6oCeM3pXrF7ktNIJ5UlcZvgEdR1TTXD2qdD5OWnakqoN2oDgKPpRp0nkO1zXtdRDwiYrS93uZh91Ftjp4QNdk3UIEaNeH70iNK11wvMz9LZTLfGxEXU9WIp7Zr28gDtD5XU80MfkeV4v+eyiD+GnhJRGwyysRJExERK0V1MCMinpGZv6CuZd+N6qn8I2rO5oup2UbelAMeJWCqDL13Zyst+i/gV9QFYWOqF+OeVIPaz7f3bUlNj3LbvNAeImrC9EuBV7VIfzrVc2on4EeZeWZ739DaqkRNHL4+NVjuk1oQdAfVJum0IVZxLthfZdv2xQZUkPh0qsTwHxGxQWZeHxFLZQ1XoAHoK8ndmppg/DfU+XcYFSBfmJlXjDCJ85xWO3AK8PzM/H8daIPW38xgAaqDyDSqynsl4DWZeVPLNO8CnN8CN6nzImJNqgPeD6jOdvtm5h9bW9HdqQKKB6gaql9l5i9HldbJGnp1Z1bj9F9S7SHup6q8/k61fXhGRNyfmZdm5veGnZaplJlfaRfuN0XE71pVyKepC+WP+943tAt5C4TuBaa3XMea1DQ1ZwwxQFsSODAiPk7Nj7k0VYrzTNrvnzWkyvHA1hFxqAHaYLUA7WnUhNinU51Udqd6790PHNaaE3xlhMmcp2TmRRFxZWb+qT3vSoB2JFVqflvWuGgvjYh3A6+NiDdm5g0RcdNk28FKU6F3bGfmzRFxLjWO36tagBZZnQMWoDKm62Tm5aNN8eRNVZu066i2RvcAS7U644uoSPeQiPjHvJizz8xLIuI+4NSooSXOBc6f4mT8BvgCdbNemWp/dOswVtRK0O6JiAeokpvfUyWnC1ETx98HvCAi/kGV6jw7M/8+jLTMr9oFamngKKq35rJUm8gfZvUy/BQ1eO3tI0vkPKoXoI3auDapBwEvBK6MiLWBUzLzhRFxDvCyiDjWAE1zg3GZj0dTVfgHAOdGxF2Z+VGAzHxxRPyOuvYNZVD2qTSU6s5xO3Mhag64+1vj8SdT0/z8IKqL+tOBL2TmPHvTiIg9gNOokqXf5xSP4B41pMeKVFuU22b1/jlcxwbUEBp7tXVdQA2j8eSWy1mTGs18a6rDwPsz82fDSIsgIl5F9ZR9MjXX7S9bI/dvAjdP9TGoqdOaNaxAzWRyLNV56JlU298/Ay/MzLsjYoV0LEJ1XK+tcl9M8TJqwOXDs4aUego1csEhVMHT9pl5/IiSO3ADD9LGBWjHUW2R7gFOzpof7kRgS6pN1P+LubgX50RExIzMvHPU6RimljtfhepN+meqx+5B1CC5P48aQPW6aLNIjDCp86SI2Jhq7/f6iDiF6r33pNb2aCMqcH5+Zn57lOnU1Iiat3BDqtH0kyJidWpWhNcDb5sfrrua+8WD55I9kJoZZ+dWa7N6Zv4mavy/s6lY44U5Dw3CPPDqznFF7ftRN+kfAqtFxGsz878j4g3U+Fw/ml+qu+blAK0XaGfmYRHxQSpXs29mnhE1OvtnonruPjkiDsjqzaoB6OsksB11vu0cNfbca6NGw39dq3LfmGq7YYA2n8gae/ABYIGoyd4fB3we+IQBmrqulaA9GnhHROzWMvYJfAnYKyLWAPaIiJ9TPayfRg0effeo0jwMw6ruXJJqA/Ua6saxK9WrcCXgmJazf6Q367nbuFLT/rkMz6LNBZiZd0bEUcD21CTXQx/yY34wbt9vD3ycKrlcnxrI8TuZ+Y6I2Jaaw+53mXnNqHsdarBm9nv2105EzTbySmBzqgp0n8z8+dSnVJozETGDOn5/TLWnfTGV4Xg78L/UFIMfycxrR5XGYRraEBwx8+Ef7qQm0z7Zxqpzt5lUa69H9dp9bWb+LSLeQwVq+7cG6/8ustbkRMTKwGOAK1tbz2cDq2TmmyNicarU7M3UUBvvHGFSNUQRsUivJiIingAskDV7wL8nlW+Pl6Z6dt+V88DwRpr39bdDa4U+L6bGIHxca+P8iHaf2ZMaVmbvzLx5ZAkeoqENZpuZ/6B6dPaGf9iNmtD7/QZoc7+ZVGufRk3e/qGIWDszj6Pmhfxo63Hobz44m1O9Mxdr1cl/Bp4fEWtl5v9RUxT9CtghIg4aYTo1JO2aenhELN7OwQuA0yLiUvj30EcLtsd3Z+a1BmiaW2QTNX3klzLzVGp8zx9FxEotQHsWFaAdMq8GaDD8IThmNvzDb4a8Tk2RGJvV4AAqUPsRNczG+yPiqMw8NCJWtJPAYGXmxRGxLDXl2KXUyPHvA94ZEa8EFqGaFlxDdeTQvGcVqrf4otQ5uHnrsfmNiLg0M3fNzH/NLx2zNO+JiKcz1q6dzHxla2P57Yh4IvBV4NvDGrGgK4YapGUNpno68AmGOPyDRqP1rjmWqtbee1y19vMi4nXpKOYD01/FnJl/iohvUI1l/0kNWBtUbvM+4Ajq5r1TK1G5z7Zoc7+IWDQz783ML0fEItTwGstTQfndmblDRHw9ap7gbQzQNLcY14RmYWAtasaAJwC3AGTmCa1Jx1eATeaHAoCpmHHgX8BQBk/V6OV/zmqwBlWt/T6rtQerFf/vQLX1+1pmfiBqQu89qEzQWyPizPb2LYDXUsGzv8M8oN2cto2Iu4GNgD9QYxMeDWwTEfdm5i0ts3RpRKyWQxq4WhqkcQHaUsDfMvPMqHFWnx8Rd2fm1wAy87iIWH5+CNBg6mYc0LzNau0h6htmY0uqivN6YLNWWvKBiLgfeHbU/LCfoWYceCI1ZtoNI0u4Bu0+ai7WU4BHAjtm5q3tRnYwMC0iLs/MX2XmrqNMqDS7omYPWAK4JiJeSg1Uu0hEHN16qP+dGrJrwcy8rH1snh3SajyDNE2a1drD1QK0LahBSA/MGhD4AOCJEfH8FqhNA25s1Vt/jIi32pt23pI1GPi3qZ5u3wbWjYjbW9XnfdQQLP+IiN9Qs7xYva1Oa00xXgT8K2rWml2B51Nt0b4RETtk5vsi4hHAcyPiW626f745tg3SNBBWaw/d0lRD8Z2ouXA/Tc19u1PLYZ4JD5qA2ABtHhM1vdx61NRqz6HmZl2aGjz6WmqsvKt6Q29IXRY188y/IuJU4BXA7sDVmflr4C2tk8AVEfG0rIHRl87Me0ea6BEY2hAckgYnM78C7EPlJg9sN+JPA18Drux733yTw5zX9caK6nt8D1XScEhmfgj4BTXMyieoXr5fzczfjSSx0gS0zGSvTdk04NVU54C1ImIzgMx8G3AW8Lk2zubdI0nsiA1tMFtJgxcRuwKnAu/KzHNHnR4NX0Qsnpn/16qGtqRmcvl0q+beCXgy8PHM/OlIEypNUEQcQ3V82ocaTuZ1wN+o47s3MPOymfmn0aVytAzSpLlMq/Y6jar+/P380stpftNKz54InAPslJk3t0Bte+CNwLmZedYIkyjNsXYdOxXYozfQctQUUCdS0z99MDN/2N/zc35kdac0l8nMS4AdMvN3Bmjzlv4qzta28CrgQuDTEbFGa/t5FfBr4BkRscyIkipN1srAJzPzlohYqA28fCfVQeou4LdgEw47DkhzoXYx0zxk3FhRe1Pzbd5Itde5G7goIp5PDVL8AHBoZt41mtRKk3YLsFdEfCYzbwSIiMOAWzLzpJGmrEOs7pSkDomI44EDgW8AywKPAJ5LDVq7KfAY4HmZed2o0ihNVptW8BVUYdFV1FhpLwUOysxfjDJtXWKQJkkd0QYkPgf4rzZQ7YrAscBfM/O0NutAZuZfR5lOaRAiYiVgT6rzwJ+BN5n5eDCDNEkakXFVnEtTN6qrgAsy811t+b7Azpl55MgSKg1RmzUDx3f8T3YckKQRGBegvQA4uj3/L2CXiDikvXURYEZELNbfsUCaV2TmPw3QZs6SNEkaoYg4impz9sxWxbk4NR7a+4DvAZsD+2Tmz0aYTEkjYO9OSRqRNifh04HXAvdGxNHARtTcnJsCKwF/yczbR5dKSaNiSZokjVBEHAkcQ819ez3wG+DxwHHOwynN3yxJk6TR+ijwI+CXmfmniDiAmkh9IcAgTZqPWZImSR0QEQsAhwPHAwc6F6ckS9IkqRsWoWYS2D8zbxh1YiSNniVpktQR8/tk0pIezCBNkiSpgxzMVpIkqYMM0iRJkjrIIE2SJKmDDNIkSZI6yCBNkiSpgwzSJEmSOuj/A/TuAEmJ9MDRAAAAAElFTkSuQmCC", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "df = df[df['artist_top_genre'] != 'Missing']\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "execution_count": 10, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAlYAAAHbCAYAAAAJY9SEAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMCwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8/fFQqAAAACXBIWXMAAAsTAAALEwEAmpwYAAAlmklEQVR4nO3de9yt9Zz/8de7tqLofEsqEokGs7El50PoMNgxv9JBysSWKeeQzISGwaQQid2InFKK0dCMkpQzu6SSoiiVXXuriE46fH5/XNc9Ldve7cP9vVvrvvfr+Xjcj73W97rWWp96rPte7/U9XakqJEmSNHGrDLsASZKk6cJgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmaNAl/Hvi5M+Hmgft7DLs+SWotbhAq6Z6QcBnwiiq+OexaVkTCjCpuH3YdkkabPVaS7nEJqyd8KOF3/c+HElbvjz0z4cqEgxJ+n3DZ3fVuJTwk4ayEPyV8M+HIhM8NHN8m4fsJf0j4WcIzB459O+HfEr7XP/7UhA36Y5slVMI+Cb8FvtW3/1PCLxKuT/hGwoP79iR8MGFBwg0J5yc8anL+D0oaVQYrScPwdmAbYCbw98DWwL8MHH8AsAGwMbAXMDdhyyU81xeAHwPrA+8E9hw/kLAx8HXg3cB6wAHASQljA4/fHXg5cH9gtf6cQc8AHglslzAbOAh4MTAGfAc4rj/vecDTgYcDawO7ANcu5f+DpGnGYCVpGPYADqliQRULgXcxEIh6/1rFrVWcSReOdln0SRIeBDwBOLiKv1TxXeDkgVNeCpxSxSlV3FnFacA8YMeBcz5VxS+ruBk4gS7sDXpnFTf2x/cF3lvFL/phwX8HZva9VrcB9wMeAaQ/Z/7y/6+RNJUZrCQNwwOBywfuX963jbu+ihvv5vjg81xXxU0DbVcM3H4wsHM/DPiHhD8ATwU2Gjjn6oHbNwH3XeQ1Fn2+Dw8813VAgI2r+BbwUeBIYEHC3IS1FlOzpGnMYCVpGH5HF1LGPahvG7duwpp3c3zcfGC9hDUG2jYduH0F8Nkq1hn4WbOK9y1HrYMrfK4AXrXI892niu8DVHFEFY8HtqIbEnzzcryOpGnAYCVpGI4D/iVhrJ8sfjDcNeG8966E1RKeBjwf+NKiT1LF5XRDe+/sz30S8IKBUz4HvCBhu4RVE+7dT47fZAXr/jjwtoS/A0hYO2Hn/vYTEp6YcC/gRuAW4M4VfB1JU9SMYRcgaaX0bmAt4Lz+/pf6tnFXA9fT9VLdBOxbxUVLeK49gE/TTRT/MXA8sCpAFVf0E87/gy7M3dGf8+oVKbqKryTcF/hiP6/qj8Bpff1rAR8ENqcLVd8ADl2R15E0dbmPlaSR0m+H8LmqFetVSjgeuKiKdzQtTJKWgUOBkqa0fgjuoQmrJGwPzAb+a8hlSVpJORQoaap7APBlun2srgReXcVPh1uSpJWVQ4GSJEmNOBQoSZLUiMFKkiSpkZGYY7XBBhvUZpttNuwyJEmSlurss8/+fVWNLe7YSASrzTbbjHnz5g27DEmSpKVKcvmSjjkUKEmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqZMawC2jt8W/+zLBL0DRz9qEvG3YJkqQpwh4rSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1MhSg1WSTZOckeTCJD9P8rq+fb0kpyX5Vf/vun17khyR5JIk5yV53GT/R0iSJI2CZemxuh14U1VtBWwD7JdkK+BA4PSq2gI4vb8PsAOwRf8zBziqedWSJEkjaKnBqqrmV9U5/e0/Ab8ANgZmA8f2px0L7NTfng18pjo/BNZJslHrwiVJkkbNcs2xSrIZ8FjgR8CGVTW/P3Q1sGF/e2PgioGHXdm3Lfpcc5LMSzJv4cKFy1u3JEnSyFnmYJXkvsBJwOur6obBY1VVQC3PC1fV3KqaVVWzxsbGluehkiRJI2mZglWSe9GFqs9X1Zf75mvGh/j6fxf07VcBmw48fJO+TZIkaVpbllWBAT4J/KKqDh84dDKwV397L+CrA+0v61cHbgP8cWDIUJIkadqasQznPAXYEzg/ybl920HA+4ATkuwDXA7s0h87BdgRuAS4CXh5y4IlSZJG1VKDVVV9F8gSDm+7mPML2G+CdUmSJE057rwuSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiNLDVZJjkmyIMkFA23HJzm3/7ksybl9+2ZJbh449vFJrF2SJGmkzFiGcz4NfBT4zHhDVb1k/HaSw4A/Dpx/aVXNbFSfJEnSlLHUYFVVZyXZbHHHkgTYBXh247okSZKmnInOsXoacE1V/Wqg7SFJfprkzCRPW9IDk8xJMi/JvIULF06wDEmSpOGbaLDaDThu4P584EFV9VjgjcAXkqy1uAdW1dyqmlVVs8bGxiZYhiRJ0vCtcLBKMgN4MXD8eFtV3VpV1/a3zwYuBR4+0SIlSZKmgon0WD0HuKiqrhxvSDKWZNX+9ubAFsCvJ1aiJEnS1LAs2y0cB/wA2DLJlUn26Q/tyl8PAwI8HTiv337hRGDfqrquYb2SJEkja1lWBe62hPa9F9N2EnDSxMuSJEmaetx5XZIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGlhqskhyTZEGSCwba3pnkqiTn9j87Dhx7W5JLklycZLvJKlySJGnULEuP1aeB7RfT/sGqmtn/nAKQZCtgV+Dv+sd8LMmqrYqVJEkaZUsNVlV1FnDdMj7fbOCLVXVrVf0GuATYegL1SZIkTRkTmWO1f5Lz+qHCdfu2jYErBs65sm/7G0nmJJmXZN7ChQsnUIYkSdJoWNFgdRTwUGAmMB84bHmfoKrmVtWsqpo1Nja2gmVIkiSNjhUKVlV1TVXdUVV3Akdz13DfVcCmA6du0rdJkiRNeysUrJJsNHD3RcD4isGTgV2TrJ7kIcAWwI8nVqIkSdLUMGNpJyQ5DngmsEGSK4F3AM9MMhMo4DLgVQBV9fMkJwAXArcD+1XVHZNSuSRJ0ohZarCqqt0W0/zJuzn/PcB7JlKUJEnSVOTO65IkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1stRgleSYJAuSXDDQdmiSi5Kcl+QrSdbp2zdLcnOSc/ufj09i7ZIkSSNlWXqsPg1sv0jbacCjquoxwC+Btw0cu7SqZvY/+7YpU5IkafQtNVhV1VnAdYu0nVpVt/d3fwhsMgm1SZIkTSkt5lj9E/A/A/cfkuSnSc5M8rQlPSjJnCTzksxbuHBhgzIkSZKGa0LBKsnbgduBz/dN84EHVdVjgTcCX0iy1uIeW1Vzq2pWVc0aGxubSBmSJEkjYYWDVZK9gecDe1RVAVTVrVV1bX/7bOBS4OEN6pQkSRp5KxSskmwPvAV4YVXdNNA+lmTV/vbmwBbAr1sUKkmSNOpmLO2EJMcBzwQ2SHIl8A66VYCrA6clAfhhvwLw6cAhSW4D7gT2rarrFvvEkiRJ08xSg1VV7baY5k8u4dyTgJMmWpQkSdJU5M7rkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDWyTMEqyTFJFiS5YKBtvSSnJflV/++6fXuSHJHkkiTnJXncZBUvSZI0Spa1x+rTwPaLtB0InF5VWwCn9/cBdgC26H/mAEdNvExJkqTRt0zBqqrOAq5bpHk2cGx/+1hgp4H2z1Tnh8A6STZqUKskSdJIm8gcqw2ran5/+2pgw/72xsAVA+dd2bf9lSRzksxLMm/hwoUTKEOSJGk0NJm8XlUF1HI+Zm5VzaqqWWNjYy3KkCRJGqqJBKtrxof4+n8X9O1XAZsOnLdJ3yZJkjStTSRYnQzs1d/eC/jqQPvL+tWB2wB/HBgylCRJmrZmLMtJSY4DnglskORK4B3A+4ATkuwDXA7s0p9+CrAjcAlwE/DyxjVLkiSNpGUKVlW12xIObbuYcwvYbyJFSZIkTUXuvC5JktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIzNW9IFJtgSOH2jaHDgYWAd4JbCwbz+oqk5Z0deRJEmaKlY4WFXVxcBMgCSrAlcBXwFeDnywqj7QokBJkqSpotVQ4LbApVV1eaPnkyRJmnJaBatdgeMG7u+f5LwkxyRZd3EPSDInybwk8xYuXLi4UyRJkqaUCQerJKsBLwS+1DcdBTyUbphwPnDY4h5XVXOralZVzRobG5toGZIkSUPXosdqB+CcqroGoKquqao7qupO4Ghg6wavIUmSNPJaBKvdGBgGTLLRwLEXARc0eA1JkqSRt8KrAgGSrAk8F3jVQPN/JJkJFHDZIsckSZKmrQkFq6q6EVh/kbY9J1SRJEnSFOXO65IkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNTJj2AVIWn6/PeTRwy5B08yDDj5/2CVI04I9VpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIzMm+gRJLgP+BNwB3F5Vs5KsBxwPbAZcBuxSVddP9LUkSZJGWaseq2dV1cyqmtXfPxA4vaq2AE7v70uSJE1rkzUUOBs4tr99LLDTJL2OJEnSyGgRrAo4NcnZSeb0bRtW1fz+9tXAhos+KMmcJPOSzFu4cGGDMiRJkoZrwnOsgKdW1VVJ7g+cluSiwYNVVUlq0QdV1VxgLsCsWbP+5rgkSdJUM+Eeq6q6qv93AfAVYGvgmiQbAfT/Lpjo60iSJI26CQWrJGsmud/4beB5wAXAycBe/Wl7AV+dyOtIkiRNBRMdCtwQ+EqS8ef6QlX9b5KfACck2Qe4HNhlgq8jSZI08iYUrKrq18DfL6b9WmDbiTy3JEnSVOPO65IkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1ssLBKsmmSc5IcmGSnyd5Xd/+ziRXJTm3/9mxXbmSJEmja8YEHns78KaqOifJ/YCzk5zWH/tgVX1g4uVJkiRNHSscrKpqPjC/v/2nJL8ANm5VmCRJ0lTTZI5Vks2AxwI/6pv2T3JekmOSrLuEx8xJMi/JvIULF7YoQ5IkaagmHKyS3Bc4CXh9Vd0AHAU8FJhJ16N12OIeV1Vzq2pWVc0aGxubaBmSJElDN6FgleRedKHq81X1ZYCquqaq7qiqO4Gjga0nXqYkSdLom8iqwACfBH5RVYcPtG80cNqLgAtWvDxJkqSpYyKrAp8C7Amcn+Tcvu0gYLckM4ECLgNeNYHXkCRJmjImsirwu0AWc+iUFS9HkiRp6nLndUmSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWpkItstSJI0aZ7ykacMuwRNM997zfcm/TXssZIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpEYOVJElSIwYrSZKkRgxWkiRJjRisJEmSGjFYSZIkNWKwkiRJasRgJUmS1IjBSpIkqRGDlSRJUiMGK0mSpEYMVpIkSY0YrCRJkhoxWEmSJDVisJIkSWrEYCVJktSIwUqSJKkRg5UkSVIjBitJkqRGJi1YJdk+ycVJLkly4GS9jiRJ0qiYlGCVZFXgSGAHYCtgtyRbTcZrSZIkjYrJ6rHaGrikqn5dVX8BvgjMnqTXkiRJGgmpqvZPmvw/YPuqekV/f0/giVW1/8A5c4A5/d0tgYubF6K7swHw+2EXIU0y3+daGfg+v+c9uKrGFndgxj1dybiqmgvMHdbrr+ySzKuqWcOuQ5pMvs+1MvB9PlomayjwKmDTgfub9G2SJEnT1mQFq58AWyR5SJLVgF2BkyfptSRJkkbCpAwFVtXtSfYHvgGsChxTVT+fjNfSCnMYVisD3+daGfg+HyGTMnldkiRpZeTO65IkSY0YrCRJkhoxWKmJJJsnWX3YdUiSNEwGK01YknWBA4C3G64kaepJkmHXMF0YrDQhSTarquuBk4C1gQMMV5rK/IDRyiZJqqqSPCXJPkm27bdK0gowWGmFJVkH+ECSt1fV6cCXgQdiuNIUMB6gkjy6/0DZGKD/gDFcaaXRv+efBXwWeBjwIeC1SR421MKmKLdb0ApLci/gScC+wDlV9YEkzwB2AX4HfKCqbh1mjdLiDHxDfw7wEWA+cBnwc+Dw8g+jViJJtgQOAT5fVScneRzwKuDcqjpquNVNPfZYabmNf5uvqtuAHwJHAtskOaCqzgROAO4PHGzPlUZRH6oeB7wZ2Kmqng18ie5SXLOHWpx0D0kPeDrwUGC7JGtW1TnAccCcfg6tloPBSstl/Jt+f3ttgKr6HnA48KSBcPU1YDXgvkMrVlqCfv7IM4BnARv3zd8FbgCeMKy6pHvCwFD3BsCMqjoaeA8QukvQAVwN/Klv03KYlEvaaPoaCFWvBbYFrk1yalV9sf9dfV2Sg6vqkCTfraqbh1mvNG5g+O9ewG10Pa3rAm9Ncn1V/TTJucDuSdYAbnZIUNNR/3uwI93w31VJbgT2AdYE9kqyO10++I+qum6IpU5JBisttyT7Av8I7AEcChyWZP2qOjLJDGCfJOv5C6lR0n+YvAB4Ed1Q9aF0w9bXAicnOYauB+vQqrppeJVKkyvJI4F3A/sD5wJfAD5VVbsmuQXYDji/qr7Wnx+/ZCw7g5WWS5J7A7fSfTi9DLgP8FLgk0nurKqjkvy4qm4ZZp3SopI8Hng/8Aq6OSV7AmfQrYR6AF0P7FFV9d9JVq2qO4ZWrDS5bgUupFt0dAuwU5Izk+wHfAJYh25qx67A8Yaq5eMcK92tJH/1HqmqW6rqU3RdxtsD+1XVGcDPgH9Oso6hSiPqkcCPq+r7VfU+4H+B1wP3Bg6j673aJ8mjDFWaTga2Flm1Hwq/DtgImDVw2heBO6rqduBY4CzgDEPV8jNYaYmSbFJVd/a3X5Pk8CQHJFmLuyY2PiTJHOAa4NlV9YfhVSzdZeDDZPzv3IXAaklmAVTVicBFwBZV9Xu6VYFfBv44hHKlSdMPg8+m+/JwPN2XjCOBjyTZP8kr6IYFL+nPv62qjq2qa4ZW9BTmPlb6G/0H0lp0Y+/vBc4DjgD+E3gM3UqSvej2OXkc8Hhgj6o6bxj1SkvS71P1JOAPwGl0e67NB64CLqZbUv7i8feuQ4CajpI8gu7v93vp/n6/k24o/Da6+VSbACdW1anDqnE6MVhpiZI8Gfgk3Tf9I6vqW0keCLyVLnjtV1U3JVm7qvyWr5GS5CnAMXTDfC+j2wLkcmAMeDLdcPbR/YaITs7VtJTkUXS/AxdX1Wv7tu2ATwNPq6pLhljetORQoP7KwPBJqur7dBPT/w7YEaCqfge8D7gDODLJKoYqjZokDwf+GTiiquYCOwHrA4+pqiOqaldgb0OVVgK/pJu68cgkWyRZvaq+QXd917HhljY92WOl/7PI5p/PARbSDZmsC/wP3TL0T/THH0A3dO8YvEZOkh2A19KtfnpDVf2mnxt4JvCSqvrlUAuU7gHjQ9v9hPVPAjcD3wQW0A2Dz66qnwyzxunIYKW/keQNdN/wz6DbnXoXYHO6lSIfr6oPDa04aTEGNv/cHLiJbtXTlnTzAH9L9+08dJPT/6GqrhhasdI9YOB3YkZV3d5fbeBIuisLnAl8vapOtce2PYcC9VeSbAVsV1XPANYGrgf+UFU/opunsmeSdYZYovQ3+g+QHejmUR0O/IRudd9xdEvKv0T3ofJWQ5Wmo4FpHFv0IwoA9KFqRlX9hW54fB6wBnCOoWpyGKxWcgPXjBr3F+C3SQ4CHg7sXlW3JZldVT8GnuyWCho1/QfJu4FXVtXudEHqZOBXdCuhvg98m64XdnHve2nKGuid2o7uff9fwH5JHgZ/Fa5uowtX9wfehpuETwqD1UpskTlVs/tVgL8GNgT2pht/v6Xf4+SA/rI1tw6vYuku4/tTJXkC3WKKc+lW/VFV7wa+AxxUVT+lmyP4ULoNQGf4LV3TSR+qZtFdVeAFwJvoFh3ttEi4WrXvudoZOKwPWmrMYLUSGwhV+wP/BizoNwT9MN23+xOTHEi3cdyrq+raYdUqjUtyH4CqujPJU+km5T6Kbn+efxg49bt0k3Wpqq/TbY54Yr+ztDRtJLkf8HLgcVV1SVV9j+76f5sDL+lXydJPZF+lqv7Sr/DWJLAbcCXXf5vZGdh+4BftO8D5dFstXE+3iuriIZUo/Z9+T54PJXk+3SU5/hX4SFWdkeTPwNwkD6XbEPQlwEHjj3XzQ00ngyMOVfWnJEcAD0tyJPCaqvpOklWBPeg2AqU/987hVLzycFXgSmbRyYr9RPSPAwcCvwNu67uVNwMud8hEo6JfMn4U8CPgv4Hn0Q17rAvsVVVXJXkk3UrW9YEf9JvaOkFX08rAnKrnAg+i+yz/z75n6kDgBuCNfa/uulV1/VALXsk4FLgSWWRO1Qb9kMqNwOrADn33cCXZnW5i4xpDLFdanKvogtOX6FY3HUI3t+o1STaqql9U1cer6j1V9S24a8hbmg76obxK8g90O6pfCRyS5AP9/mz/DjwA+Gj/EDdwvofZY7WSWCRUvRHYDfgZ3eqRn9J9UF0E3A5sDexZVecPp1rpry3yDf2zwLf73dPHL13zfLovAv/uprWajpI8BFilqi5NsgHd78Eb6FZvHwhsDHyzqvZJsiWwenn91qGwx2olMRCqnkB34eTXAF8HXk+3z8/z6Cb3/oDuorSGKo2ERTb/HANeDKyS5N39MMf3gFPovhSsM8RSpcn0ZGD9/pI0vwfmAKsB7wKeCjwLeHmSj1bVxYaq4XHy+kqkX0H1ZeDDVfXDfijwT8CbgQdW1VFDLVBajD5UvZBu2O8Sui1BPkG3pPy1SY7oJ+qe7x5rmq6q6vNJ7gv8JMlLq+q8JA8Ezu7nUj2AbnPcbwy3UtljNY0tugliVX2Xrvt4lyQbVNXNwFl02ys8N8m6bpyoUZNkG7rVf9sBX6Hb4PB5wAfo5lu9qd+b6g9DK1KaJAM7qm9Ht63IZ4Gj+xWylwFrJ/kY3WWbvlpVp/l3fLicYzVNLTKnalvgfsBpVXVjkg8C29BtALqgX211r6q6aYglS4uVZBO6rRXWpdtdfXe6lazXAZ8GFpYXktU0lmRrui/Ab+hHG95I93uwU3/KY4Abq+rMIZWoAQaraS7dBZX/ke7SHhsC76+qM5McSjfh9+lVtXCYNUrLIsl76Dax/XCSlwGvBf6xqi4fcmnSpEmyKfBB4LqqmjPQ/kbglcDOVXXBsOrT33KO1TTTj7NfX1W39iuonltVT+13UH8y3eTGqqo3J7kVWBMwWGkqOB94Vd/D+mLgdYYqrQRuB84DZifZvqr+F6CqDu83AF1nmMXpb9ljNU30Y+pjwInAfwKfoxs6uS/dipG9gBcCnwIeBrylqs4YTrXS8kuyFvAiuvfxMf1laqRpZWAV7JPo/qb/lm7Bxt501/87oapOH2KJWgonr08fqaoFdNf8242ue/ja/hv9w4H/qapbgO/RDQvadawppapuqKpj6S6x9HUn6Go66kPV84Bj6KZvnA08BTiZrudq7/64RpRDgdPEwPWf1gDuAxyTZI2q+hTwfeBj/eUOnkQXuhz+01R1B7ijuqafJKvQDe29iq53dj3gQuCcqromyZforpQxf2hFaqkcCpxGkrwEeCuwA91qkZcBHwOOp/vG81zgc1V10bBqlCTdvSRvBdYGng3s0e+2vjfd9jiXeSHl0WaP1fSyPnBWf0mPTyS5FpgLrFFVRwMuxZWkEZRkJt0WOO+iW1S0J/CsPlT9Pd2X5kuq6tdDLFPLwGA1vfwWmNnv+3NVVZ3YL0t/QZIvVtWfhlyfJKk3MFH9acDOwHZJFlTVwUkeAbwjye3ATOCt/SbPGnEOBU4jSdam2zjxcroLK69BNyT4uqq6bHiVSZLGLbKB89OBzwP7A48AHg98v6o+1F+GbF3gd1V19uDjNLoMVlPMkn6x+kt63J5kPbqJjw8EtgAOcPM4SRoN/fX9Hgl8u6ruSPJSYOOqen9/LcCZwPvptlX48BBL1QoyWE0hi3zLmQ0EuLOqTu7bxsPVKv1FOdesqhuHWbMk6S793+5fAVfSbf65Ld3O6s+tqt/0KwOPpZtndWJVfWFoxWqFuI/VFDIQqval269qS+CjSd7SH7+9/6UcT8te+0+SRkhVfRW4mm7F9k7AqXRTOD7cz6t6DN21MX8FbDykMjUBTl6fAhbpqbo3sAuwV1X9NMkJwDeS/LmqPja4DNexeEkaDYN/x6vquiRnAs8D/gJ8hW4E4rN0vVj7AI8Dnttfwul2/55PHQarKaTvqboY+CVwn37I7zdJ9gd2HW51kqQl6Vf/PQN4NPCtqjo6yZ/pLtF0Z1UdmuRj/elbAwcDL6qq24ZUslaQQ4EjLMmW8H+/kC+mW477c+Ba4A1015EC2BRYo78gpyRpRIxfeinJE+mG/54BvCXJK6vqOOBrwEuT7ALcAtwbeDLdnlY/H1LZmgAnr4+oJNsBR9F1B28EHAZcWlWv6Y8fQ7cM90a6uVYvd/WfJI2eJFsDhwBvqarzkuxKF57O73uudgMurKqf9eevVlV/GWLJmgCHAkdQkhl0XcH/CmxFt/z2DGB2khdU1X9X1T/134BWpdsM9PKhFSxJujvrAM+hu6zYecCJwJ30c6iq6mNw1zwsQ9XUZrAaQf3qvkuBf6G74Oyz6LqIb6bbRf2Oqjqlqn40zDolSUtXVaf20znem+R3VXVckhPpvhj/bOA8h5CmAYPV6DqPbruEG4C1q+r3Sb5M9y1nzyS3VtXpQ61QkrRMqurk/vI0/9YP9R0LHDfsutSec6xGxCJbKqwG3NHvynsA3RXO31FVP+mvA7gD8LWqmj/EkiVJyynJC4H30Q0NXj24RY6mB4PVCFgkVO1PN6/qBuCdVXVLkoOAJwLvq6ofJFm1qu4YYsmSpBWUZKyqFg67Dk0Og9UISfLPwEuA3YFzgG8CB1fVpUneDTwM2LuqbhlimZIkaQkMViMiyVrA4XQrAXcGdgQW0G218OqquiTJ+lV17RDLlCRJd8NgNUKSrA48AvhQVT2r31huIfAJumFBd+CVJGmEuSpwhFTVrUluAmYkeTTwYOB04BOGKkmSRp89ViOm77V6Pd2KkQcCO1fVhUMtSpIkLROD1Qjqr2b+ALoLc1417HokSdKyMVhJkiQ1ssqwC5AkSZouDFaSJEmNGKwkSZIaMVhJkiQ1YrCSJElqxGAlSZLUiMFKkiSpkf8PwQ8MlHUQ3OMAAAAASUVORK5CYII=", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "corrmat = df.corr()\n", - "f, ax = plt.subplots(figsize=(12, 9))\n", - "sns.heatmap(corrmat, vmax=.8, square=True);" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.set_theme(style=\"ticks\")\n", - "\n", - "# Show the joint distribution using kernel density estimation\n", - "g = sns.jointplot(\n", - " data=df,\n", - " x=\"popularity\", y=\"danceability\", hue=\"artist_top_genre\",\n", - " kind=\"kde\",\n", - ")" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "/Users/jenniferlooper/Library/Python/3.8/lib/python/site-packages/seaborn/axisgrid.py:337: UserWarning: The `size` parameter has been renamed to `height`; please update your code.\n", - " warnings.warn(msg, UserWarning)\n" - ] - }, - { - "data": { - "text/plain": [ - "" - ] - }, - "execution_count": 13, - "metadata": {}, - "output_type": "execute_result" - }, - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "sns.FacetGrid(df, hue=\"artist_top_genre\", size=5) \\\n", - " .map(plt.scatter, \"popularity\", \"danceability\") \\\n", - " .add_legend()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "interpreter": { - "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6" - }, - "kernelspec": { - "display_name": "Python 3.7.0 64-bit ('3.7')", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.8.9" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "c61deff2839902ac8cb4ed411eb10fee", - "translation_date": "2025-09-03T20:02:34+00:00", - "source_file": "5-Clustering/1-Visualize/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/README.md b/translations/pt/5-Clustering/2-K-Means/README.md deleted file mode 100644 index e29adedfe..000000000 --- a/translations/pt/5-Clustering/2-K-Means/README.md +++ /dev/null @@ -1,261 +0,0 @@ - -# K-Means clustering - -## [Pre-lecture quiz](https://ff-quizzes.netlify.app/en/ml/) - -Nesta lição, vais aprender a criar clusters utilizando Scikit-learn e o conjunto de dados de música nigeriana que importaste anteriormente. Vamos abordar os fundamentos do K-Means para Clustering. Lembra-te de que, como aprendeste na lição anterior, existem várias formas de trabalhar com clusters e o método que utilizas depende dos teus dados. Vamos experimentar o K-Means, pois é a técnica de clustering mais comum. Vamos começar! - -Termos que vais aprender: - -- Pontuação de Silhouette -- Método do cotovelo -- Inércia -- Variância - -## Introdução - -[K-Means Clustering](https://wikipedia.org/wiki/K-means_clustering) é um método derivado do domínio do processamento de sinais. É utilizado para dividir e agrupar conjuntos de dados em 'k' clusters utilizando uma série de observações. Cada observação trabalha para agrupar um determinado ponto de dados mais próximo do seu 'média' mais próxima, ou o ponto central de um cluster. - -Os clusters podem ser visualizados como [diagramas de Voronoi](https://wikipedia.org/wiki/Voronoi_diagram), que incluem um ponto (ou 'semente') e a sua região correspondente. - -![voronoi diagram](../../../../5-Clustering/2-K-Means/images/voronoi.png) - -> Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -O processo de clustering K-Means [executa-se em três etapas](https://scikit-learn.org/stable/modules/clustering.html#k-means): - -1. O algoritmo seleciona um número k de pontos centrais ao amostrar do conjunto de dados. Depois disso, ele repete: - 1. Atribui cada amostra ao centróide mais próximo. - 2. Cria novos centróides ao calcular o valor médio de todas as amostras atribuídas aos centróides anteriores. - 3. Em seguida, calcula a diferença entre os novos e os antigos centróides e repete até que os centróides se estabilizem. - -Uma desvantagem do uso do K-Means é o facto de que precisas de estabelecer 'k', ou seja, o número de centróides. Felizmente, o 'método do cotovelo' ajuda a estimar um bom valor inicial para 'k'. Vais experimentá-lo em breve. - -## Pré-requisito - -Vais trabalhar no ficheiro [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/2-K-Means/notebook.ipynb) desta lição, que inclui a importação de dados e a limpeza preliminar que fizeste na última lição. - -## Exercício - preparação - -Começa por dar outra olhada nos dados das músicas. - -1. Cria um boxplot, chamando `boxplot()` para cada coluna: - - ```python - plt.figure(figsize=(20,20), dpi=200) - - plt.subplot(4,3,1) - sns.boxplot(x = 'popularity', data = df) - - plt.subplot(4,3,2) - sns.boxplot(x = 'acousticness', data = df) - - plt.subplot(4,3,3) - sns.boxplot(x = 'energy', data = df) - - plt.subplot(4,3,4) - sns.boxplot(x = 'instrumentalness', data = df) - - plt.subplot(4,3,5) - sns.boxplot(x = 'liveness', data = df) - - plt.subplot(4,3,6) - sns.boxplot(x = 'loudness', data = df) - - plt.subplot(4,3,7) - sns.boxplot(x = 'speechiness', data = df) - - plt.subplot(4,3,8) - sns.boxplot(x = 'tempo', data = df) - - plt.subplot(4,3,9) - sns.boxplot(x = 'time_signature', data = df) - - plt.subplot(4,3,10) - sns.boxplot(x = 'danceability', data = df) - - plt.subplot(4,3,11) - sns.boxplot(x = 'length', data = df) - - plt.subplot(4,3,12) - sns.boxplot(x = 'release_date', data = df) - ``` - - Estes dados são um pouco ruidosos: ao observar cada coluna como um boxplot, podes ver valores atípicos. - - ![outliers](../../../../5-Clustering/2-K-Means/images/boxplots.png) - -Poderias percorrer o conjunto de dados e remover esses valores atípicos, mas isso tornaria os dados bastante reduzidos. - -1. Por agora, escolhe quais colunas vais usar para o teu exercício de clustering. Escolhe aquelas com intervalos semelhantes e codifica a coluna `artist_top_genre` como dados numéricos: - - ```python - from sklearn.preprocessing import LabelEncoder - le = LabelEncoder() - - X = df.loc[:, ('artist_top_genre','popularity','danceability','acousticness','loudness','energy')] - - y = df['artist_top_genre'] - - X['artist_top_genre'] = le.fit_transform(X['artist_top_genre']) - - y = le.transform(y) - ``` - -1. Agora precisas de escolher quantos clusters vais segmentar. Sabes que existem 3 géneros musicais que extraímos do conjunto de dados, então vamos tentar 3: - - ```python - from sklearn.cluster import KMeans - - nclusters = 3 - seed = 0 - - km = KMeans(n_clusters=nclusters, random_state=seed) - km.fit(X) - - # Predict the cluster for each data point - - y_cluster_kmeans = km.predict(X) - y_cluster_kmeans - ``` - -Vês um array impresso com clusters previstos (0, 1 ou 2) para cada linha do dataframe. - -1. Usa este array para calcular uma 'pontuação de silhouette': - - ```python - from sklearn import metrics - score = metrics.silhouette_score(X, y_cluster_kmeans) - score - ``` - -## Pontuação de Silhouette - -Procura uma pontuação de silhouette mais próxima de 1. Esta pontuação varia de -1 a 1, e se a pontuação for 1, o cluster é denso e bem separado dos outros clusters. Um valor próximo de 0 representa clusters sobrepostos com amostras muito próximas da fronteira de decisão dos clusters vizinhos. [(Fonte)](https://dzone.com/articles/kmeans-silhouette-score-explained-with-python-exam) - -A nossa pontuação é **0.53**, ou seja, está no meio. Isso indica que os nossos dados não são particularmente adequados para este tipo de clustering, mas vamos continuar. - -### Exercício - construir um modelo - -1. Importa `KMeans` e inicia o processo de clustering. - - ```python - from sklearn.cluster import KMeans - wcss = [] - - for i in range(1, 11): - kmeans = KMeans(n_clusters = i, init = 'k-means++', random_state = 42) - kmeans.fit(X) - wcss.append(kmeans.inertia_) - - ``` - - Existem algumas partes aqui que merecem explicação. - - > 🎓 range: Estas são as iterações do processo de clustering. - - > 🎓 random_state: "Determina a geração de números aleatórios para a inicialização dos centróides." [Fonte](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans) - - > 🎓 WCSS: "soma dos quadrados dentro do cluster" mede a distância média quadrada de todos os pontos dentro de um cluster ao centróide do cluster. [Fonte](https://medium.com/@ODSC/unsupervised-learning-evaluating-clusters-bd47eed175ce). - - > 🎓 Inércia: Os algoritmos K-Means tentam escolher centróides para minimizar a 'inércia', "uma medida de quão internamente coerentes são os clusters." [Fonte](https://scikit-learn.org/stable/modules/clustering.html). O valor é adicionado à variável wcss em cada iteração. - - > 🎓 k-means++: Em [Scikit-learn](https://scikit-learn.org/stable/modules/clustering.html#k-means), podes usar a otimização 'k-means++', que "inicializa os centróides para estarem (geralmente) distantes uns dos outros, levando a resultados provavelmente melhores do que a inicialização aleatória." - -### Método do cotovelo - -Anteriormente, deduziste que, como segmentaste 3 géneros musicais, deverias escolher 3 clusters. Mas será que é mesmo o caso? - -1. Usa o 'método do cotovelo' para ter certeza. - - ```python - plt.figure(figsize=(10,5)) - sns.lineplot(x=range(1, 11), y=wcss, marker='o', color='red') - plt.title('Elbow') - plt.xlabel('Number of clusters') - plt.ylabel('WCSS') - plt.show() - ``` - - Usa a variável `wcss` que construíste no passo anterior para criar um gráfico que mostra onde está a 'curvatura' no cotovelo, indicando o número ótimo de clusters. Talvez seja mesmo **3**! - - ![elbow method](../../../../5-Clustering/2-K-Means/images/elbow.png) - -## Exercício - exibir os clusters - -1. Experimenta o processo novamente, desta vez definindo três clusters, e exibe os clusters como um scatterplot: - - ```python - from sklearn.cluster import KMeans - kmeans = KMeans(n_clusters = 3) - kmeans.fit(X) - labels = kmeans.predict(X) - plt.scatter(df['popularity'],df['danceability'],c = labels) - plt.xlabel('popularity') - plt.ylabel('danceability') - plt.show() - ``` - -1. Verifica a precisão do modelo: - - ```python - labels = kmeans.labels_ - - correct_labels = sum(y == labels) - - print("Result: %d out of %d samples were correctly labeled." % (correct_labels, y.size)) - - print('Accuracy score: {0:0.2f}'. format(correct_labels/float(y.size))) - ``` - - A precisão deste modelo não é muito boa, e a forma dos clusters dá-te uma pista do porquê. - - ![clusters](../../../../5-Clustering/2-K-Means/images/clusters.png) - - Estes dados são demasiado desequilibrados, pouco correlacionados e há demasiada variância entre os valores das colunas para formar bons clusters. Na verdade, os clusters que se formam provavelmente são fortemente influenciados ou enviesados pelas três categorias de géneros que definimos acima. Foi um processo de aprendizagem! - - Na documentação do Scikit-learn, podes ver que um modelo como este, com clusters não muito bem demarcados, tem um problema de 'variância': - - ![problem models](../../../../5-Clustering/2-K-Means/images/problems.png) - > Infográfico do Scikit-learn - -## Variância - -A variância é definida como "a média das diferenças quadradas em relação à média" [(Fonte)](https://www.mathsisfun.com/data/standard-deviation.html). No contexto deste problema de clustering, refere-se a dados em que os números do nosso conjunto tendem a divergir um pouco demais da média. - -✅ Este é um ótimo momento para pensar em todas as formas de corrigir este problema. Ajustar os dados um pouco mais? Usar colunas diferentes? Utilizar um algoritmo diferente? Dica: Experimenta [escalar os teus dados](https://www.mygreatlearning.com/blog/learning-data-science-with-k-means-clustering/) para normalizá-los e testar outras colunas. - -> Experimenta este '[calculador de variância](https://www.calculatorsoup.com/calculators/statistics/variance-calculator.php)' para entender melhor o conceito. - ---- - -## 🚀Desafio - -Passa algum tempo com este notebook, ajustando os parâmetros. Consegues melhorar a precisão do modelo ao limpar mais os dados (removendo valores atípicos, por exemplo)? Podes usar pesos para dar mais importância a determinadas amostras de dados. O que mais podes fazer para criar melhores clusters? - -Dica: Experimenta escalar os teus dados. Há código comentado no notebook que adiciona escalonamento padrão para fazer com que as colunas de dados se assemelhem mais em termos de intervalo. Vais perceber que, embora a pontuação de silhouette diminua, a 'curvatura' no gráfico do cotovelo suaviza-se. Isso acontece porque deixar os dados sem escala permite que dados com menos variância tenham mais peso. Lê mais sobre este problema [aqui](https://stats.stackexchange.com/questions/21222/are-mean-normalization-and-feature-scaling-needed-for-k-means-clustering/21226#21226). - -## [Post-lecture quiz](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Dá uma olhada num Simulador de K-Means [como este](https://user.ceng.metu.edu.tr/~akifakkus/courses/ceng574/k-means/). Podes usar esta ferramenta para visualizar pontos de dados de amostra e determinar os seus centróides. Podes editar a aleatoriedade dos dados, o número de clusters e o número de centróides. Isso ajuda-te a ter uma ideia de como os dados podem ser agrupados? - -Além disso, consulta [este documento sobre K-Means](https://stanford.edu/~cpiech/cs221/handouts/kmeans.html) da Stanford. - -## Tarefa - -[Experimenta diferentes métodos de clustering](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/assignment.md b/translations/pt/5-Clustering/2-K-Means/assignment.md deleted file mode 100644 index a03137311..000000000 --- a/translations/pt/5-Clustering/2-K-Means/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Experimente diferentes métodos de clustering - -## Instruções - -Nesta lição, aprendeste sobre o clustering K-Means. Por vezes, o K-Means não é adequado para os teus dados. Cria um notebook utilizando dados destas lições ou de outra fonte (dá crédito à fonte) e apresenta um método de clustering diferente que NÃO utilize K-Means. O que aprendeste? - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita Melhorias | -| --------- | --------------------------------------------------------------- | -------------------------------------------------------------------- | ---------------------------- | -| | Um notebook é apresentado com um modelo de clustering bem documentado | Um notebook é apresentado sem boa documentação e/ou incompleto | Trabalho incompleto é submetido | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/notebook.ipynb b/translations/pt/5-Clustering/2-K-Means/notebook.ipynb deleted file mode 100644 index 19186963f..000000000 --- a/translations/pt/5-Clustering/2-K-Means/notebook.ipynb +++ /dev/null @@ -1,231 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "3e5c8ab363e8d88f566d4365efc7e0bd", - "translation_date": "2025-09-03T20:10:08+00:00", - "source_file": "5-Clustering/2-K-Means/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: seaborn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.11.1)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.19.2)\n", - "Requirement already satisfied: pandas>=0.23 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.1.2)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.4.1)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (3.1.0)\n", - "Requirement already satisfied: python-dateutil>=2.7.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2.8.0)\n", - "Requirement already satisfied: pytz>=2017.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2019.1)\n", - "Requirement already satisfied: cycler>=0.10 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (0.10.0)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (1.1.0)\n", - "Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (2.4.0)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from python-dateutil>=2.7.3->pandas>=0.23->seaborn) (1.12.0)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib>=2.2->seaborn) (45.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install seaborn" - ] - }, - { - "source": [ - "Comece onde terminámos na última lição, com os dados importados e filtrados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n
" - }, - "metadata": {}, - "execution_count": 6 - } - ], - "source": [ - "\n", - "import matplotlib.pyplot as plt\n", - "import pandas as pd\n", - "import seaborn as sns\n", - "\n", - "\n", - "df = pd.read_csv(\"../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "source": [ - "Vamos focar apenas em 3 géneros. Talvez consigamos criar 3 clusters!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "metadata": {}, - "execution_count": 7 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "5 Kasala Pioneers \n", - "6 Pull Up Everything Pretty \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "5 DRB Lasgidi nigerian pop 2020 184800 26 \n", - "6 prettyboydo nigerian pop 2018 202648 29 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "5 0.803 0.1270 0.525 0.000007 0.1290 -10.034 \n", - "6 0.818 0.4520 0.587 0.004490 0.5900 -9.840 \n", - "\n", - " speechiness tempo time_signature \n", - "1 0.3600 129.993 3 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 \n", - "5 0.1970 100.103 4 \n", - "6 0.1990 95.842 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
5KasalaPioneersDRB Lasgidinigerian pop2020184800260.8030.12700.5250.0000070.1290-10.0340.1970100.1034
6Pull UpEverything Prettyprettyboydonigerian pop2018202648290.8180.45200.5870.0044900.5900-9.8400.199095.8424
\n
" - }, - "metadata": {}, - "execution_count": 8 - } - ], - "source": [ - "df.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/solution/Julia/README.md b/translations/pt/5-Clustering/2-K-Means/solution/Julia/README.md deleted file mode 100644 index c6c2da477..000000000 --- a/translations/pt/5-Clustering/2-K-Means/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb b/translations/pt/5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb deleted file mode 100644 index ab084bb74..000000000 --- a/translations/pt/5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb +++ /dev/null @@ -1,640 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 0, - "metadata": { - "anaconda-cloud": "", - "kernelspec": { - "display_name": "R", - "language": "R", - "name": "ir" - }, - "language_info": { - "codemirror_mode": "r", - "file_extension": ".r", - "mimetype": "text/x-r-source", - "name": "R", - "pygments_lexer": "r", - "version": "3.4.1" - }, - "colab": { - "name": "lesson_14.ipynb", - "provenance": [], - "collapsed_sections": [], - "toc_visible": true - }, - "coopTranslator": { - "original_hash": "ad65fb4aad0a156b42216e4929f490fc", - "translation_date": "2025-09-03T20:16:16+00:00", - "source_file": "5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "GULATlQXLXyR" - }, - "source": [ - "## Explore K-Means clustering usando R e princípios de dados organizados.\n", - "\n", - "### [**Questionário pré-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/29/)\n", - "\n", - "Nesta lição, vais aprender a criar clusters utilizando o pacote Tidymodels e outros pacotes do ecossistema R (vamos chamá-los de amigos 🧑‍🤝‍🧑), e o conjunto de dados de música nigeriana que importaste anteriormente. Vamos abordar os fundamentos do K-Means para Clustering. Lembra-te de que, como aprendeste na lição anterior, existem várias formas de trabalhar com clusters e o método que utilizas depende dos teus dados. Vamos experimentar o K-Means, pois é a técnica de clustering mais comum. Vamos começar!\n", - "\n", - "Termos que vais aprender:\n", - "\n", - "- Pontuação de Silhueta\n", - "\n", - "- Método do Cotovelo\n", - "\n", - "- Inércia\n", - "\n", - "- Variância\n", - "\n", - "### **Introdução**\n", - "\n", - "[K-Means Clustering](https://wikipedia.org/wiki/K-means_clustering) é um método derivado do domínio do processamento de sinais. É utilizado para dividir e agrupar conjuntos de dados em `k clusters` com base em semelhanças nas suas características.\n", - "\n", - "Os clusters podem ser visualizados como [Diagramas de Voronoi](https://wikipedia.org/wiki/Voronoi_diagram), que incluem um ponto (ou 'semente') e a sua região correspondente.\n", - "\n", - "

\n", - " \n", - "

Infográfico por Jen Looper
\n", - "\n", - "\n", - "O clustering K-Means segue os seguintes passos:\n", - "\n", - "1. O cientista de dados começa por especificar o número desejado de clusters a serem criados.\n", - "\n", - "2. Em seguida, o algoritmo seleciona aleatoriamente K observações do conjunto de dados para servir como os centros iniciais dos clusters (ou seja, os centróides).\n", - "\n", - "3. Depois, cada uma das observações restantes é atribuída ao centróide mais próximo.\n", - "\n", - "4. A seguir, a nova média de cada cluster é calculada e o centróide é movido para essa média.\n", - "\n", - "5. Agora que os centros foram recalculados, cada observação é novamente verificada para ver se pode estar mais próxima de um cluster diferente. Todos os objetos são novamente reatribuídos utilizando as médias atualizadas dos clusters. Os passos de atribuição de clusters e atualização dos centróides são repetidos iterativamente até que as atribuições de clusters deixem de mudar (ou seja, quando se alcança a convergência). Normalmente, o algoritmo termina quando cada nova iteração resulta em um movimento insignificante dos centróides e os clusters tornam-se estáticos.\n", - "\n", - "
\n", - "\n", - "> Nota que, devido à randomização das observações iniciais k utilizadas como centróides iniciais, podemos obter resultados ligeiramente diferentes cada vez que aplicamos o procedimento. Por esta razão, a maioria dos algoritmos utiliza vários *inícios aleatórios* e escolhe a iteração com o menor WCSS. Assim, é fortemente recomendado executar o K-Means com vários valores de *nstart* para evitar um *ótimo local indesejável.*\n", - "\n", - "
\n", - "\n", - "Esta curta animação utilizando a [arte](https://github.com/allisonhorst/stats-illustrations) de Allison Horst explica o processo de clustering:\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n", - "\n", - "\n", - "\n", - "Uma questão fundamental que surge no clustering é esta: como sabes quantos clusters deves separar nos teus dados? Uma desvantagem do uso do K-Means é o facto de que precisas de estabelecer `k`, ou seja, o número de `centróides`. Felizmente, o `método do cotovelo` ajuda a estimar um bom valor inicial para `k`. Vais experimentá-lo em breve.\n", - "\n", - "### \n", - "\n", - "**Pré-requisito**\n", - "\n", - "Vamos começar exatamente de onde parámos na [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb), onde analisámos o conjunto de dados, fizemos várias visualizações e filtrámos o conjunto de dados para observações de interesse. Certifica-te de que o revisitas!\n", - "\n", - "Vamos precisar de alguns pacotes para completar este módulo. Podes instalá-los com: `install.packages(c('tidyverse', 'tidymodels', 'cluster', 'summarytools', 'plotly', 'paletteer', 'factoextra', 'patchwork'))`\n", - "\n", - "Alternativamente, o script abaixo verifica se tens os pacotes necessários para completar este módulo e instala-os para ti caso alguns estejam em falta.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "ah_tBi58LXyi" - }, - "source": [ - "suppressWarnings(if(!require(\"pacman\")) install.packages(\"pacman\"))\n", - "\n", - "pacman::p_load('tidyverse', 'tidymodels', 'cluster', 'summarytools', 'plotly', 'paletteer', 'factoextra', 'patchwork')\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "7e--UCUTLXym" - }, - "source": [ - "Vamos começar com tudo!\n", - "\n", - "## 1. Uma dança com dados: Reduzir aos 3 géneros musicais mais populares\n", - "\n", - "Este é um resumo do que fizemos na lição anterior. Vamos explorar e analisar alguns dados!\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Ycamx7GGLXyn" - }, - "source": [ - "# Load the core tidyverse and make it available in your current R session\n", - "library(tidyverse)\n", - "\n", - "# Import the data into a tibble\n", - "df <- read_csv(file = \"https://raw.githubusercontent.com/microsoft/ML-For-Beginners/main/5-Clustering/data/nigerian-songs.csv\", show_col_types = FALSE)\n", - "\n", - "# Narrow down to top 3 popular genres\n", - "nigerian_songs <- df %>% \n", - " # Concentrate on top 3 genres\n", - " filter(artist_top_genre %in% c(\"afro dancehall\", \"afropop\",\"nigerian pop\")) %>% \n", - " # Remove unclassified observations\n", - " filter(popularity != 0)\n", - "\n", - "\n", - "\n", - "# Visualize popular genres using bar plots\n", - "theme_set(theme_light())\n", - "nigerian_songs %>%\n", - " count(artist_top_genre) %>%\n", - " ggplot(mapping = aes(x = artist_top_genre, y = n,\n", - " fill = artist_top_genre)) +\n", - " geom_col(alpha = 0.8) +\n", - " paletteer::scale_fill_paletteer_d(\"ggsci::category10_d3\") +\n", - " ggtitle(\"Top genres\") +\n", - " theme(plot.title = element_text(hjust = 0.5))\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "b5h5zmkPLXyp" - }, - "source": [ - "🤩 Isso correu bem!\n", - "\n", - "## 2. Mais exploração de dados.\n", - "\n", - "Quão limpos estão estes dados? Vamos verificar a existência de valores atípicos utilizando boxplots. Vamos concentrar-nos em colunas numéricas com menos valores atípicos (embora seja possível limpar os valores atípicos). Os boxplots podem mostrar o intervalo dos dados e ajudar a escolher quais colunas usar. Note que os boxplots não mostram a variância, um elemento importante para dados bem agrupáveis. Por favor, veja [esta discussão](https://stats.stackexchange.com/questions/91536/deduce-variance-from-boxplot) para leitura adicional.\n", - "\n", - "[Boxplots](https://en.wikipedia.org/wiki/Box_plot) são usados para representar graficamente a distribuição de dados `numéricos`, então vamos começar por *selecionar* todas as colunas numéricas juntamente com os géneros musicais populares.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "HhNreJKLLXyq" - }, - "source": [ - "# Select top genre column and all other numeric columns\n", - "df_numeric <- nigerian_songs %>% \n", - " select(artist_top_genre, where(is.numeric)) \n", - "\n", - "# Display the data\n", - "df_numeric %>% \n", - " slice_head(n = 5)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "uYXrwJRaLXyq" - }, - "source": [ - "Veja como o auxiliar de seleção `where` torna isso fácil 💁? Explore outras funções semelhantes [aqui](https://tidyselect.r-lib.org/).\n", - "\n", - "Como vamos criar um boxplot para cada característica numérica e queremos evitar o uso de loops, vamos reformular os nossos dados para um formato *mais longo* que nos permitirá tirar proveito de `facets` - subgráficos que exibem cada subconjunto dos dados.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "gd5bR3f8LXys" - }, - "source": [ - "# Pivot data from wide to long\n", - "df_numeric_long <- df_numeric %>% \n", - " pivot_longer(!artist_top_genre, names_to = \"feature_names\", values_to = \"values\") \n", - "\n", - "# Print out data\n", - "df_numeric_long %>% \n", - " slice_head(n = 15)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "-7tE1swnLXyv" - }, - "source": [ - "Muito mais longo! Agora é hora de alguns `ggplots`! Então, que `geom` vamos usar?\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "r88bIsyuLXyy" - }, - "source": [ - "# Make a box plot\n", - "df_numeric_long %>% \n", - " ggplot(mapping = aes(x = feature_names, y = values, fill = feature_names)) +\n", - " geom_boxplot() +\n", - " facet_wrap(~ feature_names, ncol = 4, scales = \"free\") +\n", - " theme(legend.position = \"none\")\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "EYVyKIUELXyz" - }, - "source": [ - "Agora podemos ver que estes dados estão um pouco ruidosos: ao observar cada coluna como um boxplot, é possível identificar valores atípicos. Poderíamos percorrer o conjunto de dados e remover esses valores atípicos, mas isso tornaria os dados bastante reduzidos.\n", - "\n", - "Por agora, vamos escolher quais colunas utilizaremos para o nosso exercício de clustering. Vamos selecionar as colunas numéricas com intervalos semelhantes. Poderíamos codificar o `artist_top_genre` como numérico, mas vamos descartá-lo por enquanto.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "-wkpINyZLXy0" - }, - "source": [ - "# Select variables with similar ranges\n", - "df_numeric_select <- df_numeric %>% \n", - " select(popularity, danceability, acousticness, loudness, energy) \n", - "\n", - "# Normalize data\n", - "# df_numeric_select <- scale(df_numeric_select)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "D7dLzgpqLXy1" - }, - "source": [ - "## 3. Computação de clustering k-means em R\n", - "\n", - "Podemos calcular k-means em R utilizando a função integrada `kmeans`, veja `help(\"kmeans()\")`. A função `kmeans()` aceita um data frame com todas as colunas numéricas como seu argumento principal.\n", - "\n", - "O primeiro passo ao usar clustering k-means é especificar o número de clusters (k) que serão gerados na solução final. Sabemos que existem 3 géneros musicais que extraímos do conjunto de dados, então vamos tentar com 3:\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "uC4EQ5w7LXy5" - }, - "source": [ - "set.seed(2056)\n", - "# Kmeans clustering for 3 clusters\n", - "kclust <- kmeans(\n", - " df_numeric_select,\n", - " # Specify the number of clusters\n", - " centers = 3,\n", - " # How many random initial configurations\n", - " nstart = 25\n", - ")\n", - "\n", - "# Display clustering object\n", - "kclust\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "hzfhscWrLXy-" - }, - "source": [ - "O objeto kmeans contém várias informações que estão bem explicadas em `help(\"kmeans()\")`. Por agora, vamos concentrar-nos em algumas. Vemos que os dados foram agrupados em 3 clusters com tamanhos de 65, 110, 111. O resultado também contém os centros dos clusters (médias) para os 3 grupos ao longo das 5 variáveis.\n", - "\n", - "O vetor de clustering é a atribuição de cluster para cada observação. Vamos usar a função `augment` para adicionar a atribuição de cluster ao conjunto de dados original.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "0XwwpFGQLXy_" - }, - "source": [ - "# Add predicted cluster assignment to data set\n", - "augment(kclust, df_numeric_select) %>% \n", - " relocate(.cluster) %>% \n", - " slice_head(n = 10)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "NXIVXXACLXzA" - }, - "source": [ - "Perfeito, acabámos de dividir o nosso conjunto de dados em 3 grupos. Então, quão bom é o nosso agrupamento 🤷? Vamos dar uma olhada no `Silhouette score`.\n", - "\n", - "### **Silhouette score**\n", - "\n", - "[A análise de Silhouette](https://en.wikipedia.org/wiki/Silhouette_(clustering)) pode ser usada para estudar a distância de separação entre os clusters resultantes. Este score varia de -1 a 1, e se o score estiver próximo de 1, o cluster é denso e bem separado dos outros clusters. Um valor próximo de 0 representa clusters sobrepostos com amostras muito próximas da fronteira de decisão dos clusters vizinhos. [fonte](https://dzone.com/articles/kmeans-silhouette-score-explained-with-python-exam).\n", - "\n", - "O método de silhouette médio calcula a média do silhouette das observações para diferentes valores de *k*. Um score médio de silhouette elevado indica um bom agrupamento.\n", - "\n", - "A função `silhouette` no pacote de cluster é usada para calcular a largura média do silhouette.\n", - "\n", - "> O silhouette pode ser calculado com qualquer [métrica de distância](https://en.wikipedia.org/wiki/Distance \"Distance\"), como a [distância Euclidiana](https://en.wikipedia.org/wiki/Euclidean_distance \"Euclidean distance\") ou a [distância Manhattan](https://en.wikipedia.org/wiki/Manhattan_distance \"Manhattan distance\"), que discutimos na [lição anterior](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/1-Visualize/solution/R/lesson_14-R.ipynb).\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "Jn0McL28LXzB" - }, - "source": [ - "# Load cluster package\n", - "library(cluster)\n", - "\n", - "# Compute average silhouette score\n", - "ss <- silhouette(kclust$cluster,\n", - " # Compute euclidean distance\n", - " dist = dist(df_numeric_select))\n", - "mean(ss[, 3])\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "QyQRn97nLXzC" - }, - "source": [ - "A nossa pontuação é **0,549**, ou seja, bem no meio. Isto indica que os nossos dados não são particularmente adequados para este tipo de agrupamento. Vamos ver se conseguimos confirmar esta suspeita visualmente. O [pacote factoextra](https://rpkgs.datanovia.com/factoextra/index.html) fornece funções (`fviz_cluster()`) para visualizar agrupamentos.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "7a6Km1_FLXzD" - }, - "source": [ - "library(factoextra)\n", - "\n", - "# Visualize clustering results\n", - "fviz_cluster(kclust, df_numeric_select)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "IBwCWt-0LXzD" - }, - "source": [ - "A sobreposição nos clusters indica que os nossos dados não são particularmente adequados para este tipo de clustering, mas vamos continuar.\n", - "\n", - "## 4. Determinar o número ideal de clusters\n", - "\n", - "Uma questão fundamental que frequentemente surge no clustering K-Means é esta: sem etiquetas de classe conhecidas, como saber quantos clusters usar para separar os seus dados?\n", - "\n", - "Uma forma de tentar descobrir é usar uma amostra de dados para `criar uma série de modelos de clustering` com um número crescente de clusters (por exemplo, de 1 a 10) e avaliar métricas de clustering como o **Silhouette score.**\n", - "\n", - "Vamos determinar o número ideal de clusters calculando o algoritmo de clustering para diferentes valores de *k* e avaliando o **Within Cluster Sum of Squares** (WCSS). O total de soma de quadrados dentro do cluster (WCSS) mede a compacidade do clustering, e queremos que seja o menor possível, com valores mais baixos significando que os pontos de dados estão mais próximos.\n", - "\n", - "Vamos explorar o efeito de diferentes escolhas de `k`, de 1 a 10, neste clustering.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "hSeIiylDLXzE" - }, - "source": [ - "# Create a series of clustering models\n", - "kclusts <- tibble(k = 1:10) %>% \n", - " # Perform kmeans clustering for 1,2,3 ... ,10 clusters\n", - " mutate(model = map(k, ~ kmeans(df_numeric_select, centers = .x, nstart = 25)),\n", - " # Farm out clustering metrics eg WCSS\n", - " glanced = map(model, ~ glance(.x))) %>% \n", - " unnest(cols = glanced)\n", - " \n", - "\n", - "# View clustering rsulsts\n", - "kclusts\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "m7rS2U1eLXzE" - }, - "source": [ - "Agora que temos o total da soma dos quadrados dentro dos clusters (tot.withinss) para cada algoritmo de clustering com centro *k*, utilizamos o [método do cotovelo](https://en.wikipedia.org/wiki/Elbow_method_(clustering)) para encontrar o número ideal de clusters. O método consiste em traçar o WCSS como uma função do número de clusters e escolher o [cotovelo da curva](https://en.wikipedia.org/wiki/Elbow_of_the_curve \"Cotovelo da curva\") como o número de clusters a ser utilizado.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "o_DjHGItLXzF" - }, - "source": [ - "set.seed(2056)\n", - "# Use elbow method to determine optimum number of clusters\n", - "kclusts %>% \n", - " ggplot(mapping = aes(x = k, y = tot.withinss)) +\n", - " geom_line(size = 1.2, alpha = 0.8, color = \"#FF7F0EFF\") +\n", - " geom_point(size = 2, color = \"#FF7F0EFF\")\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "pLYyt5XSLXzG" - }, - "source": [ - "O gráfico mostra uma grande redução no WCSS (ou seja, maior *coerência*) à medida que o número de clusters aumenta de um para dois, e uma redução adicional notável de dois para três clusters. Depois disso, a redução torna-se menos acentuada, resultando num `cotovelo` 💪 no gráfico por volta de três clusters. Isto é uma boa indicação de que existem dois a três clusters de pontos de dados razoavelmente bem separados.\n", - "\n", - "Podemos agora avançar e extrair o modelo de clustering onde `k = 3`:\n", - "\n", - "> `pull()`: usado para extrair uma única coluna\n", - ">\n", - "> `pluck()`: usado para indexar estruturas de dados como listas\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "JP_JPKBILXzG" - }, - "source": [ - "# Extract k = 3 clustering\n", - "final_kmeans <- kclusts %>% \n", - " filter(k == 3) %>% \n", - " pull(model) %>% \n", - " pluck(1)\n", - "\n", - "\n", - "final_kmeans\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "l_PDTu8tLXzI" - }, - "source": [ - "Ótimo! Vamos visualizar os clusters obtidos. Que tal adicionar um pouco de interatividade usando `plotly`?\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "dNcleFe-LXzJ" - }, - "source": [ - "# Add predicted cluster assignment to data set\n", - "results <- augment(final_kmeans, df_numeric_select) %>% \n", - " bind_cols(df_numeric %>% select(artist_top_genre)) \n", - "\n", - "# Plot cluster assignments\n", - "clust_plt <- results %>% \n", - " ggplot(mapping = aes(x = popularity, y = danceability, color = .cluster, shape = artist_top_genre)) +\n", - " geom_point(size = 2, alpha = 0.8) +\n", - " paletteer::scale_color_paletteer_d(\"ggthemes::Tableau_10\")\n", - "\n", - "ggplotly(clust_plt)\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "6JUM_51VLXzK" - }, - "source": [ - "Talvez esperássemos que cada grupo (representado por cores diferentes) tivesse géneros distintos (representados por formas diferentes).\n", - "\n", - "Vamos analisar a precisão do modelo.\n" - ] - }, - { - "cell_type": "code", - "metadata": { - "id": "HdIMUGq7LXzL" - }, - "source": [ - "# Assign genres to predefined integers\n", - "label_count <- results %>% \n", - " group_by(artist_top_genre) %>% \n", - " mutate(id = cur_group_id()) %>% \n", - " ungroup() %>% \n", - " summarise(correct_labels = sum(.cluster == id))\n", - "\n", - "\n", - "# Print results \n", - "cat(\"Result:\", label_count$correct_labels, \"out of\", nrow(results), \"samples were correctly labeled.\")\n", - "\n", - "cat(\"\\nAccuracy score:\", label_count$correct_labels/nrow(results))\n" - ], - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "C50wvaAOLXzM" - }, - "source": [ - "A precisão deste modelo não é má, mas também não é excelente. Pode ser que os dados não sejam adequados para o K-Means Clustering. Estes dados são demasiado desequilibrados, pouco correlacionados e há muita variância entre os valores das colunas para formar clusters eficazes. Na verdade, os clusters que se formam provavelmente são fortemente influenciados ou enviesados pelas três categorias de género que definimos acima.\n", - "\n", - "Ainda assim, foi um processo de aprendizagem interessante!\n", - "\n", - "Na documentação do Scikit-learn, pode-se ver que um modelo como este, com clusters pouco bem definidos, tem um problema de 'variância':\n", - "\n", - "

\n", - " \n", - "

Infográfico do Scikit-learn
\n", - "\n", - "\n", - "\n", - "## **Variância**\n", - "\n", - "A variância é definida como \"a média das diferenças quadradas em relação à média\" [fonte](https://www.mathsisfun.com/data/standard-deviation.html). No contexto deste problema de clustering, refere-se aos dados em que os números do nosso conjunto tendem a divergir um pouco demais da média.\n", - "\n", - "✅ Este é um ótimo momento para pensar em todas as formas de corrigir este problema. Ajustar os dados um pouco mais? Usar colunas diferentes? Utilizar um algoritmo diferente? Dica: Experimente [escalar os seus dados](https://www.mygreatlearning.com/blog/learning-data-science-with-k-means-clustering/) para normalizá-los e testar outras colunas.\n", - "\n", - "> Experimente este '[calculador de variância](https://www.calculatorsoup.com/calculators/statistics/variance-calculator.php)' para compreender melhor o conceito.\n", - "\n", - "------------------------------------------------------------------------\n", - "\n", - "## **🚀Desafio**\n", - "\n", - "Dedique algum tempo a este notebook, ajustando os parâmetros. Consegue melhorar a precisão do modelo ao limpar mais os dados (removendo outliers, por exemplo)? Pode usar pesos para dar mais importância a determinadas amostras de dados. O que mais pode fazer para criar clusters melhores?\n", - "\n", - "Dica: Experimente escalar os seus dados. Há código comentado no notebook que adiciona escalonamento padrão para fazer com que as colunas de dados se assemelhem mais em termos de intervalo. Vai perceber que, embora o score de silhueta diminua, o 'cotovelo' no gráfico suaviza-se. Isto acontece porque deixar os dados sem escala permite que dados com menos variância tenham mais peso. Leia mais sobre este problema [aqui](https://stats.stackexchange.com/questions/21222/are-mean-normalization-and-feature-scaling-needed-for-k-means-clustering/21226#21226).\n", - "\n", - "## [**Questionário pós-aula**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/30/)\n", - "\n", - "## **Revisão & Autoestudo**\n", - "\n", - "- Dê uma olhada num Simulador de K-Means [como este](https://user.ceng.metu.edu.tr/~akifakkus/courses/ceng574/k-means/). Pode usar esta ferramenta para visualizar pontos de dados de amostra e determinar os seus centróides. Pode editar a aleatoriedade dos dados, o número de clusters e o número de centróides. Isto ajuda-o a ter uma ideia de como os dados podem ser agrupados?\n", - "\n", - "- Além disso, veja [este documento sobre K-Means](https://stanford.edu/~cpiech/cs221/handouts/kmeans.html) da Stanford.\n", - "\n", - "Quer testar as suas novas competências de clustering em conjuntos de dados que se adaptam bem ao K-Means clustering? Veja:\n", - "\n", - "- [Treinar e Avaliar Modelos de Clustering](https://rpubs.com/eR_ic/clustering) usando Tidymodels e amigos\n", - "\n", - "- [Análise de Cluster K-Means](https://uc-r.github.io/kmeans_clustering), UC Business Analytics R Programming Guide\n", - "\n", - "- [Clustering K-Means com princípios de dados organizados](https://www.tidymodels.org/learn/statistics/k-means/)\n", - "\n", - "## **Tarefa**\n", - "\n", - "[Experimente diferentes métodos de clustering](https://github.com/microsoft/ML-For-Beginners/blob/main/5-Clustering/2-K-Means/assignment.md)\n", - "\n", - "## AGRADECIMENTOS A:\n", - "\n", - "[Jen Looper](https://www.twitter.com/jenlooper) por criar a versão original em Python deste módulo ♥️\n", - "\n", - "[`Allison Horst`](https://twitter.com/allison_horst/) por criar as ilustrações incríveis que tornam o R mais acolhedor e envolvente. Encontre mais ilustrações na sua [galeria](https://www.google.com/url?q=https://github.com/allisonhorst/stats-illustrations&sa=D&source=editors&ust=1626380772530000&usg=AOvVaw3zcfyCizFQZpkSLzxiiQEM).\n", - "\n", - "Boas aprendizagens,\n", - "\n", - "[Eric](https://twitter.com/ericntay), Embaixador Estudante Gold da Microsoft Learn.\n", - "\n", - "

\n", - " \n", - "

Arte por @allison_horst
\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/solution/notebook.ipynb b/translations/pt/5-Clustering/2-K-Means/solution/notebook.ipynb deleted file mode 100644 index e41553eaf..000000000 --- a/translations/pt/5-Clustering/2-K-Means/solution/notebook.ipynb +++ /dev/null @@ -1,546 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "e867e87e3129c8875423a82945f4ad5e", - "translation_date": "2025-09-03T20:11:14+00:00", - "source_file": "5-Clustering/2-K-Means/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: seaborn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.11.1)\n", - "Requirement already satisfied: pandas>=0.23 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.1.2)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (3.1.0)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.4.1)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.19.2)\n", - "Requirement already satisfied: python-dateutil>=2.7.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2.8.0)\n", - "Requirement already satisfied: pytz>=2017.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2019.1)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (1.1.0)\n", - "Requirement already satisfied: cycler>=0.10 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (0.10.0)\n", - "Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (2.4.0)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from python-dateutil>=2.7.3->pandas>=0.23->seaborn) (1.12.0)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib>=2.2->seaborn) (45.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install seaborn" - ] - }, - { - "source": [ - "Comece onde terminámos na última aula, com os dados importados e filtrados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n
" - }, - "metadata": {}, - "execution_count": 11 - } - ], - "source": [ - "\n", - "import matplotlib.pyplot as plt\n", - "import pandas as pd\n", - "import seaborn as sns\n", - "\n", - "\n", - "df = pd.read_csv(\"../../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "source": [ - "Vamos focar apenas em 3 géneros. Talvez consigamos criar 3 clusters!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "metadata": {}, - "execution_count": 12 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "5 Kasala Pioneers \n", - "6 Pull Up Everything Pretty \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "5 DRB Lasgidi nigerian pop 2020 184800 26 \n", - "6 prettyboydo nigerian pop 2018 202648 29 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "5 0.803 0.1270 0.525 0.000007 0.1290 -10.034 \n", - "6 0.818 0.4520 0.587 0.004490 0.5900 -9.840 \n", - "\n", - " speechiness tempo time_signature \n", - "1 0.3600 129.993 3 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 \n", - "5 0.1970 100.103 4 \n", - "6 0.1990 95.842 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
5KasalaPioneersDRB Lasgidinigerian pop2020184800260.8030.12700.5250.0000070.1290-10.0340.1970100.1034
6Pull UpEverything Prettyprettyboydonigerian pop2018202648290.8180.45200.5870.0044900.5900-9.8400.199095.8424
\n
" - }, - "metadata": {}, - "execution_count": 13 - } - ], - "source": [ - "df.head()" - ] - }, - { - "source": [ - "Quão limpos estão estes dados? Verifique a existência de outliers utilizando boxplots. Vamos concentrar-nos nas colunas com menos outliers (embora possa limpar os outliers). Os boxplots podem mostrar o intervalo dos dados e ajudar a escolher quais colunas utilizar. Note que os boxplots não mostram a variância, um elemento importante para dados bem agrupáveis (https://stats.stackexchange.com/questions/91536/deduce-variance-from-boxplot)\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "" - ] - }, - "metadata": {}, - "execution_count": 14 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.figure(figsize=(20,20), dpi=200)\n", - "\n", - "plt.subplot(4,3,1)\n", - "sns.boxplot(x = 'popularity', data = df)\n", - "\n", - "plt.subplot(4,3,2)\n", - "sns.boxplot(x = 'acousticness', data = df)\n", - "\n", - "plt.subplot(4,3,3)\n", - "sns.boxplot(x = 'energy', data = df)\n", - "\n", - "plt.subplot(4,3,4)\n", - "sns.boxplot(x = 'instrumentalness', data = df)\n", - "\n", - "plt.subplot(4,3,5)\n", - "sns.boxplot(x = 'liveness', data = df)\n", - "\n", - "plt.subplot(4,3,6)\n", - "sns.boxplot(x = 'loudness', data = df)\n", - "\n", - "plt.subplot(4,3,7)\n", - "sns.boxplot(x = 'speechiness', data = df)\n", - "\n", - "plt.subplot(4,3,8)\n", - "sns.boxplot(x = 'tempo', data = df)\n", - "\n", - "plt.subplot(4,3,9)\n", - "sns.boxplot(x = 'time_signature', data = df)\n", - "\n", - "plt.subplot(4,3,10)\n", - "sns.boxplot(x = 'danceability', data = df)\n", - "\n", - "plt.subplot(4,3,11)\n", - "sns.boxplot(x = 'length', data = df)\n", - "\n", - "plt.subplot(4,3,12)\n", - "sns.boxplot(x = 'release_date', data = df)" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import LabelEncoder, StandardScaler\n", - "le = LabelEncoder()\n", - "\n", - "# scaler = StandardScaler()\n", - "\n", - "X = df.loc[:, ('artist_top_genre','popularity','danceability','acousticness','loudness','energy')]\n", - "\n", - "y = df['artist_top_genre']\n", - "\n", - "X['artist_top_genre'] = le.fit_transform(X['artist_top_genre'])\n", - "\n", - "# X = scaler.fit_transform(X)\n", - "\n", - "y = le.transform(y)\n", - "\n" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array([2, 1, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 2, 0, 2, 1, 1, 0, 1, 0, 0,\n", - " 0, 1, 0, 2, 0, 0, 2, 2, 1, 1, 0, 2, 2, 2, 2, 1, 1, 0, 2, 0, 2, 0,\n", - " 2, 0, 0, 1, 1, 2, 1, 0, 0, 2, 2, 2, 2, 1, 1, 0, 1, 2, 2, 1, 2, 2,\n", - " 1, 2, 1, 2, 2, 1, 1, 1, 1, 1, 2, 1, 2, 2, 0, 2, 1, 1, 1, 2, 2, 2,\n", - " 2, 1, 2, 2, 2, 2, 1, 1, 2, 1, 1, 2, 1, 2, 1, 2, 1, 2, 2, 1, 2, 0,\n", - " 1, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 0, 1, 1, 1, 1, 0, 1, 2, 1, 2,\n", - " 1, 2, 2, 2, 0, 2, 1, 1, 1, 2, 1, 0, 1, 2, 2, 1, 1, 1, 0, 1, 2, 2,\n", - " 2, 1, 1, 0, 1, 2, 1, 1, 1, 1, 2, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 2,\n", - " 0, 1, 0, 0, 1, 0, 0, 2, 0, 0, 1, 1, 2, 0, 2, 2, 0, 2, 2, 1, 1, 0,\n", - " 1, 1, 0, 0, 1, 0, 2, 0, 1, 0, 2, 0, 0, 2, 2, 2, 1, 1, 1, 1, 1, 0,\n", - " 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 0, 1, 1, 1, 0, 2, 2, 2,\n", - " 1, 1, 0, 0, 1, 1, 2, 0, 0, 0, 0, 0, 2, 0, 0, 2, 1, 1, 1, 2, 2, 2,\n", - " 1, 2, 1, 2, 1, 1, 1, 0, 2, 2, 2, 1, 2, 1, 0, 1, 2, 1, 1, 1, 2, 1],\n", - " dtype=int32)" - ] - }, - "metadata": {}, - "execution_count": 16 - } - ], - "source": [ - "\n", - "from sklearn.cluster import KMeans\n", - "\n", - "nclusters = 3 \n", - "seed = 0\n", - "\n", - "km = KMeans(n_clusters=nclusters, random_state=seed)\n", - "km.fit(X)\n", - "\n", - "# Predict the cluster for each data point\n", - "\n", - "y_cluster_kmeans = km.predict(X)\n", - "y_cluster_kmeans" - ] - }, - { - "source": [ - "Esses números não significam muito para nós, por isso vamos obter um 'silhouette score' para verificar a precisão. A nossa pontuação está no meio.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0.5466747351275563" - ] - }, - "metadata": {}, - "execution_count": 17 - } - ], - "source": [ - "from sklearn import metrics\n", - "score = metrics.silhouette_score(X, y_cluster_kmeans)\n", - "score" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.cluster import KMeans\n", - "wcss = []\n", - "\n", - "for i in range(1, 11):\n", - " kmeans = KMeans(n_clusters = i, init = 'k-means++', random_state = 42)\n", - " kmeans.fit(X)\n", - " wcss.append(kmeans.inertia_)" - ] - }, - { - "source": [ - "Use esse modelo para decidir, utilizando o Método do Cotovelo, o melhor número de clusters a construir\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/seaborn/_decorators.py:43: FutureWarning: Pass the following variables as keyword args: x, y. From version 0.12, the only valid positional argument will be `data`, and passing other arguments without an explicit keyword will result in an error or misinterpretation.\n FutureWarning\n" - ] - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.figure(figsize=(10,5))\n", - "sns.lineplot(range(1, 11), wcss,marker='o',color='red')\n", - "plt.title('Elbow')\n", - "plt.xlabel('Number of clusters')\n", - "plt.ylabel('WCSS')\n", - "plt.show()" - ] - }, - { - "source": [ - "Looks like 3 is a good number after all. Fit the model again and create a scatterplot of your clusters. They do group in bunches, but they are pretty close together." - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "from sklearn.cluster import KMeans\n", - "kmeans = KMeans(n_clusters = 3)\n", - "kmeans.fit(X)\n", - "labels = kmeans.predict(X)\n", - "plt.scatter(df['popularity'],df['danceability'],c = labels)\n", - "plt.xlabel('popularity')\n", - "plt.ylabel('danceability')\n", - "plt.show()" - ] - }, - { - "source": [ - "A precisão deste modelo não é má, mas também não é excelente. Pode ser que os dados não se adaptem bem ao agrupamento K-Means. Poderá tentar um método diferente.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 811, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Result: 109 out of 286 samples were correctly labeled.\nAccuracy score: 0.38\n" - ] - } - ], - "source": [ - "labels = kmeans.labels_\n", - "\n", - "correct_labels = sum(y == labels)\n", - "\n", - "print(\"Result: %d out of %d samples were correctly labeled.\" % (correct_labels, y.size))\n", - "\n", - "print('Accuracy score: {0:0.2f}'. format(correct_labels/float(y.size)))" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/2-K-Means/solution/tester.ipynb b/translations/pt/5-Clustering/2-K-Means/solution/tester.ipynb deleted file mode 100644 index 31a54e104..000000000 --- a/translations/pt/5-Clustering/2-K-Means/solution/tester.ipynb +++ /dev/null @@ -1,343 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "6f92868513e59d321245137c1c4c5311", - "translation_date": "2025-09-03T20:12:31+00:00", - "source_file": "5-Clustering/2-K-Means/solution/tester.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 104, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: seaborn in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.11.1)\n", - "Requirement already satisfied: pandas>=0.23 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.1.2)\n", - "Requirement already satisfied: matplotlib>=2.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (3.1.0)\n", - "Requirement already satisfied: numpy>=1.15 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.19.2)\n", - "Requirement already satisfied: scipy>=1.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from seaborn) (1.4.1)\n", - "Requirement already satisfied: pytz>=2017.2 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2019.1)\n", - "Requirement already satisfied: python-dateutil>=2.7.3 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from pandas>=0.23->seaborn) (2.8.0)\n", - "Requirement already satisfied: kiwisolver>=1.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (1.1.0)\n", - "Requirement already satisfied: pyparsing!=2.0.4,!=2.1.2,!=2.1.6,>=2.0.1 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (2.4.0)\n", - "Requirement already satisfied: cycler>=0.10 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from matplotlib>=2.2->seaborn) (0.10.0)\n", - "Requirement already satisfied: six>=1.5 in /Users/jenlooper/Library/Python/3.7/lib/python/site-packages (from python-dateutil>=2.7.3->pandas>=0.23->seaborn) (1.12.0)\n", - "Requirement already satisfied: setuptools in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from kiwisolver>=1.0.1->matplotlib>=2.2->seaborn) (45.1.0)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n", - "Note: you may need to restart the kernel to use updated packages.\n" - ] - } - ], - "source": [ - "pip install seaborn" - ] - }, - { - "source": [ - "Comece onde terminámos na última aula, com os dados importados e filtrados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 105, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "0 Sparky Mandy & The Jungle \n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "2 LITT! LITT! \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "0 Cruel Santino alternative r&b 2019 144000 48 \n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "2 AYLØ indie r&b 2018 207758 40 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "0 0.666 0.8510 0.420 0.534000 0.1100 -6.699 \n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "2 0.836 0.2720 0.564 0.000537 0.1100 -7.127 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "\n", - " speechiness tempo time_signature \n", - "0 0.0829 133.015 5 \n", - "1 0.3600 129.993 3 \n", - "2 0.0424 130.005 4 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
0SparkyMandy & The JungleCruel Santinoalternative r&b2019144000480.6660.85100.4200.5340000.1100-6.6990.0829133.0155
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
2LITT!LITT!AYLØindie r&b2018207758400.8360.27200.5640.0005370.1100-7.1270.0424130.0054
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
\n
" - }, - "metadata": {}, - "execution_count": 105 - } - ], - "source": [ - "\n", - "import matplotlib.pyplot as plt\n", - "import pandas as pd\n", - "import seaborn as sns\n", - "import numpy as np\n", - "\n", - "df = pd.read_csv(\"../../data/nigerian-songs.csv\")\n", - "df.head()" - ] - }, - { - "source": [ - "Vamos focar apenas em 3 géneros. Talvez consigamos criar 3 clusters!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 106, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "Text(0.5, 1.0, 'Top genres')" - ] - }, - "metadata": {}, - "execution_count": 106 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "df = df[(df['artist_top_genre'] == 'afro dancehall') | (df['artist_top_genre'] == 'afropop') | (df['artist_top_genre'] == 'nigerian pop')]\n", - "df = df[(df['popularity'] > 0)]\n", - "top = df['artist_top_genre'].value_counts()\n", - "plt.figure(figsize=(10,7))\n", - "sns.barplot(x=top.index,y=top.values)\n", - "plt.xticks(rotation=45)\n", - "plt.title('Top genres',color = 'blue')" - ] - }, - { - "cell_type": "code", - "execution_count": 107, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " name album \\\n", - "1 shuga rush EVERYTHING YOU HEARD IS TRUE \n", - "3 Confident / Feeling Cool Enjoy Your Life \n", - "4 wanted you rare. \n", - "5 Kasala Pioneers \n", - "6 Pull Up Everything Pretty \n", - "\n", - " artist artist_top_genre release_date length popularity \\\n", - "1 Odunsi (The Engine) afropop 2020 89488 30 \n", - "3 Lady Donli nigerian pop 2019 175135 14 \n", - "4 Odunsi (The Engine) afropop 2018 152049 25 \n", - "5 DRB Lasgidi nigerian pop 2020 184800 26 \n", - "6 prettyboydo nigerian pop 2018 202648 29 \n", - "\n", - " danceability acousticness energy instrumentalness liveness loudness \\\n", - "1 0.710 0.0822 0.683 0.000169 0.1010 -5.640 \n", - "3 0.894 0.7980 0.611 0.000187 0.0964 -4.961 \n", - "4 0.702 0.1160 0.833 0.910000 0.3480 -6.044 \n", - "5 0.803 0.1270 0.525 0.000007 0.1290 -10.034 \n", - "6 0.818 0.4520 0.587 0.004490 0.5900 -9.840 \n", - "\n", - " speechiness tempo time_signature \n", - "1 0.3600 129.993 3 \n", - "3 0.1130 111.087 4 \n", - "4 0.0447 105.115 4 \n", - "5 0.1970 100.103 4 \n", - "6 0.1990 95.842 4 " - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
namealbumartistartist_top_genrerelease_datelengthpopularitydanceabilityacousticnessenergyinstrumentalnesslivenessloudnessspeechinesstempotime_signature
1shuga rushEVERYTHING YOU HEARD IS TRUEOdunsi (The Engine)afropop202089488300.7100.08220.6830.0001690.1010-5.6400.3600129.9933
3Confident / Feeling CoolEnjoy Your LifeLady Donlinigerian pop2019175135140.8940.79800.6110.0001870.0964-4.9610.1130111.0874
4wanted yourare.Odunsi (The Engine)afropop2018152049250.7020.11600.8330.9100000.3480-6.0440.0447105.1154
5KasalaPioneersDRB Lasgidinigerian pop2020184800260.8030.12700.5250.0000070.1290-10.0340.1970100.1034
6Pull UpEverything Prettyprettyboydonigerian pop2018202648290.8180.45200.5870.0044900.5900-9.8400.199095.8424
\n
" - }, - "metadata": {}, - "execution_count": 107 - } - ], - "source": [ - "df.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 108, - "metadata": {}, - "outputs": [], - "source": [ - "from sklearn.preprocessing import StandardScaler\n", - "\n", - "scaler = StandardScaler()\n", - "\n", - "# X = df.loc[:, ('danceability','energy')]\n", - "\n", - "\n", - "\n", - "\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 110, - "metadata": {}, - "outputs": [ - { - "output_type": "error", - "ename": "ValueError", - "evalue": "Unknown label type: 'continuous'", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 20\u001b[0m \u001b[0;31m# we create an instance of SVM and fit out data. We do not scale our\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 21\u001b[0m \u001b[0;31m# data since we want to plot the support vectors\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 22\u001b[0;31m \u001b[0mls30\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mLabelSpreading\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_30\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_30\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Label Spreading 30% data'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 23\u001b[0m \u001b[0mls50\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mLabelSpreading\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_50\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my_50\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Label Spreading 50% data'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 24\u001b[0m \u001b[0mls100\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mLabelSpreading\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mfit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'Label Spreading 100% data'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;32m/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/semi_supervised/_label_propagation.py\u001b[0m in \u001b[0;36mfit\u001b[0;34m(self, X, y)\u001b[0m\n\u001b[1;32m 228\u001b[0m \u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_validate_data\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mX\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0my\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 229\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mX_\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mX\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 230\u001b[0;31m \u001b[0mcheck_classification_targets\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0my\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 231\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 232\u001b[0m \u001b[0;31m# actual graph construction (implementations should override this)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;32m/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/sklearn/utils/multiclass.py\u001b[0m in \u001b[0;36mcheck_classification_targets\u001b[0;34m(y)\u001b[0m\n\u001b[1;32m 181\u001b[0m if y_type not in ['binary', 'multiclass', 'multiclass-multioutput',\n\u001b[1;32m 182\u001b[0m 'multilabel-indicator', 'multilabel-sequences']:\n\u001b[0;32m--> 183\u001b[0;31m \u001b[0;32mraise\u001b[0m \u001b[0mValueError\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m\"Unknown label type: %r\"\u001b[0m \u001b[0;34m%\u001b[0m \u001b[0my_type\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 184\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 185\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;31mValueError\u001b[0m: Unknown label type: 'continuous'" - ] - } - ], - "source": [ - "from sklearn.svm import SVC\n", - "from sklearn.semi_supervised import LabelSpreading\n", - "from sklearn.semi_supervised import SelfTrainingClassifier\n", - "from sklearn import datasets\n", - "\n", - "X = df[['danceability','acousticness']].values\n", - "y = df['energy'].values\n", - "\n", - "# X = scaler.fit_transform(X)\n", - "\n", - "# step size in the mesh\n", - "h = .02\n", - "\n", - "rng = np.random.RandomState(0)\n", - "y_rand = rng.rand(y.shape[0])\n", - "y_30 = np.copy(y)\n", - "y_30[y_rand < 0.3] = -1 # set random samples to be unlabeled\n", - "y_50 = np.copy(y)\n", - "y_50[y_rand < 0.5] = -1\n", - "# we create an instance of SVM and fit out data. We do not scale our\n", - "# data since we want to plot the support vectors\n", - "ls30 = (LabelSpreading().fit(X, y_30), y_30, 'Label Spreading 30% data')\n", - "ls50 = (LabelSpreading().fit(X, y_50), y_50, 'Label Spreading 50% data')\n", - "ls100 = (LabelSpreading().fit(X, y), y, 'Label Spreading 100% data')\n", - "\n", - "# the base classifier for self-training is identical to the SVC\n", - "base_classifier = SVC(kernel='rbf', gamma=.5, probability=True)\n", - "st30 = (SelfTrainingClassifier(base_classifier).fit(X, y_30),\n", - " y_30, 'Self-training 30% data')\n", - "st50 = (SelfTrainingClassifier(base_classifier).fit(X, y_50),\n", - " y_50, 'Self-training 50% data')\n", - "\n", - "rbf_svc = (SVC(kernel='rbf', gamma=.5).fit(X, y), y, 'SVC with rbf kernel')\n", - "\n", - "# create a mesh to plot in\n", - "x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1\n", - "y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1\n", - "xx, yy = np.meshgrid(np.arange(x_min, x_max, h),\n", - " np.arange(y_min, y_max, h))\n", - "\n", - "color_map = {-1: (1, 1, 1), 0: (0, 0, .9), 1: (1, 0, 0), 2: (.8, .6, 0)}\n", - "\n", - "classifiers = (ls30, st30, ls50, st50, ls100, rbf_svc)\n", - "for i, (clf, y_train, title) in enumerate(classifiers):\n", - " # Plot the decision boundary. For that, we will assign a color to each\n", - " # point in the mesh [x_min, x_max]x[y_min, y_max].\n", - " plt.subplot(3, 2, i + 1)\n", - " Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])\n", - "\n", - " # Put the result into a color plot\n", - " Z = Z.reshape(xx.shape)\n", - " plt.contourf(xx, yy, Z, cmap=plt.cm.Paired)\n", - " plt.axis('off')\n", - "\n", - " # Plot also the training points\n", - " colors = [color_map[y] for y in y_train]\n", - " plt.scatter(X[:, 0], X[:, 1], c=colors, edgecolors='black')\n", - "\n", - " plt.title(title)\n", - "\n", - "plt.suptitle(\"Unlabeled points are colored white\", y=0.1)\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/5-Clustering/README.md b/translations/pt/5-Clustering/README.md deleted file mode 100644 index ff8c57393..000000000 --- a/translations/pt/5-Clustering/README.md +++ /dev/null @@ -1,42 +0,0 @@ - -# Modelos de clustering para aprendizagem automática - -Clustering é uma tarefa de aprendizagem automática que procura encontrar objetos semelhantes entre si e agrupá-los em grupos chamados clusters. O que diferencia o clustering de outras abordagens na aprendizagem automática é que tudo acontece de forma automática; na verdade, é justo dizer que é o oposto da aprendizagem supervisionada. - -## Tópico regional: modelos de clustering para o gosto musical do público nigeriano 🎧 - -O público diversificado da Nigéria tem gostos musicais igualmente variados. Usando dados extraídos do Spotify (inspirado por [este artigo](https://towardsdatascience.com/country-wise-visual-analysis-of-music-taste-using-spotify-api-seaborn-in-python-77f5b749b421)), vamos analisar algumas músicas populares na Nigéria. Este conjunto de dados inclui informações sobre o 'danceability', 'acousticness', volume, 'speechiness', popularidade e energia de várias músicas. Será interessante descobrir padrões nesses dados! - -![Um gira-discos](../../../translated_images/pt-PT/turntable.f2b86b13c53302dc.webp) - -> Foto de Marcela Laskoski no Unsplash - -Nesta série de lições, vais descobrir novas formas de analisar dados utilizando técnicas de clustering. O clustering é particularmente útil quando o teu conjunto de dados não tem etiquetas. Se tiver etiquetas, então técnicas de classificação, como as que aprendeste em lições anteriores, podem ser mais úteis. Mas, em casos onde procuras agrupar dados não etiquetados, o clustering é uma ótima forma de descobrir padrões. - -> Existem ferramentas úteis de baixo código que podem ajudar-te a aprender a trabalhar com modelos de clustering. Experimenta [Azure ML para esta tarefa](https://docs.microsoft.com/learn/modules/create-clustering-model-azure-machine-learning-designer/?WT.mc_id=academic-77952-leestott) - -## Lições - -1. [Introdução ao clustering](1-Visualize/README.md) -2. [Clustering com K-Means](2-K-Means/README.md) - -## Créditos - -Estas lições foram escritas com 🎶 por [Jen Looper](https://www.twitter.com/jenlooper) com revisões úteis de [Rishit Dagli](https://rishit_dagli) e [Muhammad Sakib Khan Inan](https://twitter.com/Sakibinan). - -O conjunto de dados [Nigerian Songs](https://www.kaggle.com/sootersaalu/nigerian-songs-spotify) foi obtido no Kaggle, extraído do Spotify. - -Exemplos úteis de K-Means que ajudaram na criação desta lição incluem esta [exploração de íris](https://www.kaggle.com/bburns/iris-exploration-pca-k-means-and-gmm-clustering), este [notebook introdutório](https://www.kaggle.com/prashant111/k-means-clustering-with-python) e este [exemplo hipotético de ONG](https://www.kaggle.com/ankandash/pca-k-means-clustering-hierarchical-clustering). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/1-Introduction-to-NLP/README.md b/translations/pt/6-NLP/1-Introduction-to-NLP/README.md deleted file mode 100644 index 4aac99331..000000000 --- a/translations/pt/6-NLP/1-Introduction-to-NLP/README.md +++ /dev/null @@ -1,179 +0,0 @@ - -# Introdução ao processamento de linguagem natural - -Esta lição aborda uma breve história e conceitos importantes do *processamento de linguagem natural* (PLN), um subcampo da *linguística computacional*. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -O PLN, como é comumente conhecido, é uma das áreas mais conhecidas onde o aprendizado de máquina foi aplicado e utilizado em softwares de produção. - -✅ Consegue pensar em algum software que utiliza diariamente e que provavelmente tem algum PLN integrado? E os seus programas de processamento de texto ou as aplicações móveis que usa regularmente? - -Você aprenderá sobre: - -- **A ideia de línguas**. Como as línguas se desenvolveram e quais foram as principais áreas de estudo. -- **Definição e conceitos**. Também aprenderá definições e conceitos sobre como os computadores processam texto, incluindo análise sintática, gramática e identificação de substantivos e verbos. Há algumas tarefas de codificação nesta lição, e vários conceitos importantes são introduzidos, que você aprenderá a programar nas próximas lições. - -## Linguística computacional - -A linguística computacional é uma área de pesquisa e desenvolvimento que, ao longo de muitas décadas, estuda como os computadores podem trabalhar com línguas, compreendê-las, traduzi-las e até mesmo se comunicar com elas. O processamento de linguagem natural (PLN) é um campo relacionado, focado em como os computadores podem processar línguas "naturais", ou seja, humanas. - -### Exemplo - ditado no telemóvel - -Se alguma vez ditou algo para o seu telemóvel em vez de escrever ou fez uma pergunta a um assistente virtual, a sua fala foi convertida em texto e depois processada ou *analisada* a partir da língua que falou. As palavras-chave detectadas foram então processadas num formato que o telemóvel ou assistente pudesse compreender e agir. - -![compreensão](../../../../6-NLP/1-Introduction-to-NLP/images/comprehension.png) -> Compreensão linguística real é difícil! Imagem por [Jen Looper](https://twitter.com/jenlooper) - -### Como é que esta tecnologia é possível? - -Isto é possível porque alguém escreveu um programa de computador para o fazer. Há algumas décadas, alguns escritores de ficção científica previram que as pessoas falariam principalmente com os seus computadores, e que os computadores entenderiam sempre exatamente o que elas queriam dizer. Infelizmente, revelou-se um problema mais difícil do que muitos imaginavam e, embora hoje seja um problema muito mais bem compreendido, ainda existem desafios significativos para alcançar um processamento de linguagem natural "perfeito" no que diz respeito a compreender o significado de uma frase. Este é um problema particularmente difícil quando se trata de entender humor ou detectar emoções como sarcasmo numa frase. - -Neste momento, talvez se lembre das aulas escolares em que o professor abordava as partes da gramática numa frase. Em alguns países, os alunos aprendem gramática e linguística como uma disciplina dedicada, mas em muitos, esses tópicos estão incluídos como parte do aprendizado de uma língua: seja a sua primeira língua na escola primária (aprendendo a ler e escrever) ou talvez uma segunda língua no ensino secundário. Não se preocupe se não for um especialista em diferenciar substantivos de verbos ou advérbios de adjetivos! - -Se tem dificuldade em distinguir entre o *presente simples* e o *presente contínuo*, não está sozinho. Isso é um desafio para muitas pessoas, mesmo falantes nativos de uma língua. A boa notícia é que os computadores são muito bons em aplicar regras formais, e você aprenderá a escrever código que pode *analisar* uma frase tão bem quanto um humano. O maior desafio que examinará mais tarde é compreender o *significado* e o *sentimento* de uma frase. - -## Pré-requisitos - -Para esta lição, o principal pré-requisito é ser capaz de ler e compreender a língua desta lição. Não há problemas matemáticos ou equações para resolver. Embora o autor original tenha escrito esta lição em inglês, ela também foi traduzida para outras línguas, então pode estar a ler uma tradução. Há exemplos onde são usados vários idiomas diferentes (para comparar as diferentes regras gramaticais de diferentes línguas). Estes *não* são traduzidos, mas o texto explicativo é, então o significado deve ser claro. - -Para as tarefas de codificação, usará Python e os exemplos utilizam Python 3.8. - -Nesta seção, precisará e usará: - -- **Compreensão de Python 3**. Compreensão da linguagem de programação Python 3, esta lição utiliza entrada, loops, leitura de ficheiros e arrays. -- **Visual Studio Code + extensão**. Usaremos o Visual Studio Code e sua extensão para Python. Também pode usar um IDE de Python à sua escolha. -- **TextBlob**. [TextBlob](https://github.com/sloria/TextBlob) é uma biblioteca simplificada de processamento de texto para Python. Siga as instruções no site do TextBlob para instalá-lo no seu sistema (instale também os corpora, conforme mostrado abaixo): - - ```bash - pip install -U textblob - python -m textblob.download_corpora - ``` - -> 💡 Dica: Pode executar Python diretamente em ambientes do VS Code. Consulte a [documentação](https://code.visualstudio.com/docs/languages/python?WT.mc_id=academic-77952-leestott) para mais informações. - -## Conversando com máquinas - -A história de tentar fazer os computadores entenderem a linguagem humana remonta a décadas, e um dos primeiros cientistas a considerar o processamento de linguagem natural foi *Alan Turing*. - -### O 'teste de Turing' - -Quando Turing estava a pesquisar *inteligência artificial* na década de 1950, ele considerou se um teste de conversação poderia ser dado a um humano e a um computador (via correspondência escrita) onde o humano na conversa não tivesse certeza se estava a conversar com outro humano ou com um computador. - -Se, após um certo tempo de conversa, o humano não conseguisse determinar se as respostas vinham de um computador ou não, então poderia dizer-se que o computador estava *a pensar*? - -### A inspiração - 'o jogo da imitação' - -A ideia para isso veio de um jogo de festa chamado *O Jogo da Imitação*, onde um interrogador está sozinho numa sala e tem a tarefa de determinar quais das duas pessoas (noutra sala) são homem e mulher, respetivamente. O interrogador pode enviar notas e deve tentar pensar em perguntas cujas respostas escritas revelem o género da pessoa misteriosa. Claro, os jogadores na outra sala tentam enganar o interrogador, respondendo de forma a confundir ou induzir em erro, enquanto dão a aparência de responder honestamente. - -### Desenvolvendo Eliza - -Na década de 1960, um cientista do MIT chamado *Joseph Weizenbaum* desenvolveu [*Eliza*](https://wikipedia.org/wiki/ELIZA), uma "terapeuta" computorizada que fazia perguntas ao humano e dava a impressão de entender as suas respostas. No entanto, embora Eliza pudesse analisar uma frase e identificar certos construtos gramaticais e palavras-chave para dar uma resposta razoável, não se podia dizer que *entendia* a frase. Se Eliza recebesse uma frase no formato "**Eu estou** triste", poderia reorganizar e substituir palavras na frase para formar a resposta "Há quanto tempo **você está** triste". - -Isso dava a impressão de que Eliza entendia a declaração e estava a fazer uma pergunta de seguimento, enquanto na realidade estava apenas a mudar o tempo verbal e a adicionar algumas palavras. Se Eliza não conseguisse identificar uma palavra-chave para a qual tivesse uma resposta, daria uma resposta aleatória que poderia ser aplicável a muitas declarações diferentes. Eliza podia ser facilmente enganada, por exemplo, se um utilizador escrevesse "**Você é** uma bicicleta", ela poderia responder "Há quanto tempo **eu sou** uma bicicleta?", em vez de uma resposta mais razoável. - -[![Conversando com Eliza](https://img.youtube.com/vi/RMK9AphfLco/0.jpg)](https://youtu.be/RMK9AphfLco "Conversando com Eliza") - -> 🎥 Clique na imagem acima para um vídeo sobre o programa original ELIZA - -> Nota: Pode ler a descrição original de [Eliza](https://cacm.acm.org/magazines/1966/1/13317-elizaa-computer-program-for-the-study-of-natural-language-communication-between-man-and-machine/abstract) publicada em 1966 se tiver uma conta ACM. Alternativamente, leia sobre Eliza na [wikipedia](https://wikipedia.org/wiki/ELIZA) - -## Exercício - programar um bot de conversação básico - -Um bot de conversação, como Eliza, é um programa que solicita a entrada do utilizador e parece entender e responder de forma inteligente. Ao contrário de Eliza, o nosso bot não terá várias regras que lhe dão a aparência de uma conversa inteligente. Em vez disso, o nosso bot terá apenas uma habilidade: manter a conversa com respostas aleatórias que possam funcionar em quase qualquer conversa trivial. - -### O plano - -Os seus passos ao construir um bot de conversação: - -1. Imprimir instruções a aconselhar o utilizador sobre como interagir com o bot -2. Iniciar um loop - 1. Aceitar a entrada do utilizador - 2. Se o utilizador pedir para sair, então sair - 3. Processar a entrada do utilizador e determinar a resposta (neste caso, a resposta é uma escolha aleatória de uma lista de possíveis respostas genéricas) - 4. Imprimir a resposta -3. Voltar ao passo 2 - -### Construindo o bot - -Vamos criar o bot a seguir. Começaremos por definir algumas frases. - -1. Crie este bot em Python com as seguintes respostas aleatórias: - - ```python - random_responses = ["That is quite interesting, please tell me more.", - "I see. Do go on.", - "Why do you say that?", - "Funny weather we've been having, isn't it?", - "Let's change the subject.", - "Did you catch the game last night?"] - ``` - - Aqui está um exemplo de saída para orientar (a entrada do utilizador está nas linhas que começam com `>`): - - ```output - Hello, I am Marvin, the simple robot. - You can end this conversation at any time by typing 'bye' - After typing each answer, press 'enter' - How are you today? - > I am good thanks - That is quite interesting, please tell me more. - > today I went for a walk - Did you catch the game last night? - > I did, but my team lost - Funny weather we've been having, isn't it? - > yes but I hope next week is better - Let's change the subject. - > ok, lets talk about music - Why do you say that? - > because I like music! - Why do you say that? - > bye - It was nice talking to you, goodbye! - ``` - - Uma possível solução para a tarefa está [aqui](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/1-Introduction-to-NLP/solution/bot.py) - - ✅ Pare e reflita - - 1. Acha que as respostas aleatórias poderiam "enganar" alguém a pensar que o bot realmente o entende? - 2. Que recursos o bot precisaria para ser mais eficaz? - 3. Se um bot pudesse realmente "entender" o significado de uma frase, precisaria "lembrar-se" do significado das frases anteriores numa conversa também? - ---- - -## 🚀Desafio - -Escolha um dos elementos de "pare e reflita" acima e tente implementá-lo em código ou escreva uma solução no papel usando pseudocódigo. - -Na próxima lição, aprenderá sobre várias outras abordagens para analisar linguagem natural e aprendizado de máquina. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e autoestudo - -Consulte as referências abaixo como oportunidades de leitura adicional. - -### Referências - -1. Schubert, Lenhart, "Computational Linguistics", *The Stanford Encyclopedia of Philosophy* (Spring 2020 Edition), Edward N. Zalta (ed.), URL = . -2. Princeton University "About WordNet." [WordNet](https://wordnet.princeton.edu/). Princeton University. 2010. - -## Tarefa - -[Procure um bot](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/1-Introduction-to-NLP/assignment.md b/translations/pt/6-NLP/1-Introduction-to-NLP/assignment.md deleted file mode 100644 index 7265f0062..000000000 --- a/translations/pt/6-NLP/1-Introduction-to-NLP/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Procure um bot - -## Instruções - -Os bots estão por toda parte. A sua tarefa: encontre um e adote-o! Pode encontrá-los em sites, em aplicações bancárias e ao telefone, por exemplo, quando liga para empresas de serviços financeiros para obter conselhos ou informações sobre contas. Analise o bot e veja se consegue confundi-lo. Se conseguir confundir o bot, por que acha que isso aconteceu? Escreva um pequeno relatório sobre a sua experiência. - -## Rubrica - -| Critérios | Exemplary | Adequado | Precisa de Melhorias | -| --------- | ------------------------------------------------------------------------------------------------------------- | ------------------------------------------- | --------------------- | -| | Uma página completa é escrita, explicando a presumida arquitetura do bot e descrevendo a sua experiência com ele | O relatório está incompleto ou não é bem pesquisado | Nenhum relatório é submetido | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/2-Tasks/README.md b/translations/pt/6-NLP/2-Tasks/README.md deleted file mode 100644 index 1d4c38c94..000000000 --- a/translations/pt/6-NLP/2-Tasks/README.md +++ /dev/null @@ -1,228 +0,0 @@ - -# Tarefas e técnicas comuns de processamento de linguagem natural - -Para a maioria das tarefas de *processamento de linguagem natural*, o texto a ser processado deve ser dividido, examinado e os resultados armazenados ou cruzados com regras e conjuntos de dados. Essas tarefas permitem ao programador derivar o _significado_, a _intenção_ ou apenas a _frequência_ de termos e palavras em um texto. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -Vamos explorar técnicas comuns usadas no processamento de texto. Combinadas com aprendizagem automática, essas técnicas ajudam a analisar grandes volumes de texto de forma eficiente. Antes de aplicar ML a essas tarefas, no entanto, vamos entender os problemas enfrentados por um especialista em NLP. - -## Tarefas comuns em NLP - -Existem diferentes maneiras de analisar um texto com o qual você está trabalhando. Há tarefas que você pode realizar e, através delas, é possível compreender o texto e tirar conclusões. Normalmente, essas tarefas são realizadas em sequência. - -### Tokenização - -Provavelmente, a primeira coisa que a maioria dos algoritmos de NLP precisa fazer é dividir o texto em tokens ou palavras. Embora isso pareça simples, lidar com pontuação e delimitadores de palavras e frases em diferentes idiomas pode tornar o processo complicado. Pode ser necessário usar vários métodos para determinar as demarcações. - -![tokenização](../../../../6-NLP/2-Tasks/images/tokenization.png) -> Tokenizando uma frase de **Orgulho e Preconceito**. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -### Embeddings - -[Word embeddings](https://wikipedia.org/wiki/Word_embedding) são uma forma de converter seus dados textuais em valores numéricos. Os embeddings são feitos de maneira que palavras com significados semelhantes ou usadas juntas fiquem agrupadas. - -![word embeddings](../../../../6-NLP/2-Tasks/images/embedding.png) -> "Tenho o maior respeito pelos seus nervos, eles são meus velhos amigos." - Word embeddings para uma frase de **Orgulho e Preconceito**. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -✅ Experimente [esta ferramenta interessante](https://projector.tensorflow.org/) para explorar word embeddings. Ao clicar em uma palavra, aparecem clusters de palavras semelhantes: 'brinquedo' agrupa-se com 'disney', 'lego', 'playstation' e 'console'. - -### Parsing & Marcação de Partes do Discurso - -Cada palavra que foi tokenizada pode ser marcada como uma parte do discurso - substantivo, verbo ou adjetivo. A frase `a rápida raposa vermelha saltou sobre o cão castanho preguiçoso` pode ser marcada como POS, por exemplo, raposa = substantivo, saltou = verbo. - -![parsing](../../../../6-NLP/2-Tasks/images/parse.png) - -> Parsing de uma frase de **Orgulho e Preconceito**. Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -Parsing é o reconhecimento de quais palavras estão relacionadas umas às outras em uma frase - por exemplo, `a rápida raposa vermelha saltou` é uma sequência de adjetivo-substantivo-verbo que é separada da sequência `cão castanho preguiçoso`. - -### Frequência de Palavras e Frases - -Um procedimento útil ao analisar um grande corpo de texto é construir um dicionário de cada palavra ou frase de interesse e quantas vezes ela aparece. A frase `a rápida raposa vermelha saltou sobre o cão castanho preguiçoso` tem uma frequência de palavras de 2 para "a". - -Vamos analisar um texto de exemplo onde contamos a frequência de palavras. O poema The Winners de Rudyard Kipling contém o seguinte verso: - -```output -What the moral? Who rides may read. -When the night is thick and the tracks are blind -A friend at a pinch is a friend, indeed, -But a fool to wait for the laggard behind. -Down to Gehenna or up to the Throne, -He travels the fastest who travels alone. -``` - -Como as frequências de frases podem ser sensíveis ou não a maiúsculas, a frase `um amigo` tem uma frequência de 2, `o` tem uma frequência de 6 e `viaja` tem uma frequência de 2. - -### N-grams - -Um texto pode ser dividido em sequências de palavras de um comprimento definido, uma única palavra (unigrama), duas palavras (bigramas), três palavras (trigramas) ou qualquer número de palavras (n-grams). - -Por exemplo, `a rápida raposa vermelha saltou sobre o cão castanho preguiçoso` com um valor de n-gram de 2 produz os seguintes n-grams: - -1. a rápida -2. rápida raposa -3. raposa vermelha -4. vermelha saltou -5. saltou sobre -6. sobre o -7. o cão -8. cão castanho -9. castanho preguiçoso - -Pode ser mais fácil visualizar isso como uma janela deslizante sobre a frase. Aqui está para n-grams de 3 palavras, o n-gram está em negrito em cada frase: - -1. **a rápida raposa** vermelha saltou sobre o cão castanho preguiçoso -2. a **rápida raposa vermelha** saltou sobre o cão castanho preguiçoso -3. a rápida **raposa vermelha saltou** sobre o cão castanho preguiçoso -4. a rápida raposa **vermelha saltou sobre** o cão castanho preguiçoso -5. a rápida raposa vermelha **saltou sobre o** cão castanho preguiçoso -6. a rápida raposa vermelha saltou **sobre o cão** castanho preguiçoso -7. a rápida raposa vermelha saltou sobre **o cão castanho** preguiçoso -8. a rápida raposa vermelha saltou sobre o **cão castanho preguiçoso** - -![janela deslizante de n-grams](../../../../6-NLP/2-Tasks/images/n-grams.gif) - -> Valor de n-gram de 3: Infográfico por [Jen Looper](https://twitter.com/jenlooper) - -### Extração de Frases Nominais - -Na maioria das frases, há um substantivo que é o sujeito ou objeto da frase. Em inglês, muitas vezes é identificável por ter 'a', 'an' ou 'the' antes dele. Identificar o sujeito ou objeto de uma frase através da 'extração da frase nominal' é uma tarefa comum em NLP ao tentar entender o significado de uma frase. - -✅ Na frase "Não consigo fixar a hora, ou o local, ou o olhar ou as palavras, que lançaram a base. Faz muito tempo. Eu estava no meio antes de perceber que tinha começado.", consegue identificar as frases nominais? - -Na frase `a rápida raposa vermelha saltou sobre o cão castanho preguiçoso` há 2 frases nominais: **rápida raposa vermelha** e **cão castanho preguiçoso**. - -### Análise de Sentimento - -Uma frase ou texto pode ser analisado para determinar o sentimento, ou quão *positivo* ou *negativo* ele é. O sentimento é medido em *polaridade* e *objetividade/subjetividade*. A polaridade é medida de -1.0 a 1.0 (negativo a positivo) e de 0.0 a 1.0 (mais objetivo a mais subjetivo). - -✅ Mais tarde, aprenderá que existem diferentes maneiras de determinar o sentimento usando aprendizagem automática, mas uma delas é ter uma lista de palavras e frases categorizadas como positivas ou negativas por um especialista humano e aplicar esse modelo ao texto para calcular um score de polaridade. Consegue perceber como isso funcionaria em algumas circunstâncias e menos em outras? - -### Flexão - -A flexão permite que você pegue uma palavra e obtenha o singular ou plural dela. - -### Lematização - -Um *lema* é a raiz ou palavra principal de um conjunto de palavras, por exemplo, *voou*, *voa*, *voando* têm como lema o verbo *voar*. - -Existem também bases de dados úteis disponíveis para o pesquisador de NLP, como: - -### WordNet - -[WordNet](https://wordnet.princeton.edu/) é uma base de dados de palavras, sinônimos, antônimos e muitos outros detalhes para cada palavra em vários idiomas. É incrivelmente útil ao tentar construir traduções, verificadores ortográficos ou ferramentas de linguagem de qualquer tipo. - -## Bibliotecas de NLP - -Felizmente, você não precisa construir todas essas técnicas sozinho, pois existem excelentes bibliotecas Python disponíveis que tornam o NLP muito mais acessível para desenvolvedores que não são especializados em processamento de linguagem natural ou aprendizagem automática. As próximas lições incluem mais exemplos dessas bibliotecas, mas aqui aprenderá alguns exemplos úteis para ajudá-lo na próxima tarefa. - -### Exercício - usando a biblioteca `TextBlob` - -Vamos usar uma biblioteca chamada TextBlob, pois ela contém APIs úteis para lidar com esses tipos de tarefas. TextBlob "baseia-se nos ombros gigantes do [NLTK](https://nltk.org) e [pattern](https://github.com/clips/pattern), e funciona bem com ambos." Ela possui uma quantidade considerável de ML embutida em sua API. - -> Nota: Um [Guia de Introdução](https://textblob.readthedocs.io/en/dev/quickstart.html#quickstart) útil está disponível para TextBlob e é recomendado para desenvolvedores Python experientes. - -Ao tentar identificar *frases nominais*, TextBlob oferece várias opções de extratores para encontrar frases nominais. - -1. Veja o `ConllExtractor`. - - ```python - from textblob import TextBlob - from textblob.np_extractors import ConllExtractor - # import and create a Conll extractor to use later - extractor = ConllExtractor() - - # later when you need a noun phrase extractor: - user_input = input("> ") - user_input_blob = TextBlob(user_input, np_extractor=extractor) # note non-default extractor specified - np = user_input_blob.noun_phrases - ``` - - > O que está acontecendo aqui? [ConllExtractor](https://textblob.readthedocs.io/en/dev/api_reference.html?highlight=Conll#textblob.en.np_extractors.ConllExtractor) é "Um extrator de frases nominais que usa chunk parsing treinado com o corpus de treinamento ConLL-2000." ConLL-2000 refere-se à Conferência de Aprendizagem Computacional de Linguagem Natural de 2000. Cada ano a conferência hospedava um workshop para resolver um problema difícil de NLP, e em 2000 foi chunking de frases nominais. Um modelo foi treinado no Wall Street Journal, com "as seções 15-18 como dados de treinamento (211727 tokens) e a seção 20 como dados de teste (47377 tokens)". Pode consultar os procedimentos usados [aqui](https://www.clips.uantwerpen.be/conll2000/chunking/) e os [resultados](https://ifarm.nl/erikt/research/np-chunking.html). - -### Desafio - melhorando seu bot com NLP - -Na lição anterior, você construiu um bot de perguntas e respostas muito simples. Agora, tornará Marvin um pouco mais simpático ao analisar sua entrada para sentimento e imprimir uma resposta que corresponda ao sentimento. Também precisará identificar uma `noun_phrase` e perguntar sobre ela. - -Os passos para construir um bot conversacional melhor: - -1. Imprimir instruções aconselhando o utilizador sobre como interagir com o bot -2. Iniciar loop - 1. Aceitar entrada do utilizador - 2. Se o utilizador pedir para sair, então sair - 3. Processar a entrada do utilizador e determinar a resposta de sentimento apropriada - 4. Se uma frase nominal for detectada no sentimento, pluralizá-la e pedir mais informações sobre esse tópico - 5. Imprimir resposta -3. Voltar ao passo 2 - -Aqui está o trecho de código para determinar o sentimento usando TextBlob. Note que há apenas quatro *gradientes* de resposta de sentimento (poderia haver mais, se desejar): - -```python -if user_input_blob.polarity <= -0.5: - response = "Oh dear, that sounds bad. " -elif user_input_blob.polarity <= 0: - response = "Hmm, that's not great. " -elif user_input_blob.polarity <= 0.5: - response = "Well, that sounds positive. " -elif user_input_blob.polarity <= 1: - response = "Wow, that sounds great. " -``` - -Aqui está um exemplo de saída para orientá-lo (entrada do utilizador está nas linhas que começam com >): - -```output -Hello, I am Marvin, the friendly robot. -You can end this conversation at any time by typing 'bye' -After typing each answer, press 'enter' -How are you today? -> I am ok -Well, that sounds positive. Can you tell me more? -> I went for a walk and saw a lovely cat -Well, that sounds positive. Can you tell me more about lovely cats? -> cats are the best. But I also have a cool dog -Wow, that sounds great. Can you tell me more about cool dogs? -> I have an old hounddog but he is sick -Hmm, that's not great. Can you tell me more about old hounddogs? -> bye -It was nice talking to you, goodbye! -``` - -Uma possível solução para a tarefa está [aqui](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/2-Tasks/solution/bot.py) - -✅ Verificação de Conhecimento - -1. Acha que as respostas simpáticas poderiam 'enganar' alguém a pensar que o bot realmente os compreendeu? -2. Identificar a frase nominal torna o bot mais 'crível'? -3. Por que extrair uma 'frase nominal' de uma frase seria algo útil? - ---- - -Implemente o bot na verificação de conhecimento anterior e teste-o com um amigo. Ele consegue enganá-lo? Consegue tornar seu bot mais 'crível'? - -## 🚀Desafio - -Escolha uma tarefa na verificação de conhecimento anterior e tente implementá-la. Teste o bot com um amigo. Ele consegue enganá-lo? Consegue tornar seu bot mais 'crível'? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Nas próximas lições, aprenderá mais sobre análise de sentimento. Pesquise esta técnica interessante em artigos como estes no [KDNuggets](https://www.kdnuggets.com/tag/nlp) - -## Tarefa - -[Fazer um bot responder](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/2-Tasks/assignment.md b/translations/pt/6-NLP/2-Tasks/assignment.md deleted file mode 100644 index 3a85ef107..000000000 --- a/translations/pt/6-NLP/2-Tasks/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Fazer um Bot responder - -## Instruções - -Nas lições anteriores, programaste um bot básico com quem podes conversar. Este bot dá respostas aleatórias até que digas 'adeus'. Consegues tornar as respostas um pouco menos aleatórias e fazer com que o bot responda a coisas específicas, como 'porquê' ou 'como'? Pensa um pouco sobre como o machine learning poderia tornar este tipo de trabalho menos manual à medida que expandes o teu bot. Podes usar as bibliotecas NLTK ou TextBlob para facilitar as tuas tarefas. - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita Melhorias | -| --------- | -------------------------------------------- | ------------------------------------------------ | ----------------------- | -| | Um novo ficheiro bot.py é apresentado e documentado | Um novo ficheiro bot é apresentado, mas contém erros | Nenhum ficheiro é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/3-Translation-Sentiment/README.md b/translations/pt/6-NLP/3-Translation-Sentiment/README.md deleted file mode 100644 index 106a62600..000000000 --- a/translations/pt/6-NLP/3-Translation-Sentiment/README.md +++ /dev/null @@ -1,200 +0,0 @@ - -# Tradução e análise de sentimento com ML - -Nas lições anteriores, aprendeste a construir um bot básico utilizando `TextBlob`, uma biblioteca que incorpora ML nos bastidores para realizar tarefas básicas de NLP, como a extração de frases nominais. Outro desafio importante na linguística computacional é a tradução _precisa_ de uma frase de uma língua falada ou escrita para outra. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -A tradução é um problema muito difícil, agravado pelo facto de existirem milhares de línguas, cada uma com regras gramaticais muito diferentes. Uma abordagem é converter as regras gramaticais formais de uma língua, como o inglês, numa estrutura independente de língua e, em seguida, traduzi-la convertendo-a novamente para outra língua. Esta abordagem implica os seguintes passos: - -1. **Identificação**. Identificar ou etiquetar as palavras na língua de entrada como substantivos, verbos, etc. -2. **Criar tradução**. Produzir uma tradução direta de cada palavra no formato da língua de destino. - -### Exemplo de frase, Inglês para Irlandês - -Em 'Inglês', a frase _I feel happy_ tem três palavras na seguinte ordem: - -- **sujeito** (I) -- **verbo** (feel) -- **adjetivo** (happy) - -No entanto, na língua 'Irlandesa', a mesma frase tem uma estrutura gramatical muito diferente - emoções como "*happy*" ou "*sad*" são expressas como estando *sobre* ti. - -A frase em inglês `I feel happy` em irlandês seria `Tá athas orm`. Uma tradução *literal* seria `Happy is upon me`. - -Um falante de irlandês que traduzisse para inglês diria `I feel happy`, não `Happy is upon me`, porque compreende o significado da frase, mesmo que as palavras e a estrutura da frase sejam diferentes. - -A ordem formal da frase em irlandês é: - -- **verbo** (Tá ou is) -- **adjetivo** (athas, ou happy) -- **sujeito** (orm, ou upon me) - -## Tradução - -Um programa de tradução ingênuo poderia traduzir apenas palavras, ignorando a estrutura da frase. - -✅ Se aprendeste uma segunda (ou terceira ou mais) língua como adulto, provavelmente começaste por pensar na tua língua nativa, traduzindo um conceito palavra por palavra na tua cabeça para a segunda língua e, em seguida, falando a tradução. Isto é semelhante ao que os programas de tradução ingênuos fazem. É importante ultrapassar esta fase para alcançar fluência! - -A tradução ingênua leva a traduções erradas (e às vezes hilariantes): `I feel happy` traduzido literalmente para irlandês seria `Mise bhraitheann athas`. Isso significa (literalmente) `me feel happy` e não é uma frase válida em irlandês. Mesmo que o inglês e o irlandês sejam línguas faladas em duas ilhas vizinhas, são línguas muito diferentes com estruturas gramaticais distintas. - -> Podes assistir a alguns vídeos sobre tradições linguísticas irlandesas, como [este](https://www.youtube.com/watch?v=mRIaLSdRMMs) - -### Abordagens de aprendizagem automática - -Até agora, aprendeste sobre a abordagem de regras formais para o processamento de linguagem natural. Outra abordagem é ignorar o significado das palavras e _usar aprendizagem automática para detetar padrões_. Isto pode funcionar na tradução se tiveres muitos textos (um *corpus*) ou textos (*corpora*) na língua de origem e na língua de destino. - -Por exemplo, considera o caso de *Orgulho e Preconceito*, um romance inglês bem conhecido escrito por Jane Austen em 1813. Se consultares o livro em inglês e uma tradução humana do livro em *francês*, poderias detetar frases em um que são traduzidas _idiomaticamente_ para o outro. Vais fazer isso em breve. - -Por exemplo, quando uma frase em inglês como `I have no money` é traduzida literalmente para francês, pode tornar-se `Je n'ai pas de monnaie`. "Monnaie" é um falso cognato francês complicado, pois 'money' e 'monnaie' não são sinónimos. Uma tradução melhor que um humano poderia fazer seria `Je n'ai pas d'argent`, porque transmite melhor o significado de que não tens dinheiro (em vez de 'troco', que é o significado de 'monnaie'). - -![monnaie](../../../../6-NLP/3-Translation-Sentiment/images/monnaie.png) - -> Imagem por [Jen Looper](https://twitter.com/jenlooper) - -Se um modelo de ML tiver traduções humanas suficientes para construir um modelo, pode melhorar a precisão das traduções ao identificar padrões comuns em textos que foram previamente traduzidos por falantes humanos especializados em ambas as línguas. - -### Exercício - tradução - -Podes usar `TextBlob` para traduzir frases. Experimenta a famosa primeira linha de **Orgulho e Preconceito**: - -```python -from textblob import TextBlob - -blob = TextBlob( - "It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife!" -) -print(blob.translate(to="fr")) - -``` - -`TextBlob` faz um bom trabalho na tradução: "C'est une vérité universellement reconnue, qu'un homme célibataire en possession d'une bonne fortune doit avoir besoin d'une femme!". - -Pode-se argumentar que a tradução do TextBlob é muito mais precisa, de facto, do que a tradução francesa de 1932 do livro por V. Leconte e Ch. Pressoir: - -"C'est une vérité universelle qu'un célibataire pourvu d'une belle fortune doit avoir envie de se marier, et, si peu que l'on sache de son sentiment à cet egard, lorsqu'il arrive dans une nouvelle résidence, cette idée est si bien fixée dans l'esprit de ses voisins qu'ils le considèrent sur-le-champ comme la propriété légitime de l'une ou l'autre de leurs filles." - -Neste caso, a tradução informada por ML faz um trabalho melhor do que o tradutor humano que está a colocar palavras desnecessárias na boca do autor original para 'clareza'. - -> O que está a acontecer aqui? E por que o TextBlob é tão bom na tradução? Bem, nos bastidores, está a usar o Google Translate, uma IA sofisticada capaz de analisar milhões de frases para prever as melhores sequências para a tarefa em questão. Não há nada manual aqui e precisas de uma conexão à internet para usar `blob.translate`. - -✅ Experimenta mais frases. Qual é melhor, ML ou tradução humana? Em que casos? - -## Análise de sentimento - -Outra área onde a aprendizagem automática pode funcionar muito bem é na análise de sentimento. Uma abordagem não baseada em ML para sentimento é identificar palavras e frases que são 'positivas' e 'negativas'. Depois, dado um novo texto, calcular o valor total das palavras positivas, negativas e neutras para identificar o sentimento geral. - -Esta abordagem é facilmente enganada, como podes ter visto na tarefa do Marvin - a frase `Great, that was a wonderful waste of time, I'm glad we are lost on this dark road` é uma frase sarcástica, de sentimento negativo, mas o algoritmo simples deteta 'great', 'wonderful', 'glad' como positivas e 'waste', 'lost' e 'dark' como negativas. O sentimento geral é influenciado por estas palavras contraditórias. - -✅ Para um momento e pensa sobre como transmitimos sarcasmo como falantes humanos. A inflexão do tom desempenha um papel importante. Experimenta dizer a frase "Well, that film was awesome" de diferentes maneiras para descobrir como a tua voz transmite significado. - -### Abordagens de ML - -A abordagem de ML seria reunir manualmente corpos de texto negativos e positivos - tweets, ou críticas de filmes, ou qualquer coisa onde o humano tenha dado uma pontuação *e* uma opinião escrita. Depois, técnicas de NLP podem ser aplicadas às opiniões e pontuações, para que padrões emerjam (por exemplo, críticas positivas de filmes tendem a ter a frase 'Oscar worthy' mais do que críticas negativas de filmes, ou críticas positivas de restaurantes dizem 'gourmet' muito mais do que 'disgusting'). - -> ⚖️ **Exemplo**: Se trabalhares no gabinete de um político e houver uma nova lei a ser debatida, os eleitores podem escrever para o gabinete com emails a favor ou contra a nova lei. Digamos que és encarregado de ler os emails e classificá-los em 2 pilhas, *a favor* e *contra*. Se houver muitos emails, podes sentir-te sobrecarregado ao tentar lê-los todos. Não seria ótimo se um bot pudesse lê-los todos por ti, compreendê-los e dizer-te em que pilha cada email pertence? -> -> Uma maneira de conseguir isso é usar Aprendizagem Automática. Treinarias o modelo com uma parte dos emails *contra* e uma parte dos emails *a favor*. O modelo tenderia a associar frases e palavras ao lado contra e ao lado a favor, *mas não entenderia nenhum dos conteúdos*, apenas que certas palavras e padrões eram mais prováveis de aparecer num email *contra* ou *a favor*. Poderias testá-lo com alguns emails que não usaste para treinar o modelo e ver se chegava à mesma conclusão que tu. Depois, uma vez satisfeito com a precisão do modelo, poderias processar emails futuros sem ter de ler cada um. - -✅ Este processo parece semelhante a processos que usaste em lições anteriores? - -## Exercício - frases sentimentais - -O sentimento é medido com uma *polaridade* de -1 a 1, significando que -1 é o sentimento mais negativo e 1 é o mais positivo. O sentimento também é medido com uma pontuação de 0 - 1 para objetividade (0) e subjetividade (1). - -Dá outra olhada em *Orgulho e Preconceito* de Jane Austen. O texto está disponível aqui no [Project Gutenberg](https://www.gutenberg.org/files/1342/1342-h/1342-h.htm). O exemplo abaixo mostra um programa curto que analisa o sentimento das primeiras e últimas frases do livro e exibe a sua polaridade de sentimento e pontuação de subjetividade/objetividade. - -Deves usar a biblioteca `TextBlob` (descrita acima) para determinar `sentiment` (não precisas de escrever o teu próprio calculador de sentimento) na seguinte tarefa. - -```python -from textblob import TextBlob - -quote1 = """It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife.""" - -quote2 = """Darcy, as well as Elizabeth, really loved them; and they were both ever sensible of the warmest gratitude towards the persons who, by bringing her into Derbyshire, had been the means of uniting them.""" - -sentiment1 = TextBlob(quote1).sentiment -sentiment2 = TextBlob(quote2).sentiment - -print(quote1 + " has a sentiment of " + str(sentiment1)) -print(quote2 + " has a sentiment of " + str(sentiment2)) -``` - -Vês o seguinte output: - -```output -It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want # of a wife. has a sentiment of Sentiment(polarity=0.20952380952380953, subjectivity=0.27142857142857146) - -Darcy, as well as Elizabeth, really loved them; and they were - both ever sensible of the warmest gratitude towards the persons - who, by bringing her into Derbyshire, had been the means of - uniting them. has a sentiment of Sentiment(polarity=0.7, subjectivity=0.8) -``` - -## Desafio - verificar polaridade de sentimento - -A tua tarefa é determinar, usando polaridade de sentimento, se *Orgulho e Preconceito* tem mais frases absolutamente positivas do que absolutamente negativas. Para esta tarefa, podes assumir que uma pontuação de polaridade de 1 ou -1 é absolutamente positiva ou negativa, respetivamente. - -**Passos:** - -1. Faz o download de uma [cópia de Orgulho e Preconceito](https://www.gutenberg.org/files/1342/1342-h/1342-h.htm) do Project Gutenberg como um ficheiro .txt. Remove os metadados no início e no fim do ficheiro, deixando apenas o texto original. -2. Abre o ficheiro em Python e extrai o conteúdo como uma string. -3. Cria um TextBlob usando a string do livro. -4. Analisa cada frase do livro num loop. - 1. Se a polaridade for 1 ou -1, armazena a frase numa lista de mensagens positivas ou negativas. -5. No final, imprime todas as frases positivas e negativas (separadamente) e o número de cada uma. - -Aqui está uma [solução de exemplo](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb). - -✅ Verificação de Conhecimento - -1. O sentimento é baseado nas palavras usadas na frase, mas o código *entende* as palavras? -2. Achas que a polaridade de sentimento é precisa, ou seja, *concordas* com as pontuações? - 1. Em particular, concordas ou discordas da polaridade **positiva** absoluta das seguintes frases? - * “What an excellent father you have, girls!” said she, when the door was shut. - * “Your examination of Mr. Darcy is over, I presume,” said Miss Bingley; “and pray what is the result?” “I am perfectly convinced by it that Mr. Darcy has no defect. - * How wonderfully these sort of things occur! - * I have the greatest dislike in the world to that sort of thing. - * Charlotte is an excellent manager, I dare say. - * “This is delightful indeed! - * I am so happy! - * Your idea of the ponies is delightful. - 2. As próximas 3 frases foram pontuadas com um sentimento absolutamente positivo, mas, ao ler atentamente, não são frases positivas. Por que a análise de sentimento pensou que eram frases positivas? - * Happy shall I be, when his stay at Netherfield is over!” “I wish I could say anything to comfort you,” replied Elizabeth; “but it is wholly out of my power. - * If I could but see you as happy! - * Our distress, my dear Lizzy, is very great. - 3. Concordas ou discordas da polaridade **negativa** absoluta das seguintes frases? - - Everybody is disgusted with his pride. - - “I should like to know how he behaves among strangers.” “You shall hear then—but prepare yourself for something very dreadful. - - The pause was to Elizabeth’s feelings dreadful. - - It would be dreadful! - -✅ Qualquer aficionado de Jane Austen entenderá que ela frequentemente usa os seus livros para criticar os aspetos mais ridículos da sociedade da Regência Inglesa. Elizabeth Bennett, a personagem principal em *Orgulho e Preconceito*, é uma observadora social perspicaz (como a autora) e a sua linguagem é frequentemente muito subtil. Até mesmo Mr. Darcy (o interesse amoroso na história) nota o uso brincalhão e provocador da linguagem por parte de Elizabeth: "I have had the pleasure of your acquaintance long enough to know that you find great enjoyment in occasionally professing opinions which in fact are not your own." - ---- - -## 🚀Desafio - -Consegues melhorar o Marvin ainda mais ao extrair outras características da entrada do utilizador? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo -Existem muitas formas de extrair sentimentos de texto. Pense nas aplicações empresariais que podem utilizar esta técnica. Reflita sobre como isso pode dar errado. Leia mais sobre sistemas empresariais sofisticados prontos para analisar sentimentos, como [Azure Text Analysis](https://docs.microsoft.com/azure/cognitive-services/Text-Analytics/how-tos/text-analytics-how-to-sentiment-analysis?tabs=version-3-1?WT.mc_id=academic-77952-leestott). Teste algumas das frases de Orgulho e Preconceito acima e veja se consegue detetar nuances. - -## Tarefa - -[Licença poética](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/3-Translation-Sentiment/assignment.md b/translations/pt/6-NLP/3-Translation-Sentiment/assignment.md deleted file mode 100644 index 95bfd8a5c..000000000 --- a/translations/pt/6-NLP/3-Translation-Sentiment/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Licença poética - -## Instruções - -Neste [notebook](https://www.kaggle.com/jenlooper/emily-dickinson-word-frequency) pode encontrar mais de 500 poemas de Emily Dickinson previamente analisados quanto ao sentimento utilizando a análise de texto do Azure. Usando este conjunto de dados, analise-o utilizando as técnicas descritas na lição. O sentimento sugerido de um poema corresponde à decisão do serviço mais sofisticado do Azure? Porquê ou porquê não, na sua opinião? Há algo que o surpreenda? - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | ------------------------------------------------------------------------- | ------------------------------------------------------- | ------------------------ | -| | Um notebook é apresentado com uma análise sólida de uma amostra do autor | O notebook está incompleto ou não realiza a análise | Nenhum notebook é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/3-Translation-Sentiment/solution/Julia/README.md b/translations/pt/6-NLP/3-Translation-Sentiment/solution/Julia/README.md deleted file mode 100644 index abef9c337..000000000 --- a/translations/pt/6-NLP/3-Translation-Sentiment/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/3-Translation-Sentiment/solution/R/README.md b/translations/pt/6-NLP/3-Translation-Sentiment/solution/R/README.md deleted file mode 100644 index 3a59d7a5d..000000000 --- a/translations/pt/6-NLP/3-Translation-Sentiment/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb b/translations/pt/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb deleted file mode 100644 index 5d4096b02..000000000 --- a/translations/pt/6-NLP/3-Translation-Sentiment/solution/notebook.ipynb +++ /dev/null @@ -1,100 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 4, - "coopTranslator": { - "original_hash": "27de2abc0235ebd22080fc8f1107454d", - "translation_date": "2025-09-03T20:58:04+00:00", - "source_file": "6-NLP/3-Translation-Sentiment/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "from textblob import TextBlob\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# You should download the book text, clean it, and import it here\n", - "with open(\"pride.txt\", encoding=\"utf8\") as f:\n", - " file_contents = f.read()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "book_pride = TextBlob(file_contents)\n", - "positive_sentiment_sentences = []\n", - "negative_sentiment_sentences = []" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "for sentence in book_pride.sentences:\n", - " if sentence.sentiment.polarity == 1:\n", - " positive_sentiment_sentences.append(sentence)\n", - " if sentence.sentiment.polarity == -1:\n", - " negative_sentiment_sentences.append(sentence)\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "print(\"The \" + str(len(positive_sentiment_sentences)) + \" most positive sentences:\")\n", - "for sentence in positive_sentiment_sentences:\n", - " print(\"+ \" + str(sentence.replace(\"\\n\", \"\").replace(\" \", \" \")))\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "print(\"The \" + str(len(negative_sentiment_sentences)) + \" most negative sentences:\")\n", - "for sentence in negative_sentiment_sentences:\n", - " print(\"- \" + str(sentence.replace(\"\\n\", \"\").replace(\" \", \" \")))" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/6-NLP/4-Hotel-Reviews-1/README.md b/translations/pt/6-NLP/4-Hotel-Reviews-1/README.md deleted file mode 100644 index fa339cb23..000000000 --- a/translations/pt/6-NLP/4-Hotel-Reviews-1/README.md +++ /dev/null @@ -1,417 +0,0 @@ - -# Análise de sentimentos com avaliações de hotéis - processamento de dados - -Nesta seção, vais utilizar as técnicas das lições anteriores para realizar uma análise exploratória de dados num conjunto de dados extenso. Depois de compreender bem a utilidade das várias colunas, vais aprender: - -- como remover as colunas desnecessárias -- como calcular novos dados com base nas colunas existentes -- como guardar o conjunto de dados resultante para uso no desafio final - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Introdução - -Até agora aprendeste que os dados textuais são bastante diferentes dos dados numéricos. Quando o texto é escrito ou falado por humanos, pode ser analisado para encontrar padrões, frequências, sentimentos e significados. Esta lição leva-te a um conjunto de dados real com um desafio real: **[515K Hotel Reviews Data in Europe](https://www.kaggle.com/jiashenliu/515k-hotel-reviews-data-in-europe)**, que inclui uma [licença CC0: Domínio Público](https://creativecommons.org/publicdomain/zero/1.0/). Os dados foram extraídos de Booking.com a partir de fontes públicas. O criador do conjunto de dados foi Jiashen Liu. - -### Preparação - -Vais precisar de: - -* Capacidade de executar notebooks .ipynb usando Python 3 -* pandas -* NLTK, [que deves instalar localmente](https://www.nltk.org/install.html) -* O conjunto de dados disponível no Kaggle [515K Hotel Reviews Data in Europe](https://www.kaggle.com/jiashenliu/515k-hotel-reviews-data-in-europe). Tem cerca de 230 MB descompactado. Faz o download para a pasta raiz `/data` associada a estas lições de NLP. - -## Análise exploratória de dados - -Este desafio assume que estás a construir um bot de recomendação de hotéis usando análise de sentimentos e pontuações de avaliações de hóspedes. O conjunto de dados que vais utilizar inclui avaliações de 1493 hotéis diferentes em 6 cidades. - -Usando Python, um conjunto de dados de avaliações de hotéis e a análise de sentimentos do NLTK, podes descobrir: - -* Quais são as palavras e frases mais frequentemente usadas nas avaliações? -* As *tags* oficiais que descrevem um hotel correlacionam-se com as pontuações das avaliações (por exemplo, há mais avaliações negativas para um hotel específico por *Famílias com crianças pequenas* do que por *Viajantes solitários*, talvez indicando que é mais adequado para *Viajantes solitários*)? -* As pontuações de sentimentos do NLTK "concordam" com a pontuação numérica do avaliador? - -#### Conjunto de dados - -Vamos explorar o conjunto de dados que descarregaste e guardaste localmente. Abre o ficheiro num editor como o VS Code ou até mesmo no Excel. - -Os cabeçalhos no conjunto de dados são os seguintes: - -*Hotel_Address, Additional_Number_of_Scoring, Review_Date, Average_Score, Hotel_Name, Reviewer_Nationality, Negative_Review, Review_Total_Negative_Word_Counts, Total_Number_of_Reviews, Positive_Review, Review_Total_Positive_Word_Counts, Total_Number_of_Reviews_Reviewer_Has_Given, Reviewer_Score, Tags, days_since_review, lat, lng* - -Aqui estão agrupados de forma que possam ser mais fáceis de examinar: -##### Colunas do hotel - -* `Hotel_Name`, `Hotel_Address`, `lat` (latitude), `lng` (longitude) - * Usando *lat* e *lng* podes criar um mapa com Python mostrando as localizações dos hotéis (talvez codificado por cores para avaliações negativas e positivas) - * Hotel_Address não parece ser muito útil para nós, e provavelmente será substituído por um país para facilitar a ordenação e pesquisa - -**Colunas de meta-avaliação do hotel** - -* `Average_Score` - * De acordo com o criador do conjunto de dados, esta coluna é a *Pontuação média do hotel, calculada com base no último comentário do último ano*. Parece uma forma incomum de calcular a pontuação, mas são os dados extraídos, então podemos aceitá-los como estão por agora. - - ✅ Com base nas outras colunas deste conjunto de dados, consegues pensar noutra forma de calcular a pontuação média? - -* `Total_Number_of_Reviews` - * O número total de avaliações que este hotel recebeu - não está claro (sem escrever algum código) se isto se refere às avaliações no conjunto de dados. -* `Additional_Number_of_Scoring` - * Isto significa que foi dada uma pontuação de avaliação, mas o avaliador não escreveu uma avaliação positiva ou negativa. - -**Colunas de avaliação** - -- `Reviewer_Score` - - Este é um valor numérico com, no máximo, 1 casa decimal entre os valores mínimos e máximos de 2.5 e 10 - - Não é explicado porque 2.5 é a pontuação mínima possível -- `Negative_Review` - - Se um avaliador não escreveu nada, este campo terá "**No Negative**" - - Nota que um avaliador pode escrever uma avaliação positiva na coluna de avaliação negativa (por exemplo, "não há nada de mau neste hotel") -- `Review_Total_Negative_Word_Counts` - - Contagens mais altas de palavras negativas indicam uma pontuação mais baixa (sem verificar a sentimentalidade) -- `Positive_Review` - - Se um avaliador não escreveu nada, este campo terá "**No Positive**" - - Nota que um avaliador pode escrever uma avaliação negativa na coluna de avaliação positiva (por exemplo, "não há nada de bom neste hotel") -- `Review_Total_Positive_Word_Counts` - - Contagens mais altas de palavras positivas indicam uma pontuação mais alta (sem verificar a sentimentalidade) -- `Review_Date` e `days_since_review` - - Pode ser aplicada uma medida de frescura ou desatualização a uma avaliação (avaliações mais antigas podem não ser tão precisas quanto as mais recentes porque a gestão do hotel mudou, ou foram feitas renovações, ou foi adicionada uma piscina, etc.) -- `Tags` - - Estas são descritores curtos que um avaliador pode selecionar para descrever o tipo de hóspede que era (por exemplo, solitário ou família), o tipo de quarto que teve, a duração da estadia e como a avaliação foi submetida. - - Infelizmente, usar estas tags é problemático, verifica a seção abaixo que discute a sua utilidade. - -**Colunas do avaliador** - -- `Total_Number_of_Reviews_Reviewer_Has_Given` - - Isto pode ser um fator num modelo de recomendação, por exemplo, se conseguires determinar que avaliadores mais prolíficos, com centenas de avaliações, eram mais propensos a serem negativos do que positivos. No entanto, o avaliador de qualquer avaliação específica não é identificado com um código único e, portanto, não pode ser ligado a um conjunto de avaliações. Existem 30 avaliadores com 100 ou mais avaliações, mas é difícil ver como isto pode ajudar o modelo de recomendação. -- `Reviewer_Nationality` - - Algumas pessoas podem pensar que certas nacionalidades são mais propensas a dar uma avaliação positiva ou negativa devido a uma inclinação nacional. Tem cuidado ao construir tais visões anedóticas nos teus modelos. Estes são estereótipos nacionais (e às vezes raciais), e cada avaliador foi um indivíduo que escreveu uma avaliação com base na sua experiência. Esta pode ter sido filtrada por muitas lentes, como as suas estadias anteriores em hotéis, a distância percorrida e o seu temperamento pessoal. Pensar que a nacionalidade foi a razão para uma pontuação de avaliação é difícil de justificar. - -##### Exemplos - -| Average Score | Total Number Reviews | Reviewer Score | Negative
Review | Positive Review | Tags | -| -------------- | ---------------------- | ---------------- || --------------------------------- | ----------------------------------------------------------------------------------------- | -| 7.8 | 1945 | 2.5 | Este não é atualmente um hotel, mas um local de construção. Fui aterrorizado desde cedo pela manhã e durante todo o dia com ruídos de construção inaceitáveis enquanto descansava após uma longa viagem e trabalhava no quarto. Pessoas estavam a trabalhar o dia todo, ou seja, com martelos pneumáticos nos quartos adjacentes. Pedi para mudar de quarto, mas não havia nenhum quarto silencioso disponível. Para piorar, fui cobrado em excesso. Fiz o check-out à noite, pois tinha um voo muito cedo e recebi uma fatura apropriada. Um dia depois, o hotel fez outra cobrança sem o meu consentimento, acima do preço reservado. É um lugar terrível. Não te castigues reservando aqui. | Nada. Lugar terrível. Fica longe. | Viagem de negócios. Casal. Quarto duplo standard. Ficou 2 noites. | - -Como podes ver, este hóspede não teve uma estadia feliz neste hotel. O hotel tem uma boa pontuação média de 7.8 e 1945 avaliações, mas este avaliador deu-lhe 2.5 e escreveu 115 palavras sobre como a sua estadia foi negativa. Se não escreveu nada na coluna Positive_Review, podes deduzir que não houve nada positivo, mas ainda assim escreveu 7 palavras de aviso. Se apenas contássemos palavras em vez do significado ou sentimento das palavras, poderíamos ter uma visão distorcida da intenção do avaliador. Estranhamente, a sua pontuação de 2.5 é confusa, porque se a estadia no hotel foi tão má, por que dar qualquer ponto? Investigando o conjunto de dados de perto, vais ver que a pontuação mínima possível é 2.5, não 0. A pontuação máxima possível é 10. - -##### Tags - -Como mencionado acima, à primeira vista, a ideia de usar `Tags` para categorizar os dados faz sentido. Infelizmente, estas tags não são padronizadas, o que significa que num dado hotel, as opções podem ser *Single room*, *Twin room* e *Double room*, mas no próximo hotel, são *Deluxe Single Room*, *Classic Queen Room* e *Executive King Room*. Podem ser a mesma coisa, mas há tantas variações que a escolha torna-se: - -1. Tentar alterar todos os termos para um único padrão, o que é muito difícil, porque não está claro qual seria o caminho de conversão em cada caso (por exemplo, *Classic single room* mapeia para *Single room*, mas *Superior Queen Room with Courtyard Garden or City View* é muito mais difícil de mapear) - -1. Podemos adotar uma abordagem de NLP e medir a frequência de certos termos como *Solo*, *Business Traveller* ou *Family with young kids* conforme se aplicam a cada hotel, e incluir isso na recomendação - -As tags geralmente (mas nem sempre) são um único campo contendo uma lista de 5 a 6 valores separados por vírgulas alinhados a *Tipo de viagem*, *Tipo de hóspedes*, *Tipo de quarto*, *Número de noites* e *Tipo de dispositivo em que a avaliação foi submetida*. No entanto, como alguns avaliadores não preenchem cada campo (podem deixar um em branco), os valores nem sempre estão na mesma ordem. - -Como exemplo, considera *Tipo de grupo*. Existem 1025 possibilidades únicas neste campo na coluna `Tags`, e infelizmente apenas algumas delas referem-se a um grupo (algumas são o tipo de quarto, etc.). Se filtrares apenas as que mencionam família, os resultados contêm muitos resultados do tipo *Family room*. Se incluíres o termo *with*, ou seja, contares os valores *Family with*, os resultados são melhores, com mais de 80.000 dos 515.000 resultados contendo a frase "Family with young children" ou "Family with older children". - -Isto significa que a coluna tags não é completamente inútil para nós, mas será necessário algum trabalho para torná-la útil. - -##### Pontuação média do hotel - -Existem algumas peculiaridades ou discrepâncias no conjunto de dados que não consigo entender, mas são ilustradas aqui para que estejas ciente delas ao construir os teus modelos. Se conseguires descobrir, por favor, avisa-nos na seção de discussão! - -O conjunto de dados tem as seguintes colunas relacionadas à pontuação média e ao número de avaliações: - -1. Hotel_Name -2. Additional_Number_of_Scoring -3. Average_Score -4. Total_Number_of_Reviews -5. Reviewer_Score - -O único hotel com mais avaliações neste conjunto de dados é *Britannia International Hotel Canary Wharf* com 4789 avaliações de um total de 515.000. Mas se olharmos para o valor `Total_Number_of_Reviews` deste hotel, é 9086. Podes deduzir que há muitas mais pontuações sem avaliações, então talvez devêssemos adicionar o valor da coluna `Additional_Number_of_Scoring`. Esse valor é 2682, e adicioná-lo a 4789 dá-nos 7471, que ainda está 1615 abaixo do `Total_Number_of_Reviews`. - -Se considerares a coluna `Average_Score`, podes deduzir que é a média das avaliações no conjunto de dados, mas a descrição do Kaggle é "*Pontuação média do hotel, calculada com base no último comentário do último ano*". Isso não parece muito útil, mas podemos calcular a nossa própria média com base nas pontuações das avaliações no conjunto de dados. Usando o mesmo hotel como exemplo, a pontuação média do hotel é dada como 7.1, mas a pontuação calculada (pontuação média do avaliador *no* conjunto de dados) é 6.8. Isto é próximo, mas não o mesmo valor, e só podemos supor que as pontuações dadas nas avaliações `Additional_Number_of_Scoring` aumentaram a média para 7.1. Infelizmente, sem forma de testar ou provar essa suposição, é difícil usar ou confiar em `Average_Score`, `Additional_Number_of_Scoring` e `Total_Number_of_Reviews` quando são baseados em, ou referem-se a, dados que não temos. - -Para complicar ainda mais, o hotel com o segundo maior número de avaliações tem uma pontuação média calculada de 8.12 e a `Average_Score` do conjunto de dados é 8.1. Esta pontuação correta é uma coincidência ou o primeiro hotel é uma discrepância? - -Na possibilidade de que estes hotéis possam ser um caso isolado, e que talvez a maioria dos valores se alinhem (mas alguns não por alguma razão), vamos escrever um pequeno programa a seguir para explorar os valores no conjunto de dados e determinar o uso correto (ou não uso) dos valores. -> 🚨 Uma nota de precaução -> -> Ao trabalhar com este conjunto de dados, irá escrever código que calcula algo a partir do texto sem ter de ler ou analisar o texto diretamente. Esta é a essência do NLP, interpretar significado ou sentimento sem que seja necessário um humano fazê-lo. No entanto, é possível que acabe por ler algumas das críticas negativas. Recomendo que não o faça, porque não é necessário. Algumas delas são disparatadas ou irrelevantes, como críticas negativas a hotéis do tipo "O tempo não estava bom", algo que está fora do controlo do hotel, ou de qualquer pessoa. Mas há também um lado sombrio em algumas críticas. Por vezes, as críticas negativas são racistas, sexistas ou preconceituosas em relação à idade. Isto é lamentável, mas esperado num conjunto de dados extraído de um site público. Alguns utilizadores deixam críticas que podem ser consideradas de mau gosto, desconfortáveis ou perturbadoras. É melhor deixar que o código avalie o sentimento do que lê-las e ficar incomodado. Dito isto, é uma minoria que escreve tais coisas, mas elas existem na mesma. -## Exercício - Exploração de dados -### Carregar os dados - -Já chega de examinar os dados visualmente, agora vais escrever algum código e obter respostas! Esta secção utiliza a biblioteca pandas. A tua primeira tarefa é garantir que consegues carregar e ler os dados CSV. A biblioteca pandas tem um carregador rápido de CSV, e o resultado é colocado num dataframe, como nas lições anteriores. O CSV que estamos a carregar tem mais de meio milhão de linhas, mas apenas 17 colunas. O pandas oferece muitas formas poderosas de interagir com um dataframe, incluindo a capacidade de realizar operações em cada linha. - -A partir daqui, nesta lição, haverá trechos de código e algumas explicações sobre o código, bem como discussões sobre o significado dos resultados. Usa o _notebook.ipynb_ incluído para o teu código. - -Vamos começar por carregar o ficheiro de dados que vais utilizar: - -```python -# Load the hotel reviews from CSV -import pandas as pd -import time -# importing time so the start and end time can be used to calculate file loading time -print("Loading data file now, this could take a while depending on file size") -start = time.time() -# df is 'DataFrame' - make sure you downloaded the file to the data folder -df = pd.read_csv('../../data/Hotel_Reviews.csv') -end = time.time() -print("Loading took " + str(round(end - start, 2)) + " seconds") -``` - -Agora que os dados estão carregados, podemos realizar algumas operações sobre eles. Mantém este código no topo do teu programa para a próxima parte. - -## Explorar os dados - -Neste caso, os dados já estão *limpos*, o que significa que estão prontos para trabalhar e não têm caracteres noutras línguas que possam causar problemas a algoritmos que esperam apenas caracteres em inglês. - -✅ Poderás ter de trabalhar com dados que requerem algum processamento inicial para os formatar antes de aplicar técnicas de NLP, mas não desta vez. Se tivesses de o fazer, como lidarias com caracteres não ingleses? - -Tira um momento para garantir que, uma vez carregados os dados, consegues explorá-los com código. É muito fácil querer focar nas colunas `Negative_Review` e `Positive_Review`. Elas estão preenchidas com texto natural para os teus algoritmos de NLP processarem. Mas espera! Antes de mergulhares no NLP e na análise de sentimentos, deves seguir o código abaixo para verificar se os valores fornecidos no conjunto de dados correspondem aos valores que calculas com pandas. - -## Operações no dataframe - -A primeira tarefa nesta lição é verificar se as seguintes afirmações estão corretas, escrevendo algum código que examine o dataframe (sem o alterar). - -> Tal como em muitas tarefas de programação, há várias formas de completar isto, mas um bom conselho é fazê-lo da forma mais simples e fácil possível, especialmente se for mais fácil de entender quando voltares a este código no futuro. Com dataframes, há uma API abrangente que frequentemente terá uma forma eficiente de fazer o que precisas. - -Trata as seguintes perguntas como tarefas de codificação e tenta respondê-las sem olhar para a solução. - -1. Imprime a *forma* do dataframe que acabaste de carregar (a forma é o número de linhas e colunas). -2. Calcula a contagem de frequência para as nacionalidades dos revisores: - 1. Quantos valores distintos existem na coluna `Reviewer_Nationality` e quais são eles? - 2. Qual é a nacionalidade de revisor mais comum no conjunto de dados (imprime o país e o número de revisões)? - 3. Quais são as 10 nacionalidades mais frequentes e a sua contagem de frequência? -3. Qual foi o hotel mais revisado para cada uma das 10 nacionalidades de revisores mais frequentes? -4. Quantas revisões existem por hotel (contagem de frequência de hotel) no conjunto de dados? -5. Embora exista uma coluna `Average_Score` para cada hotel no conjunto de dados, também podes calcular uma pontuação média (obtendo a média de todas as pontuações dos revisores no conjunto de dados para cada hotel). Adiciona uma nova coluna ao teu dataframe com o cabeçalho `Calc_Average_Score` que contém essa média calculada. -6. Algum hotel tem o mesmo valor (arredondado a 1 casa decimal) para `Average_Score` e `Calc_Average_Score`? - 1. Tenta escrever uma função Python que receba uma Série (linha) como argumento e compare os valores, imprimindo uma mensagem quando os valores não forem iguais. Depois usa o método `.apply()` para processar cada linha com a função. -7. Calcula e imprime quantas linhas têm valores "No Negative" na coluna `Negative_Review`. -8. Calcula e imprime quantas linhas têm valores "No Positive" na coluna `Positive_Review`. -9. Calcula e imprime quantas linhas têm valores "No Positive" na coluna `Positive_Review` **e** valores "No Negative" na coluna `Negative_Review`. - -### Respostas em código - -1. Imprime a *forma* do dataframe que acabaste de carregar (a forma é o número de linhas e colunas). - - ```python - print("The shape of the data (rows, cols) is " + str(df.shape)) - > The shape of the data (rows, cols) is (515738, 17) - ``` - -2. Calcula a contagem de frequência para as nacionalidades dos revisores: - - 1. Quantos valores distintos existem na coluna `Reviewer_Nationality` e quais são eles? - 2. Qual é a nacionalidade de revisor mais comum no conjunto de dados (imprime o país e o número de revisões)? - - ```python - # value_counts() creates a Series object that has index and values in this case, the country and the frequency they occur in reviewer nationality - nationality_freq = df["Reviewer_Nationality"].value_counts() - print("There are " + str(nationality_freq.size) + " different nationalities") - # print first and last rows of the Series. Change to nationality_freq.to_string() to print all of the data - print(nationality_freq) - - There are 227 different nationalities - United Kingdom 245246 - United States of America 35437 - Australia 21686 - Ireland 14827 - United Arab Emirates 10235 - ... - Comoros 1 - Palau 1 - Northern Mariana Islands 1 - Cape Verde 1 - Guinea 1 - Name: Reviewer_Nationality, Length: 227, dtype: int64 - ``` - - 3. Quais são as 10 nacionalidades mais frequentes e a sua contagem de frequência? - - ```python - print("The highest frequency reviewer nationality is " + str(nationality_freq.index[0]).strip() + " with " + str(nationality_freq[0]) + " reviews.") - # Notice there is a leading space on the values, strip() removes that for printing - # What is the top 10 most common nationalities and their frequencies? - print("The next 10 highest frequency reviewer nationalities are:") - print(nationality_freq[1:11].to_string()) - - The highest frequency reviewer nationality is United Kingdom with 245246 reviews. - The next 10 highest frequency reviewer nationalities are: - United States of America 35437 - Australia 21686 - Ireland 14827 - United Arab Emirates 10235 - Saudi Arabia 8951 - Netherlands 8772 - Switzerland 8678 - Germany 7941 - Canada 7894 - France 7296 - ``` - -3. Qual foi o hotel mais revisado para cada uma das 10 nacionalidades de revisores mais frequentes? - - ```python - # What was the most frequently reviewed hotel for the top 10 nationalities - # Normally with pandas you will avoid an explicit loop, but wanted to show creating a new dataframe using criteria (don't do this with large amounts of data because it could be very slow) - for nat in nationality_freq[:10].index: - # First, extract all the rows that match the criteria into a new dataframe - nat_df = df[df["Reviewer_Nationality"] == nat] - # Now get the hotel freq - freq = nat_df["Hotel_Name"].value_counts() - print("The most reviewed hotel for " + str(nat).strip() + " was " + str(freq.index[0]) + " with " + str(freq[0]) + " reviews.") - - The most reviewed hotel for United Kingdom was Britannia International Hotel Canary Wharf with 3833 reviews. - The most reviewed hotel for United States of America was Hotel Esther a with 423 reviews. - The most reviewed hotel for Australia was Park Plaza Westminster Bridge London with 167 reviews. - The most reviewed hotel for Ireland was Copthorne Tara Hotel London Kensington with 239 reviews. - The most reviewed hotel for United Arab Emirates was Millennium Hotel London Knightsbridge with 129 reviews. - The most reviewed hotel for Saudi Arabia was The Cumberland A Guoman Hotel with 142 reviews. - The most reviewed hotel for Netherlands was Jaz Amsterdam with 97 reviews. - The most reviewed hotel for Switzerland was Hotel Da Vinci with 97 reviews. - The most reviewed hotel for Germany was Hotel Da Vinci with 86 reviews. - The most reviewed hotel for Canada was St James Court A Taj Hotel London with 61 reviews. - ``` - -4. Quantas revisões existem por hotel (contagem de frequência de hotel) no conjunto de dados? - - ```python - # First create a new dataframe based on the old one, removing the uneeded columns - hotel_freq_df = df.drop(["Hotel_Address", "Additional_Number_of_Scoring", "Review_Date", "Average_Score", "Reviewer_Nationality", "Negative_Review", "Review_Total_Negative_Word_Counts", "Positive_Review", "Review_Total_Positive_Word_Counts", "Total_Number_of_Reviews_Reviewer_Has_Given", "Reviewer_Score", "Tags", "days_since_review", "lat", "lng"], axis = 1) - - # Group the rows by Hotel_Name, count them and put the result in a new column Total_Reviews_Found - hotel_freq_df['Total_Reviews_Found'] = hotel_freq_df.groupby('Hotel_Name').transform('count') - - # Get rid of all the duplicated rows - hotel_freq_df = hotel_freq_df.drop_duplicates(subset = ["Hotel_Name"]) - display(hotel_freq_df) - ``` - | Hotel_Name | Total_Number_of_Reviews | Total_Reviews_Found | - | :----------------------------------------: | :---------------------: | :-----------------: | - | Britannia International Hotel Canary Wharf | 9086 | 4789 | - | Park Plaza Westminster Bridge London | 12158 | 4169 | - | Copthorne Tara Hotel London Kensington | 7105 | 3578 | - | ... | ... | ... | - | Mercure Paris Porte d Orleans | 110 | 10 | - | Hotel Wagner | 135 | 10 | - | Hotel Gallitzinberg | 173 | 8 | - - Podes notar que os resultados *contados no conjunto de dados* não correspondem ao valor em `Total_Number_of_Reviews`. Não está claro se este valor no conjunto de dados representa o número total de revisões que o hotel teve, mas nem todas foram recolhidas, ou algum outro cálculo. `Total_Number_of_Reviews` não é usado no modelo devido a esta falta de clareza. - -5. Embora exista uma coluna `Average_Score` para cada hotel no conjunto de dados, também podes calcular uma pontuação média (obtendo a média de todas as pontuações dos revisores no conjunto de dados para cada hotel). Adiciona uma nova coluna ao teu dataframe com o cabeçalho `Calc_Average_Score` que contém essa média calculada. Imprime as colunas `Hotel_Name`, `Average_Score` e `Calc_Average_Score`. - - ```python - # define a function that takes a row and performs some calculation with it - def get_difference_review_avg(row): - return row["Average_Score"] - row["Calc_Average_Score"] - - # 'mean' is mathematical word for 'average' - df['Calc_Average_Score'] = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1) - - # Add a new column with the difference between the two average scores - df["Average_Score_Difference"] = df.apply(get_difference_review_avg, axis = 1) - - # Create a df without all the duplicates of Hotel_Name (so only 1 row per hotel) - review_scores_df = df.drop_duplicates(subset = ["Hotel_Name"]) - - # Sort the dataframe to find the lowest and highest average score difference - review_scores_df = review_scores_df.sort_values(by=["Average_Score_Difference"]) - - display(review_scores_df[["Average_Score_Difference", "Average_Score", "Calc_Average_Score", "Hotel_Name"]]) - ``` - - Podes também questionar-te sobre o valor de `Average_Score` e porque é que às vezes é diferente da pontuação média calculada. Como não podemos saber porque é que alguns dos valores coincidem, mas outros têm uma diferença, é mais seguro, neste caso, usar as pontuações das revisões que temos para calcular a média nós mesmos. Dito isto, as diferenças são geralmente muito pequenas. Aqui estão os hotéis com a maior diferença entre a média do conjunto de dados e a média calculada: - - | Average_Score_Difference | Average_Score | Calc_Average_Score | Hotel_Name | - | :----------------------: | :-----------: | :----------------: | ------------------------------------------: | - | -0.8 | 7.7 | 8.5 | Best Western Hotel Astoria | - | -0.7 | 8.8 | 9.5 | Hotel Stendhal Place Vend me Paris MGallery | - | -0.7 | 7.5 | 8.2 | Mercure Paris Porte d Orleans | - | -0.7 | 7.9 | 8.6 | Renaissance Paris Vendome Hotel | - | -0.5 | 7.0 | 7.5 | Hotel Royal Elys es | - | ... | ... | ... | ... | - | 0.7 | 7.5 | 6.8 | Mercure Paris Op ra Faubourg Montmartre | - | 0.8 | 7.1 | 6.3 | Holiday Inn Paris Montparnasse Pasteur | - | 0.9 | 6.8 | 5.9 | Villa Eugenie | - | 0.9 | 8.6 | 7.7 | MARQUIS Faubourg St Honor Relais Ch teaux | - | 1.3 | 7.2 | 5.9 | Kube Hotel Ice Bar | - - Com apenas 1 hotel tendo uma diferença de pontuação maior que 1, significa que provavelmente podemos ignorar a diferença e usar a pontuação média calculada. - -6. Calcula e imprime quantas linhas têm valores "No Negative" na coluna `Negative_Review`. - -7. Calcula e imprime quantas linhas têm valores "No Positive" na coluna `Positive_Review`. - -8. Calcula e imprime quantas linhas têm valores "No Positive" na coluna `Positive_Review` **e** valores "No Negative" na coluna `Negative_Review`. - - ```python - # with lambdas: - start = time.time() - no_negative_reviews = df.apply(lambda x: True if x['Negative_Review'] == "No Negative" else False , axis=1) - print("Number of No Negative reviews: " + str(len(no_negative_reviews[no_negative_reviews == True].index))) - - no_positive_reviews = df.apply(lambda x: True if x['Positive_Review'] == "No Positive" else False , axis=1) - print("Number of No Positive reviews: " + str(len(no_positive_reviews[no_positive_reviews == True].index))) - - both_no_reviews = df.apply(lambda x: True if x['Negative_Review'] == "No Negative" and x['Positive_Review'] == "No Positive" else False , axis=1) - print("Number of both No Negative and No Positive reviews: " + str(len(both_no_reviews[both_no_reviews == True].index))) - end = time.time() - print("Lambdas took " + str(round(end - start, 2)) + " seconds") - - Number of No Negative reviews: 127890 - Number of No Positive reviews: 35946 - Number of both No Negative and No Positive reviews: 127 - Lambdas took 9.64 seconds - ``` - -## Outra forma - -Outra forma de contar itens sem Lambdas, e usar sum para contar as linhas: - - ```python - # without lambdas (using a mixture of notations to show you can use both) - start = time.time() - no_negative_reviews = sum(df.Negative_Review == "No Negative") - print("Number of No Negative reviews: " + str(no_negative_reviews)) - - no_positive_reviews = sum(df["Positive_Review"] == "No Positive") - print("Number of No Positive reviews: " + str(no_positive_reviews)) - - both_no_reviews = sum((df.Negative_Review == "No Negative") & (df.Positive_Review == "No Positive")) - print("Number of both No Negative and No Positive reviews: " + str(both_no_reviews)) - - end = time.time() - print("Sum took " + str(round(end - start, 2)) + " seconds") - - Number of No Negative reviews: 127890 - Number of No Positive reviews: 35946 - Number of both No Negative and No Positive reviews: 127 - Sum took 0.19 seconds - ``` - - Podes ter notado que há 127 linhas que têm ambos os valores "No Negative" e "No Positive" nas colunas `Negative_Review` e `Positive_Review`, respetivamente. Isso significa que o revisor deu ao hotel uma pontuação numérica, mas optou por não escrever uma revisão positiva ou negativa. Felizmente, isto é uma pequena quantidade de linhas (127 de 515738, ou 0,02%), então provavelmente não vai enviesar o nosso modelo ou resultados numa direção particular, mas talvez não esperasses que um conjunto de dados de revisões tivesse linhas sem revisões, por isso vale a pena explorar os dados para descobrir linhas como esta. - -Agora que exploraste o conjunto de dados, na próxima lição vais filtrar os dados e adicionar alguma análise de sentimentos. - ---- -## 🚀Desafio - -Esta lição demonstra, como vimos em lições anteriores, quão importante é entender os teus dados e as suas peculiaridades antes de realizar operações sobre eles. Dados baseados em texto, em particular, requerem uma análise cuidadosa. Explora vários conjuntos de dados ricos em texto e vê se consegues descobrir áreas que poderiam introduzir enviesamento ou sentimentos distorcidos num modelo. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Segue [este percurso de aprendizagem sobre NLP](https://docs.microsoft.com/learn/paths/explore-natural-language-processing/?WT.mc_id=academic-77952-leestott) para descobrir ferramentas que podes experimentar ao construir modelos baseados em fala e texto. - -## Tarefa - -[NLTK](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/4-Hotel-Reviews-1/assignment.md b/translations/pt/6-NLP/4-Hotel-Reviews-1/assignment.md deleted file mode 100644 index 5913b8a2e..000000000 --- a/translations/pt/6-NLP/4-Hotel-Reviews-1/assignment.md +++ /dev/null @@ -1,19 +0,0 @@ - -# NLTK - -## Instruções - -NLTK é uma biblioteca bem conhecida para uso em linguística computacional e NLP. Aproveite esta oportunidade para ler o '[livro do NLTK](https://www.nltk.org/book/)' e experimentar os seus exercícios. Nesta tarefa não avaliada, terá a oportunidade de conhecer esta biblioteca mais a fundo. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/4-Hotel-Reviews-1/notebook.ipynb b/translations/pt/6-NLP/4-Hotel-Reviews-1/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md b/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md deleted file mode 100644 index 3c5c39439..000000000 --- a/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/R/README.md b/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/R/README.md deleted file mode 100644 index 5fd88e1ba..000000000 --- a/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb b/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb deleted file mode 100644 index 91db36129..000000000 --- a/translations/pt/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb +++ /dev/null @@ -1,174 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 4, - "coopTranslator": { - "original_hash": "2d05e7db439376aa824f4b387f8324ca", - "translation_date": "2025-09-03T20:57:46+00:00", - "source_file": "6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# EDA\n", - "import pandas as pd\n", - "import time" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "def get_difference_review_avg(row):\n", - " return row[\"Average_Score\"] - row[\"Calc_Average_Score\"]" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV\n", - "print(\"Loading data file now, this could take a while depending on file size\")\n", - "start = time.time()\n", - "df = pd.read_csv('../../data/Hotel_Reviews.csv')\n", - "end = time.time()\n", - "print(\"Loading took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What shape is the data (rows, columns)?\n", - "print(\"The shape of the data (rows, cols) is \" + str(df.shape))\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# value_counts() creates a Series object that has index and values\n", - "# in this case, the country and the frequency they occur in reviewer nationality\n", - "nationality_freq = df[\"Reviewer_Nationality\"].value_counts()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What reviewer nationality is the most common in the dataset?\n", - "print(\"The highest frequency reviewer nationality is \" + str(nationality_freq.index[0]).strip() + \" with \" + str(nationality_freq[0]) + \" reviews.\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What is the top 10 most common nationalities and their frequencies?\n", - "print(\"The top 10 highest frequency reviewer nationalities are:\")\n", - "print(nationality_freq[0:10].to_string())\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# How many unique nationalities are there?\n", - "print(\"There are \" + str(nationality_freq.index.size) + \" unique nationalities in the dataset\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# What was the most frequently reviewed hotel for the top 10 nationalities - print the hotel and number of reviews\n", - "for nat in nationality_freq[:10].index:\n", - " # First, extract all the rows that match the criteria into a new dataframe\n", - " nat_df = df[df[\"Reviewer_Nationality\"] == nat] \n", - " # Now get the hotel freq\n", - " freq = nat_df[\"Hotel_Name\"].value_counts()\n", - " print(\"The most reviewed hotel for \" + str(nat).strip() + \" was \" + str(freq.index[0]) + \" with \" + str(freq[0]) + \" reviews.\") \n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# How many reviews are there per hotel (frequency count of hotel) and do the results match the value in `Total_Number_of_Reviews`?\n", - "# First create a new dataframe based on the old one, removing the uneeded columns\n", - "hotel_freq_df = df.drop([\"Hotel_Address\", \"Additional_Number_of_Scoring\", \"Review_Date\", \"Average_Score\", \"Reviewer_Nationality\", \"Negative_Review\", \"Review_Total_Negative_Word_Counts\", \"Positive_Review\", \"Review_Total_Positive_Word_Counts\", \"Total_Number_of_Reviews_Reviewer_Has_Given\", \"Reviewer_Score\", \"Tags\", \"days_since_review\", \"lat\", \"lng\"], axis = 1)\n", - "# Group the rows by Hotel_Name, count them and put the result in a new column Total_Reviews_Found\n", - "hotel_freq_df['Total_Reviews_Found'] = hotel_freq_df.groupby('Hotel_Name').transform('count')\n", - "# Get rid of all the duplicated rows\n", - "hotel_freq_df = hotel_freq_df.drop_duplicates(subset = [\"Hotel_Name\"])\n", - "print()\n", - "print(hotel_freq_df.to_string())\n", - "print(str(hotel_freq_df.shape))" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# While there is an `Average_Score` for each hotel according to the dataset, \n", - "# you can also calculate an average score (getting the average of all reviewer scores in the dataset for each hotel)\n", - "# Add a new column to your dataframe with the column header `Calc_Average_Score` that contains that calculated average. \n", - "df['Calc_Average_Score'] = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1)\n", - "# Add a new column with the difference between the two average scores\n", - "df[\"Average_Score_Difference\"] = df.apply(get_difference_review_avg, axis = 1)\n", - "# Create a df without all the duplicates of Hotel_Name (so only 1 row per hotel)\n", - "review_scores_df = df.drop_duplicates(subset = [\"Hotel_Name\"])\n", - "# Sort the dataframe to find the lowest and highest average score difference\n", - "review_scores_df = review_scores_df.sort_values(by=[\"Average_Score_Difference\"])\n", - "print(review_scores_df[[\"Average_Score_Difference\", \"Average_Score\", \"Calc_Average_Score\", \"Hotel_Name\"]])\n", - "# Do any hotels have the same (rounded to 1 decimal place) `Average_Score` and `Calc_Average_Score`?\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/README.md b/translations/pt/6-NLP/5-Hotel-Reviews-2/README.md deleted file mode 100644 index 44dcd6c5c..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/README.md +++ /dev/null @@ -1,389 +0,0 @@ - -# Análise de sentimentos com avaliações de hotéis - -Agora que exploraste o conjunto de dados em detalhe, é hora de filtrar as colunas e usar técnicas de NLP no conjunto de dados para obter novos insights sobre os hotéis. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -### Operações de Filtragem e Análise de Sentimentos - -Como provavelmente já reparaste, o conjunto de dados tem alguns problemas. Algumas colunas estão preenchidas com informações inúteis, outras parecem incorretas. Mesmo que estejam corretas, não é claro como foram calculadas, e as respostas não podem ser verificadas de forma independente pelos teus próprios cálculos. - -## Exercício: mais um pouco de processamento de dados - -Limpa os dados um pouco mais. Adiciona colunas que serão úteis mais tarde, altera os valores em outras colunas e elimina certas colunas completamente. - -1. Processamento inicial de colunas - - 1. Elimina `lat` e `lng` - - 2. Substitui os valores de `Hotel_Address` pelos seguintes valores (se o endereço contiver o nome da cidade e do país, altera para apenas a cidade e o país). - - Estas são as únicas cidades e países no conjunto de dados: - - Amesterdão, Países Baixos - - Barcelona, Espanha - - Londres, Reino Unido - - Milão, Itália - - Paris, França - - Viena, Áustria - - ```python - def replace_address(row): - if "Netherlands" in row["Hotel_Address"]: - return "Amsterdam, Netherlands" - elif "Barcelona" in row["Hotel_Address"]: - return "Barcelona, Spain" - elif "United Kingdom" in row["Hotel_Address"]: - return "London, United Kingdom" - elif "Milan" in row["Hotel_Address"]: - return "Milan, Italy" - elif "France" in row["Hotel_Address"]: - return "Paris, France" - elif "Vienna" in row["Hotel_Address"]: - return "Vienna, Austria" - - # Replace all the addresses with a shortened, more useful form - df["Hotel_Address"] = df.apply(replace_address, axis = 1) - # The sum of the value_counts() should add up to the total number of reviews - print(df["Hotel_Address"].value_counts()) - ``` - - Agora podes consultar dados a nível de país: - - ```python - display(df.groupby("Hotel_Address").agg({"Hotel_Name": "nunique"})) - ``` - - | Hotel_Address | Hotel_Name | - | :--------------------- | :--------: | - | Amesterdão, Países Baixos | 105 | - | Barcelona, Espanha | 211 | - | Londres, Reino Unido | 400 | - | Milão, Itália | 162 | - | Paris, França | 458 | - | Viena, Áustria | 158 | - -2. Processar colunas de meta-avaliação dos hotéis - - 1. Elimina `Additional_Number_of_Scoring` - - 1. Substitui `Total_Number_of_Reviews` pelo número total de avaliações para aquele hotel que estão realmente no conjunto de dados - - 1. Substitui `Average_Score` pela nossa própria pontuação calculada - - ```python - # Drop `Additional_Number_of_Scoring` - df.drop(["Additional_Number_of_Scoring"], axis = 1, inplace=True) - # Replace `Total_Number_of_Reviews` and `Average_Score` with our own calculated values - df.Total_Number_of_Reviews = df.groupby('Hotel_Name').transform('count') - df.Average_Score = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1) - ``` - -3. Processar colunas de avaliação - - 1. Elimina `Review_Total_Negative_Word_Counts`, `Review_Total_Positive_Word_Counts`, `Review_Date` e `days_since_review` - - 2. Mantém `Reviewer_Score`, `Negative_Review` e `Positive_Review` como estão - - 3. Mantém `Tags` por agora - - - Faremos algumas operações adicionais de filtragem nas tags na próxima seção e depois as tags serão eliminadas - -4. Processar colunas de avaliadores - - 1. Elimina `Total_Number_of_Reviews_Reviewer_Has_Given` - - 2. Mantém `Reviewer_Nationality` - -### Colunas de Tags - -A coluna `Tag` é problemática, pois é uma lista (em formato de texto) armazenada na coluna. Infelizmente, a ordem e o número de subsecções nesta coluna nem sempre são os mesmos. É difícil para um humano identificar as frases corretas de interesse, porque há 515.000 linhas e 1427 hotéis, e cada um tem opções ligeiramente diferentes que um avaliador poderia escolher. É aqui que o NLP se destaca. Podes analisar o texto e encontrar as frases mais comuns, e contá-las. - -Infelizmente, não estamos interessados em palavras isoladas, mas em frases compostas (por exemplo, *Viagem de negócios*). Executar um algoritmo de distribuição de frequência de frases compostas em tantos dados (6762646 palavras) poderia levar um tempo extraordinário, mas sem olhar para os dados, pareceria que isso é uma despesa necessária. É aqui que a análise exploratória de dados é útil, porque já viste uma amostra das tags como `[' Viagem de negócios ', ' Viajante sozinho ', ' Quarto individual ', ' Ficou 5 noites ', ' Enviado de um dispositivo móvel ']`, podes começar a perguntar se é possível reduzir drasticamente o processamento que tens de fazer. Felizmente, é - mas primeiro precisas seguir alguns passos para determinar as tags de interesse. - -### Filtragem de tags - -Lembra-te de que o objetivo do conjunto de dados é adicionar sentimentos e colunas que te ajudem a escolher o melhor hotel (para ti ou talvez para um cliente que te encarregue de criar um bot de recomendação de hotéis). Precisas perguntar-te se as tags são úteis ou não no conjunto de dados final. Aqui está uma interpretação (se precisasses do conjunto de dados para outros fins, tags diferentes poderiam permanecer/ser excluídas da seleção): - -1. O tipo de viagem é relevante e deve permanecer -2. O tipo de grupo de hóspedes é importante e deve permanecer -3. O tipo de quarto, suíte ou estúdio em que o hóspede ficou é irrelevante (todos os hotéis têm basicamente os mesmos quartos) -4. O dispositivo no qual a avaliação foi enviada é irrelevante -5. O número de noites que o avaliador ficou *poderia* ser relevante se atribuísses estadias mais longas a gostar mais do hotel, mas é um pouco forçado e provavelmente irrelevante - -Em resumo, **mantém 2 tipos de tags e remove as outras**. - -Primeiro, não queres contar as tags até que estejam num formato melhor, o que significa remover os colchetes e aspas. Podes fazer isso de várias maneiras, mas queres a mais rápida, pois pode levar muito tempo para processar muitos dados. Felizmente, o pandas tem uma maneira fácil de realizar cada um desses passos. - -```Python -# Remove opening and closing brackets -df.Tags = df.Tags.str.strip("[']") -# remove all quotes too -df.Tags = df.Tags.str.replace(" ', '", ",", regex = False) -``` - -Cada tag torna-se algo como: `Viagem de negócios, Viajante sozinho, Quarto individual, Ficou 5 noites, Enviado de um dispositivo móvel`. - -A seguir, encontramos um problema. Algumas avaliações, ou linhas, têm 5 colunas, outras 3, outras 6. Isso é resultado de como o conjunto de dados foi criado e difícil de corrigir. Queres obter uma contagem de frequência de cada frase, mas elas estão em ordens diferentes em cada avaliação, então a contagem pode estar errada e um hotel pode não receber uma tag atribuída que merecia. - -Em vez disso, vais usar a ordem diferente a nosso favor, porque cada tag é composta por várias palavras, mas também separada por uma vírgula! A maneira mais simples de fazer isso é criar 6 colunas temporárias com cada tag inserida na coluna correspondente à sua ordem na tag. Podes então fundir as 6 colunas numa grande coluna e executar o método `value_counts()` na coluna resultante. Ao imprimir isso, verás que havia 2428 tags únicas. Aqui está uma pequena amostra: - -| Tag | Contagem | -| ------------------------------ | -------- | -| Viagem de lazer | 417778 | -| Enviado de um dispositivo móvel| 307640 | -| Casal | 252294 | -| Ficou 1 noite | 193645 | -| Ficou 2 noites | 133937 | -| Viajante sozinho | 108545 | -| Ficou 3 noites | 95821 | -| Viagem de negócios | 82939 | -| Grupo | 65392 | -| Família com crianças pequenas | 61015 | -| Ficou 4 noites | 47817 | -| Quarto duplo | 35207 | -| Quarto duplo padrão | 32248 | -| Quarto duplo superior | 31393 | -| Família com crianças mais velhas| 26349 | -| Quarto duplo deluxe | 24823 | -| Quarto duplo ou twin | 22393 | -| Ficou 5 noites | 20845 | -| Quarto duplo ou twin padrão | 17483 | -| Quarto duplo clássico | 16989 | -| Quarto duplo ou twin superior | 13570 | -| 2 quartos | 12393 | - -Algumas das tags comuns como `Enviado de um dispositivo móvel` não são úteis para nós, então pode ser inteligente removê-las antes de contar a ocorrência de frases, mas é uma operação tão rápida que podes deixá-las e ignorá-las. - -### Remover tags de duração da estadia - -Remover estas tags é o passo 1, reduzindo ligeiramente o número total de tags a serem consideradas. Nota que não as removes do conjunto de dados, apenas escolhes removê-las da consideração como valores a contar/manter no conjunto de dados de avaliações. - -| Duração da estadia | Contagem | -| ------------------ | -------- | -| Ficou 1 noite | 193645 | -| Ficou 2 noites | 133937 | -| Ficou 3 noites | 95821 | -| Ficou 4 noites | 47817 | -| Ficou 5 noites | 20845 | -| Ficou 6 noites | 9776 | -| Ficou 7 noites | 7399 | -| Ficou 8 noites | 2502 | -| Ficou 9 noites | 1293 | -| ... | ... | - -Há uma enorme variedade de quartos, suítes, estúdios, apartamentos e assim por diante. Todos significam mais ou menos a mesma coisa e não são relevantes para ti, então remove-os da consideração. - -| Tipo de quarto | Contagem | -| ------------------------------- | -------- | -| Quarto duplo | 35207 | -| Quarto duplo padrão | 32248 | -| Quarto duplo superior | 31393 | -| Quarto duplo deluxe | 24823 | -| Quarto duplo ou twin | 22393 | -| Quarto duplo ou twin padrão | 17483 | -| Quarto duplo clássico | 16989 | -| Quarto duplo ou twin superior | 13570 | - -Finalmente, e isto é encantador (porque não exigiu muito processamento), ficarás com as seguintes tags *úteis*: - -| Tag | Contagem | -| --------------------------------------------- | -------- | -| Viagem de lazer | 417778 | -| Casal | 252294 | -| Viajante sozinho | 108545 | -| Viagem de negócios | 82939 | -| Grupo (combinado com Viajantes com amigos) | 67535 | -| Família com crianças pequenas | 61015 | -| Família com crianças mais velhas | 26349 | -| Com um animal de estimação | 1405 | - -Poderias argumentar que `Viajantes com amigos` é o mesmo que `Grupo` mais ou menos, e seria justo combinar os dois como acima. O código para identificar as tags corretas está no [notebook de Tags](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb). - -O passo final é criar novas colunas para cada uma destas tags. Depois, para cada linha de avaliação, se a coluna `Tag` corresponder a uma das novas colunas, adiciona um 1, caso contrário, adiciona um 0. O resultado final será uma contagem de quantos avaliadores escolheram este hotel (em agregado) para, por exemplo, negócios vs lazer, ou para levar um animal de estimação, e esta é uma informação útil ao recomendar um hotel. - -```python -# Process the Tags into new columns -# The file Hotel_Reviews_Tags.py, identifies the most important tags -# Leisure trip, Couple, Solo traveler, Business trip, Group combined with Travelers with friends, -# Family with young children, Family with older children, With a pet -df["Leisure_trip"] = df.Tags.apply(lambda tag: 1 if "Leisure trip" in tag else 0) -df["Couple"] = df.Tags.apply(lambda tag: 1 if "Couple" in tag else 0) -df["Solo_traveler"] = df.Tags.apply(lambda tag: 1 if "Solo traveler" in tag else 0) -df["Business_trip"] = df.Tags.apply(lambda tag: 1 if "Business trip" in tag else 0) -df["Group"] = df.Tags.apply(lambda tag: 1 if "Group" in tag or "Travelers with friends" in tag else 0) -df["Family_with_young_children"] = df.Tags.apply(lambda tag: 1 if "Family with young children" in tag else 0) -df["Family_with_older_children"] = df.Tags.apply(lambda tag: 1 if "Family with older children" in tag else 0) -df["With_a_pet"] = df.Tags.apply(lambda tag: 1 if "With a pet" in tag else 0) - -``` - -### Salvar o ficheiro - -Finalmente, salva o conjunto de dados como está agora com um novo nome. - -```python -df.drop(["Review_Total_Negative_Word_Counts", "Review_Total_Positive_Word_Counts", "days_since_review", "Total_Number_of_Reviews_Reviewer_Has_Given"], axis = 1, inplace=True) - -# Saving new data file with calculated columns -print("Saving results to Hotel_Reviews_Filtered.csv") -df.to_csv(r'../data/Hotel_Reviews_Filtered.csv', index = False) -``` - -## Operações de Análise de Sentimentos - -Nesta última seção, vais aplicar análise de sentimentos às colunas de avaliação e salvar os resultados num conjunto de dados. - -## Exercício: carregar e salvar os dados filtrados - -Nota que agora estás a carregar o conjunto de dados filtrado que foi salvo na seção anterior, **não** o conjunto de dados original. - -```python -import time -import pandas as pd -import nltk as nltk -from nltk.corpus import stopwords -from nltk.sentiment.vader import SentimentIntensityAnalyzer -nltk.download('vader_lexicon') - -# Load the filtered hotel reviews from CSV -df = pd.read_csv('../../data/Hotel_Reviews_Filtered.csv') - -# You code will be added here - - -# Finally remember to save the hotel reviews with new NLP data added -print("Saving results to Hotel_Reviews_NLP.csv") -df.to_csv(r'../data/Hotel_Reviews_NLP.csv', index = False) -``` - -### Remover palavras irrelevantes - -Se fosses executar a Análise de Sentimentos nas colunas de Avaliação Negativa e Avaliação Positiva, poderia levar muito tempo. Testado num portátil de teste poderoso com CPU rápida, levou 12 - 14 minutos dependendo da biblioteca de sentimentos usada. Esse é um tempo (relativamente) longo, então vale a pena investigar se isso pode ser acelerado. - -Remover palavras irrelevantes, ou palavras comuns em inglês que não alteram o sentimento de uma frase, é o primeiro passo. Ao removê-las, a análise de sentimentos deve ser mais rápida, mas não menos precisa (já que as palavras irrelevantes não afetam o sentimento, mas sim desaceleram a análise). - -A avaliação negativa mais longa tinha 395 palavras, mas após remover as palavras irrelevantes, ficou com 195 palavras. - -Remover as palavras irrelevantes também é uma operação rápida, removê-las de 2 colunas de avaliação em mais de 515.000 linhas levou 3,3 segundos no dispositivo de teste. Pode levar um pouco mais ou menos tempo para ti, dependendo da velocidade do CPU do teu dispositivo, RAM, se tens um SSD ou não, e alguns outros fatores. A relativa rapidez da operação significa que, se melhorar o tempo de análise de sentimentos, então vale a pena fazer. - -```python -from nltk.corpus import stopwords - -# Load the hotel reviews from CSV -df = pd.read_csv("../../data/Hotel_Reviews_Filtered.csv") - -# Remove stop words - can be slow for a lot of text! -# Ryan Han (ryanxjhan on Kaggle) has a great post measuring performance of different stop words removal approaches -# https://www.kaggle.com/ryanxjhan/fast-stop-words-removal # using the approach that Ryan recommends -start = time.time() -cache = set(stopwords.words("english")) -def remove_stopwords(review): - text = " ".join([word for word in review.split() if word not in cache]) - return text - -# Remove the stop words from both columns -df.Negative_Review = df.Negative_Review.apply(remove_stopwords) -df.Positive_Review = df.Positive_Review.apply(remove_stopwords) -``` - -### Realizar análise de sentimentos - -Agora deves calcular a análise de sentimentos para ambas as colunas de avaliação negativa e positiva, e armazenar o resultado em 2 novas colunas. O teste da análise de sentimentos será compará-lo com a pontuação do avaliador para a mesma avaliação. Por exemplo, se a análise de sentimentos indicar que a avaliação negativa teve um sentimento de 1 (sentimento extremamente positivo) e um sentimento de 1 na avaliação positiva, mas o avaliador deu ao hotel a pontuação mais baixa possível, então ou o texto da avaliação não corresponde à pontuação, ou o analisador de sentimentos não conseguiu reconhecer o sentimento corretamente. Deves esperar que algumas pontuações de sentimentos estejam completamente erradas, e muitas vezes isso será explicável, por exemplo, a avaliação pode ser extremamente sarcástica: "Claro que ADOREI dormir num quarto sem aquecimento" e o analisador de sentimentos pensa que isso é um sentimento positivo, mesmo que um humano ao ler saiba que é sarcasmo. -NLTK fornece diferentes analisadores de sentimento para aprender, e você pode substituí-los e verificar se o sentimento é mais ou menos preciso. A análise de sentimento VADER é utilizada aqui. - -> Hutto, C.J. & Gilbert, E.E. (2014). VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text. Eighth International Conference on Weblogs and Social Media (ICWSM-14). Ann Arbor, MI, junho de 2014. - -```python -from nltk.sentiment.vader import SentimentIntensityAnalyzer - -# Create the vader sentiment analyser (there are others in NLTK you can try too) -vader_sentiment = SentimentIntensityAnalyzer() -# Hutto, C.J. & Gilbert, E.E. (2014). VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text. Eighth International Conference on Weblogs and Social Media (ICWSM-14). Ann Arbor, MI, June 2014. - -# There are 3 possibilities of input for a review: -# It could be "No Negative", in which case, return 0 -# It could be "No Positive", in which case, return 0 -# It could be a review, in which case calculate the sentiment -def calc_sentiment(review): - if review == "No Negative" or review == "No Positive": - return 0 - return vader_sentiment.polarity_scores(review)["compound"] -``` - -Mais tarde, no seu programa, quando estiver pronto para calcular o sentimento, pode aplicá-lo a cada avaliação da seguinte forma: - -```python -# Add a negative sentiment and positive sentiment column -print("Calculating sentiment columns for both positive and negative reviews") -start = time.time() -df["Negative_Sentiment"] = df.Negative_Review.apply(calc_sentiment) -df["Positive_Sentiment"] = df.Positive_Review.apply(calc_sentiment) -end = time.time() -print("Calculating sentiment took " + str(round(end - start, 2)) + " seconds") -``` - -Isso leva aproximadamente 120 segundos no meu computador, mas pode variar em cada máquina. Se quiser imprimir os resultados e verificar se o sentimento corresponde à avaliação: - -```python -df = df.sort_values(by=["Negative_Sentiment"], ascending=True) -print(df[["Negative_Review", "Negative_Sentiment"]]) -df = df.sort_values(by=["Positive_Sentiment"], ascending=True) -print(df[["Positive_Review", "Positive_Sentiment"]]) -``` - -A última coisa a fazer com o ficheiro antes de utilizá-lo no desafio é salvá-lo! Também deve considerar reorganizar todas as suas novas colunas para que sejam fáceis de trabalhar (para um humano, é uma mudança estética). - -```python -# Reorder the columns (This is cosmetic, but to make it easier to explore the data later) -df = df.reindex(["Hotel_Name", "Hotel_Address", "Total_Number_of_Reviews", "Average_Score", "Reviewer_Score", "Negative_Sentiment", "Positive_Sentiment", "Reviewer_Nationality", "Leisure_trip", "Couple", "Solo_traveler", "Business_trip", "Group", "Family_with_young_children", "Family_with_older_children", "With_a_pet", "Negative_Review", "Positive_Review"], axis=1) - -print("Saving results to Hotel_Reviews_NLP.csv") -df.to_csv(r"../data/Hotel_Reviews_NLP.csv", index = False) -``` - -Deve executar todo o código do [notebook de análise](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb) (depois de ter executado [o notebook de filtragem](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb) para gerar o ficheiro Hotel_Reviews_Filtered.csv). - -Para recapitular, os passos são: - -1. O ficheiro do conjunto de dados original **Hotel_Reviews.csv** é explorado na lição anterior com [o notebook de exploração](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/4-Hotel-Reviews-1/solution/notebook.ipynb) -2. Hotel_Reviews.csv é filtrado pelo [notebook de filtragem](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb), resultando em **Hotel_Reviews_Filtered.csv** -3. Hotel_Reviews_Filtered.csv é processado pelo [notebook de análise de sentimento](https://github.com/microsoft/ML-For-Beginners/blob/main/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb), resultando em **Hotel_Reviews_NLP.csv** -4. Utilize Hotel_Reviews_NLP.csv no Desafio de NLP abaixo - -### Conclusão - -Quando começou, tinha um conjunto de dados com colunas e informações, mas nem tudo podia ser verificado ou utilizado. Explorou os dados, filtrou o que não precisava, converteu etiquetas em algo útil, calculou as suas próprias médias, adicionou algumas colunas de sentimento e, com sorte, aprendeu coisas interessantes sobre o processamento de texto natural. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Desafio - -Agora que tem o seu conjunto de dados analisado para sentimento, veja se consegue usar estratégias que aprendeu neste currículo (talvez clustering?) para determinar padrões relacionados ao sentimento. - -## Revisão e Estudo Individual - -Faça [este módulo do Learn](https://docs.microsoft.com/en-us/learn/modules/classify-user-feedback-with-the-text-analytics-api/?WT.mc_id=academic-77952-leestott) para aprender mais e usar diferentes ferramentas para explorar o sentimento em texto. - -## Tarefa - -[Experimente um conjunto de dados diferente](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/assignment.md b/translations/pt/6-NLP/5-Hotel-Reviews-2/assignment.md deleted file mode 100644 index 6fd0415e3..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Experimente um conjunto de dados diferente - -## Instruções - -Agora que aprendeu a usar o NLTK para atribuir sentimento a texto, experimente um conjunto de dados diferente. Provavelmente precisará realizar algum processamento de dados, por isso crie um notebook e documente o seu raciocínio. O que descobre? - -## Critérios de Avaliação - -| Critérios | Exemplar | Adequado | Necessita Melhorar | -| --------- | ---------------------------------------------------------------------------------------------------------------- | ----------------------------------------- | ---------------------- | -| | Um notebook completo e um conjunto de dados são apresentados com células bem documentadas explicando como o sentimento é atribuído | O notebook carece de boas explicações | O notebook apresenta falhas | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/notebook.ipynb b/translations/pt/6-NLP/5-Hotel-Reviews-2/notebook.ipynb deleted file mode 100644 index e69de29bb..000000000 diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb b/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb deleted file mode 100644 index b55b30b9d..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb +++ /dev/null @@ -1,172 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "033cb89c85500224b3c63fd04f49b4aa", - "translation_date": "2025-09-03T20:58:24+00:00", - "source_file": "6-NLP/5-Hotel-Reviews-2/solution/1-notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import pandas as pd\n", - "import time\n", - "import ast" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "def replace_address(row):\n", - " if \"Netherlands\" in row[\"Hotel_Address\"]:\n", - " return \"Amsterdam, Netherlands\"\n", - " elif \"Barcelona\" in row[\"Hotel_Address\"]:\n", - " return \"Barcelona, Spain\"\n", - " elif \"United Kingdom\" in row[\"Hotel_Address\"]:\n", - " return \"London, United Kingdom\"\n", - " elif \"Milan\" in row[\"Hotel_Address\"]: \n", - " return \"Milan, Italy\"\n", - " elif \"France\" in row[\"Hotel_Address\"]:\n", - " return \"Paris, France\"\n", - " elif \"Vienna\" in row[\"Hotel_Address\"]:\n", - " return \"Vienna, Austria\" \n", - " else:\n", - " return row.Hotel_Address\n", - " " - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV\n", - "start = time.time()\n", - "df = pd.read_csv('../../data/Hotel_Reviews.csv')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "# dropping columns we will not use:\n", - "df.drop([\"lat\", \"lng\"], axis = 1, inplace=True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "# Replace all the addresses with a shortened, more useful form\n", - "df[\"Hotel_Address\"] = df.apply(replace_address, axis = 1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "# Drop `Additional_Number_of_Scoring`\n", - "df.drop([\"Additional_Number_of_Scoring\"], axis = 1, inplace=True)\n", - "# Replace `Total_Number_of_Reviews` and `Average_Score` with our own calculated values\n", - "df.Total_Number_of_Reviews = df.groupby('Hotel_Name').transform('count')\n", - "df.Average_Score = round(df.groupby('Hotel_Name').Reviewer_Score.transform('mean'), 1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "# Process the Tags into new columns\n", - "# The file Hotel_Reviews_Tags.py, identifies the most important tags\n", - "# Leisure trip, Couple, Solo traveler, Business trip, Group combined with Travelers with friends, \n", - "# Family with young children, Family with older children, With a pet\n", - "df[\"Leisure_trip\"] = df.Tags.apply(lambda tag: 1 if \"Leisure trip\" in tag else 0)\n", - "df[\"Couple\"] = df.Tags.apply(lambda tag: 1 if \"Couple\" in tag else 0)\n", - "df[\"Solo_traveler\"] = df.Tags.apply(lambda tag: 1 if \"Solo traveler\" in tag else 0)\n", - "df[\"Business_trip\"] = df.Tags.apply(lambda tag: 1 if \"Business trip\" in tag else 0)\n", - "df[\"Group\"] = df.Tags.apply(lambda tag: 1 if \"Group\" in tag or \"Travelers with friends\" in tag else 0)\n", - "df[\"Family_with_young_children\"] = df.Tags.apply(lambda tag: 1 if \"Family with young children\" in tag else 0)\n", - "df[\"Family_with_older_children\"] = df.Tags.apply(lambda tag: 1 if \"Family with older children\" in tag else 0)\n", - "df[\"With_a_pet\"] = df.Tags.apply(lambda tag: 1 if \"With a pet\" in tag else 0)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "# No longer need any of these columns\n", - "df.drop([\"Review_Date\", \"Review_Total_Negative_Word_Counts\", \"Review_Total_Positive_Word_Counts\", \"days_since_review\", \"Total_Number_of_Reviews_Reviewer_Has_Given\"], axis = 1, inplace=True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Saving results to Hotel_Reviews_Filtered.csv\n", - "Filtering took 23.74 seconds\n" - ] - } - ], - "source": [ - "# Saving new data file with calculated columns\n", - "print(\"Saving results to Hotel_Reviews_Filtered.csv\")\n", - "df.to_csv(r'../../data/Hotel_Reviews_Filtered.csv', index = False)\n", - "end = time.time()\n", - "print(\"Filtering took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb b/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb deleted file mode 100644 index 1e7423b12..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb +++ /dev/null @@ -1,137 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "341efc86325ec2a214f682f57a189dfd", - "translation_date": "2025-09-03T20:58:41+00:00", - "source_file": "6-NLP/5-Hotel-Reviews-2/solution/2-notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV (you can )\n", - "import pandas as pd \n", - "\n", - "df = pd.read_csv('../../data/Hotel_Reviews_Filtered.csv')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "# We want to find the most useful tags to keep\n", - "# Remove opening and closing brackets\n", - "df.Tags = df.Tags.str.strip(\"[']\")\n", - "# remove all quotes too\n", - "df.Tags = df.Tags.str.replace(\" ', '\", \",\", regex = False)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "# removing this to take advantage of the 'already a phrase' fact of the dataset \n", - "# Now split the strings into a list\n", - "tag_list_df = df.Tags.str.split(',', expand = True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "# Remove leading and trailing spaces\n", - "df[\"Tag_1\"] = tag_list_df[0].str.strip()\n", - "df[\"Tag_2\"] = tag_list_df[1].str.strip()\n", - "df[\"Tag_3\"] = tag_list_df[2].str.strip()\n", - "df[\"Tag_4\"] = tag_list_df[3].str.strip()\n", - "df[\"Tag_5\"] = tag_list_df[4].str.strip()\n", - "df[\"Tag_6\"] = tag_list_df[5].str.strip()\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "# Merge the 6 columns into one with melt\n", - "df_tags = df.melt(value_vars=[\"Tag_1\", \"Tag_2\", \"Tag_3\", \"Tag_4\", \"Tag_5\", \"Tag_6\"])\n" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "The shape of the tags with no filtering: (2514684, 2)\n", - " index count\n", - "0 Leisure trip 338423\n", - "1 Couple 205305\n", - "2 Solo traveler 89779\n", - "3 Business trip 68176\n", - "4 Group 51593\n", - "5 Family with young children 49318\n", - "6 Family with older children 21509\n", - "7 Travelers with friends 1610\n", - "8 With a pet 1078\n" - ] - } - ], - "source": [ - "# Get the value counts\n", - "tag_vc = df_tags.value.value_counts()\n", - "# print(tag_vc)\n", - "print(\"The shape of the tags with no filtering:\", str(df_tags.shape))\n", - "# Drop rooms, suites, and length of stay, mobile device and anything with less count than a 1000\n", - "df_tags = df_tags[~df_tags.value.str.contains(\"Standard|room|Stayed|device|Beds|Suite|Studio|King|Superior|Double\", na=False, case=False)]\n", - "tag_vc = df_tags.value.value_counts().reset_index(name=\"count\").query(\"count > 1000\")\n", - "# Print the top 10 (there should only be 9 and we'll use these in the filtering section)\n", - "print(tag_vc[:10])" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb b/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb deleted file mode 100644 index 3d265f9a3..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb +++ /dev/null @@ -1,260 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "705bf02633759f689abc37b19749a16d", - "translation_date": "2025-09-03T20:58:56+00:00", - "source_file": "6-NLP/5-Hotel-Reviews-2/solution/3-notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "[nltk_data] Downloading package vader_lexicon to\n[nltk_data] /Users/jenlooper/nltk_data...\n" - ] - }, - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "True" - ] - }, - "metadata": {}, - "execution_count": 9 - } - ], - "source": [ - "import time\n", - "import pandas as pd\n", - "import nltk as nltk\n", - "from nltk.corpus import stopwords\n", - "from nltk.sentiment.vader import SentimentIntensityAnalyzer\n", - "nltk.download('vader_lexicon')\n" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "vader_sentiment = SentimentIntensityAnalyzer()\n", - "\n" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [], - "source": [ - "# There are 3 possibilities of input for a review:\n", - "# It could be \"No Negative\", in which case, return 0\n", - "# It could be \"No Positive\", in which case, return 0\n", - "# It could be a review, in which case calculate the sentiment\n", - "def calc_sentiment(review): \n", - " if review == \"No Negative\" or review == \"No Positive\":\n", - " return 0\n", - " return vader_sentiment.polarity_scores(review)[\"compound\"] \n" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [], - "source": [ - "# Load the hotel reviews from CSV\n", - "df = pd.read_csv(\"../../data/Hotel_Reviews_Filtered.csv\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [], - "source": [ - "# Remove stop words - can be slow for a lot of text!\n", - "# Ryan Han (ryanxjhan on Kaggle) has a great post measuring performance of different stop words removal approaches\n", - "# https://www.kaggle.com/ryanxjhan/fast-stop-words-removal # using the approach that Ryan recommends\n", - "start = time.time()\n", - "cache = set(stopwords.words(\"english\"))\n", - "def remove_stopwords(review):\n", - " text = \" \".join([word for word in review.split() if word not in cache])\n", - " return text\n" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [], - "source": [ - "# Remove the stop words from both columns\n", - "df.Negative_Review = df.Negative_Review.apply(remove_stopwords) \n", - "df.Positive_Review = df.Positive_Review.apply(remove_stopwords)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Removing stop words took 5.77 seconds\n" - ] - } - ], - "source": [ - "end = time.time()\n", - "print(\"Removing stop words took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Calculating sentiment columns for both positive and negative reviews\n", - "Calculating sentiment took 201.07 seconds\n" - ] - } - ], - "source": [ - "# Add a negative sentiment and positive sentiment column\n", - "print(\"Calculating sentiment columns for both positive and negative reviews\")\n", - "start = time.time()\n", - "df[\"Negative_Sentiment\"] = df.Negative_Review.apply(calc_sentiment)\n", - "df[\"Positive_Sentiment\"] = df.Positive_Review.apply(calc_sentiment)\n", - "end = time.time()\n", - "print(\"Calculating sentiment took \" + str(round(end - start, 2)) + \" seconds\")\n" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " Negative_Review Negative_Sentiment\n", - "186584 So bad experience memories I hotel The first n... -0.9920\n", - "129503 First charged twice room booked booking second... -0.9896\n", - "307286 The staff Had bad experience even booking Janu... -0.9889\n", - "452092 No WLAN room Incredibly rude restaurant staff ... -0.9884\n", - "201293 We usually traveling Paris 2 3 times year busi... -0.9873\n", - "... ... ...\n", - "26899 I would say however one night expensive even d... 0.9933\n", - "138365 Wifi terribly slow I speed test network upload... 0.9938\n", - "79215 I find anything hotel first I walked past hote... 0.9938\n", - "278506 The property great location There bakery next ... 0.9945\n", - "339189 Guys I like hotel I wish return next year Howe... 0.9948\n", - "\n", - "[515738 rows x 2 columns]\n", - " Positive_Review Positive_Sentiment\n", - "137893 Bathroom Shower We going stay twice hotel 2 ni... -0.9820\n", - "5839 I completely disappointed mad since reception ... -0.9780\n", - "64158 get everything extra internet parking breakfas... -0.9751\n", - "124178 I didnt like anythig Room small Asked upgrade ... -0.9721\n", - "489137 Very rude manager abusive staff reception Dirt... -0.9703\n", - "... ... ...\n", - "331570 Everything This recently renovated hotel class... 0.9984\n", - "322920 From moment stepped doors Guesthouse Hotel sta... 0.9985\n", - "293710 This place surprise expected good actually gre... 0.9985\n", - "417442 We celebrated wedding night Langham I commend ... 0.9985\n", - "132492 We arrived super cute boutique hotel area expl... 0.9987\n", - "\n", - "[515738 rows x 2 columns]\n" - ] - } - ], - "source": [ - "df = df.sort_values(by=[\"Negative_Sentiment\"], ascending=True)\n", - "print(df[[\"Negative_Review\", \"Negative_Sentiment\"]])\n", - "df = df.sort_values(by=[\"Positive_Sentiment\"], ascending=True)\n", - "print(df[[\"Positive_Review\", \"Positive_Sentiment\"]])\n" - ] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [], - "source": [ - "# Reorder the columns (This is cosmetic, but to make it easier to explore the data later)\n", - "df = df.reindex([\"Hotel_Name\", \"Hotel_Address\", \"Total_Number_of_Reviews\", \"Average_Score\", \"Reviewer_Score\", \"Negative_Sentiment\", \"Positive_Sentiment\", \"Reviewer_Nationality\", \"Leisure_trip\", \"Couple\", \"Solo_traveler\", \"Business_trip\", \"Group\", \"Family_with_young_children\", \"Family_with_older_children\", \"With_a_pet\", \"Negative_Review\", \"Positive_Review\"], axis=1)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Saving results to Hotel_Reviews_NLP.csv\n" - ] - } - ], - "source": [ - "print(\"Saving results to Hotel_Reviews_NLP.csv\")\n", - "df.to_csv(r\"../../data/Hotel_Reviews_NLP.csv\", index = False)\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md b/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md deleted file mode 100644 index 088b79c36..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/R/README.md b/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/R/README.md deleted file mode 100644 index 357ceb3e4..000000000 --- a/translations/pt/6-NLP/5-Hotel-Reviews-2/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/README.md b/translations/pt/6-NLP/README.md deleted file mode 100644 index b2b2e9961..000000000 --- a/translations/pt/6-NLP/README.md +++ /dev/null @@ -1,38 +0,0 @@ - -# Introdução ao processamento de linguagem natural - -O processamento de linguagem natural (PLN) é a capacidade de um programa de computador entender a linguagem humana tal como é falada e escrita — referida como linguagem natural. É um componente da inteligência artificial (IA). O PLN existe há mais de 50 anos e tem raízes no campo da linguística. Todo o campo é direcionado a ajudar as máquinas a compreender e processar a linguagem humana. Isso pode ser usado para realizar tarefas como correção ortográfica ou tradução automática. Tem uma variedade de aplicações no mundo real em diversos campos, incluindo pesquisa médica, motores de busca e inteligência empresarial. - -## Tópico regional: Línguas e literatura europeias e hotéis românticos da Europa ❤️ - -Nesta seção do currículo, será introduzido um dos usos mais difundidos do aprendizado de máquina: o processamento de linguagem natural (PLN). Derivado da linguística computacional, esta categoria de inteligência artificial é a ponte entre humanos e máquinas através de comunicação por voz ou texto. - -Nestes módulos, aprenderemos os fundamentos do PLN construindo pequenos bots conversacionais para entender como o aprendizado de máquina ajuda a tornar essas conversas cada vez mais 'inteligentes'. Você viajará no tempo, conversando com Elizabeth Bennett e Mr. Darcy do clássico romance de Jane Austen, **Orgulho e Preconceito**, publicado em 1813. Depois, aprofundará seus conhecimentos aprendendo sobre análise de sentimentos através de avaliações de hotéis na Europa. - -![Livro Orgulho e Preconceito e chá](../../../translated_images/pt-PT/p&p.279f1c49ecd88941.webp) -> Foto por Elaine Howlin no Unsplash - -## Aulas - -1. [Introdução ao processamento de linguagem natural](1-Introduction-to-NLP/README.md) -2. [Tarefas e técnicas comuns de PLN](2-Tasks/README.md) -3. [Tradução e análise de sentimentos com aprendizado de máquina](3-Translation-Sentiment/README.md) -4. [Preparando os seus dados](4-Hotel-Reviews-1/README.md) -5. [NLTK para análise de sentimentos](5-Hotel-Reviews-2/README.md) - -## Créditos - -Estas aulas de processamento de linguagem natural foram escritas com ☕ por [Stephen Howell](https://twitter.com/Howell_MSFT) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/6-NLP/data/README.md b/translations/pt/6-NLP/data/README.md deleted file mode 100644 index 4b91d0558..000000000 --- a/translations/pt/6-NLP/data/README.md +++ /dev/null @@ -1,15 +0,0 @@ - -Descarregue os dados de avaliação do hotel para esta pasta. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/1-Introduction/README.md b/translations/pt/7-TimeSeries/1-Introduction/README.md deleted file mode 100644 index 13714bdcb..000000000 --- a/translations/pt/7-TimeSeries/1-Introduction/README.md +++ /dev/null @@ -1,199 +0,0 @@ - -# Introdução à previsão de séries temporais - -![Resumo de séries temporais em um sketchnote](../../../../sketchnotes/ml-timeseries.png) - -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -Nesta lição e na próxima, vais aprender um pouco sobre previsão de séries temporais, uma parte interessante e valiosa do repertório de um cientista de ML que é um pouco menos conhecida do que outros tópicos. A previsão de séries temporais é como uma espécie de "bola de cristal": com base no desempenho passado de uma variável, como o preço, podes prever o seu valor potencial futuro. - -[![Introdução à previsão de séries temporais](https://img.youtube.com/vi/cBojo1hsHiI/0.jpg)](https://youtu.be/cBojo1hsHiI "Introdução à previsão de séries temporais") - -> 🎥 Clica na imagem acima para ver um vídeo sobre previsão de séries temporais - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -É um campo útil e interessante com valor real para os negócios, dado a sua aplicação direta em problemas de preços, inventário e questões de cadeia de abastecimento. Embora técnicas de aprendizagem profunda tenham começado a ser usadas para obter mais insights e prever melhor o desempenho futuro, a previsão de séries temporais continua a ser um campo amplamente informado por técnicas clássicas de ML. - -> O currículo útil de séries temporais da Penn State pode ser encontrado [aqui](https://online.stat.psu.edu/stat510/lesson/1) - -## Introdução - -Suponha que geres uma rede de parquímetros inteligentes que fornecem dados sobre a frequência e duração de uso ao longo do tempo. - -> E se pudesses prever, com base no desempenho passado do parquímetro, o seu valor futuro de acordo com as leis de oferta e procura? - -Prever com precisão quando agir para alcançar o teu objetivo é um desafio que pode ser abordado com previsão de séries temporais. Não seria agradável para as pessoas serem cobradas mais em horários de pico quando procuram um lugar para estacionar, mas seria uma forma eficaz de gerar receita para limpar as ruas! - -Vamos explorar alguns dos tipos de algoritmos de séries temporais e começar um notebook para limpar e preparar alguns dados. Os dados que vais analisar foram retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014. Dado os padrões históricos de carga elétrica e temperatura, podes prever valores futuros de carga elétrica. - -Neste exemplo, vais aprender a prever um passo temporal à frente, usando apenas dados históricos de carga. Antes de começar, no entanto, é útil entender o que está a acontecer nos bastidores. - -## Algumas definições - -Ao encontrar o termo "séries temporais", precisas de entender o seu uso em vários contextos diferentes. - -🎓 **Séries temporais** - -Em matemática, "uma série temporal é uma série de pontos de dados indexados (ou listados ou representados graficamente) em ordem temporal. Mais comumente, uma série temporal é uma sequência tomada em pontos sucessivos igualmente espaçados no tempo." Um exemplo de série temporal é o valor de fecho diário do [Dow Jones Industrial Average](https://wikipedia.org/wiki/Time_series). O uso de gráficos de séries temporais e modelagem estatística é frequentemente encontrado em processamento de sinais, previsão do tempo, previsão de terremotos e outros campos onde eventos ocorrem e pontos de dados podem ser representados ao longo do tempo. - -🎓 **Análise de séries temporais** - -A análise de séries temporais é a análise dos dados de séries temporais mencionados acima. Os dados de séries temporais podem assumir formas distintas, incluindo "séries temporais interrompidas", que detectam padrões na evolução de uma série temporal antes e depois de um evento interruptor. O tipo de análise necessário para a série temporal depende da natureza dos dados. Os dados de séries temporais podem assumir a forma de séries de números ou caracteres. - -A análise a ser realizada utiliza uma variedade de métodos, incluindo domínio de frequência e domínio temporal, linear e não linear, entre outros. [Saiba mais](https://www.itl.nist.gov/div898/handbook/pmc/section4/pmc4.htm) sobre as várias formas de analisar este tipo de dados. - -🎓 **Previsão de séries temporais** - -A previsão de séries temporais é o uso de um modelo para prever valores futuros com base em padrões exibidos por dados previamente recolhidos à medida que ocorreram no passado. Embora seja possível usar modelos de regressão para explorar dados de séries temporais, com índices temporais como variáveis x num gráfico, esses dados são melhor analisados usando tipos especiais de modelos. - -Os dados de séries temporais são uma lista de observações ordenadas, diferente de dados que podem ser analisados por regressão linear. O mais comum é o ARIMA, um acrónimo que significa "Autoregressive Integrated Moving Average". - -[Modelos ARIMA](https://online.stat.psu.edu/stat510/lesson/1/1.1) "relacionam o valor presente de uma série com valores passados e erros de previsão passados." Eles são mais apropriados para analisar dados no domínio temporal, onde os dados são ordenados ao longo do tempo. - -> Existem vários tipos de modelos ARIMA, sobre os quais podes aprender [aqui](https://people.duke.edu/~rnau/411arim.htm) e que vais abordar na próxima lição. - -Na próxima lição, vais construir um modelo ARIMA usando [Séries Temporais Univariadas](https://itl.nist.gov/div898/handbook/pmc/section4/pmc44.htm), que se concentram numa variável que muda o seu valor ao longo do tempo. Um exemplo deste tipo de dados é [este conjunto de dados](https://itl.nist.gov/div898/handbook/pmc/section4/pmc4411.htm) que regista a concentração mensal de CO2 no Observatório Mauna Loa: - -| CO2 | YearMonth | Year | Month | -| :-----: | :-------: | :---: | :---: | -| 330.62 | 1975.04 | 1975 | 1 | -| 331.40 | 1975.13 | 1975 | 2 | -| 331.87 | 1975.21 | 1975 | 3 | -| 333.18 | 1975.29 | 1975 | 4 | -| 333.92 | 1975.38 | 1975 | 5 | -| 333.43 | 1975.46 | 1975 | 6 | -| 331.85 | 1975.54 | 1975 | 7 | -| 330.01 | 1975.63 | 1975 | 8 | -| 328.51 | 1975.71 | 1975 | 9 | -| 328.41 | 1975.79 | 1975 | 10 | -| 329.25 | 1975.88 | 1975 | 11 | -| 330.97 | 1975.96 | 1975 | 12 | - -✅ Identifica a variável que muda ao longo do tempo neste conjunto de dados. - -## Características dos dados de séries temporais a considerar - -Ao observar dados de séries temporais, podes notar que eles possuem [certas características](https://online.stat.psu.edu/stat510/lesson/1/1.1) que precisas levar em conta e mitigar para entender melhor os seus padrões. Se considerares os dados de séries temporais como potencialmente fornecendo um "sinal" que desejas analisar, essas características podem ser vistas como "ruído". Muitas vezes, será necessário reduzir esse "ruído" compensando algumas dessas características usando técnicas estatísticas. - -Aqui estão alguns conceitos que deves conhecer para trabalhar com séries temporais: - -🎓 **Tendências** - -Tendências são definidas como aumentos e diminuições mensuráveis ao longo do tempo. [Lê mais](https://machinelearningmastery.com/time-series-trends-in-python). No contexto de séries temporais, trata-se de como usar e, se necessário, remover tendências da tua série temporal. - -🎓 **[Sazonalidade](https://machinelearningmastery.com/time-series-seasonality-with-python/)** - -Sazonalidade é definida como flutuações periódicas, como picos de vendas durante as férias, por exemplo. [Dá uma olhada](https://itl.nist.gov/div898/handbook/pmc/section4/pmc443.htm) em como diferentes tipos de gráficos exibem sazonalidade nos dados. - -🎓 **Outliers** - -Outliers são valores que estão muito distantes da variância padrão dos dados. - -🎓 **Ciclo de longo prazo** - -Independentemente da sazonalidade, os dados podem exibir um ciclo de longo prazo, como uma recessão económica que dura mais de um ano. - -🎓 **Variância constante** - -Ao longo do tempo, alguns dados exibem flutuações constantes, como o uso de energia durante o dia e a noite. - -🎓 **Mudanças abruptas** - -Os dados podem exibir uma mudança abrupta que pode precisar de análise adicional. O encerramento repentino de negócios devido à COVID, por exemplo, causou mudanças nos dados. - -✅ Aqui está um [exemplo de gráfico de séries temporais](https://www.kaggle.com/kashnitsky/topic-9-part-1-time-series-analysis-in-python) mostrando o gasto diário em moeda dentro de um jogo ao longo de alguns anos. Consegues identificar alguma das características listadas acima nesses dados? - -![Gasto em moeda no jogo](../../../../7-TimeSeries/1-Introduction/images/currency.png) - -## Exercício - começando com dados de uso de energia - -Vamos começar a criar um modelo de séries temporais para prever o uso futuro de energia com base no uso passado. - -> Os dados neste exemplo foram retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014. -> -> Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, "Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016. - -1. Na pasta `working` desta lição, abre o ficheiro _notebook.ipynb_. Começa por adicionar bibliotecas que te ajudarão a carregar e visualizar os dados. - - ```python - import os - import matplotlib.pyplot as plt - from common.utils import load_data - %matplotlib inline - ``` - - Nota que estás a usar os ficheiros da pasta `common` incluída, que configuram o teu ambiente e tratam do download dos dados. - -2. Em seguida, examina os dados como um dataframe chamando `load_data()` e `head()`: - - ```python - data_dir = './data' - energy = load_data(data_dir)[['load']] - energy.head() - ``` - - Podes ver que há duas colunas representando data e carga: - - | | load | - | :-----------------: | :----: | - | 2012-01-01 00:00:00 | 2698.0 | - | 2012-01-01 01:00:00 | 2558.0 | - | 2012-01-01 02:00:00 | 2444.0 | - | 2012-01-01 03:00:00 | 2402.0 | - | 2012-01-01 04:00:00 | 2403.0 | - -3. Agora, representa os dados graficamente chamando `plot()`: - - ```python - energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![gráfico de energia](../../../../7-TimeSeries/1-Introduction/images/energy-plot.png) - -4. Agora, representa graficamente a primeira semana de julho de 2014, fornecendo-a como entrada para o `energy` no padrão `[data inicial]:[data final]`: - - ```python - energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![julho](../../../../7-TimeSeries/1-Introduction/images/july-2014.png) - - Um gráfico bonito! Dá uma olhada nesses gráficos e vê se consegues determinar alguma das características listadas acima. O que podemos concluir ao visualizar os dados? - -Na próxima lição, vais criar um modelo ARIMA para fazer algumas previsões. - ---- - -## 🚀Desafio - -Faz uma lista de todas as indústrias e áreas de estudo que consegues pensar que poderiam beneficiar da previsão de séries temporais. Consegues pensar numa aplicação dessas técnicas nas artes? Em Econometria? Ecologia? Retalho? Indústria? Finanças? Onde mais? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Autoestudo - -Embora não os abordemos aqui, redes neurais são por vezes usadas para melhorar os métodos clássicos de previsão de séries temporais. Lê mais sobre isso [neste artigo](https://medium.com/microsoftazure/neural-networks-for-forecasting-financial-and-economic-time-series-6aca370ff412) - -## Tarefa - -[Visualiza mais séries temporais](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/1-Introduction/assignment.md b/translations/pt/7-TimeSeries/1-Introduction/assignment.md deleted file mode 100644 index 79d97b734..000000000 --- a/translations/pt/7-TimeSeries/1-Introduction/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Visualizar mais Séries Temporais - -## Instruções - -Você começou a aprender sobre Previsão de Séries Temporais ao observar o tipo de dados que requerem este modelo especial. Já visualizou alguns dados relacionados à energia. Agora, procure outros dados que possam se beneficiar da Previsão de Séries Temporais. Encontre três exemplos (experimente [Kaggle](https://kaggle.com) e [Azure Open Datasets](https://azure.microsoft.com/en-us/services/open-datasets/catalog/?WT.mc_id=academic-77952-leestott)) e crie um notebook para visualizá-los. Anote quaisquer características especiais que eles apresentem (sazonalidade, mudanças abruptas ou outras tendências) no notebook. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita Melhorias | -| --------- | ----------------------------------------------------- | --------------------------------------------------- | --------------------------------------------------------------------------------------- | -| | Três conjuntos de dados são plotados e explicados no notebook | Dois conjuntos de dados são plotados e explicados no notebook | Poucos conjuntos de dados são plotados ou explicados no notebook ou os dados apresentados são insuficientes | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/1-Introduction/solution/Julia/README.md b/translations/pt/7-TimeSeries/1-Introduction/solution/Julia/README.md deleted file mode 100644 index fc33103cc..000000000 --- a/translations/pt/7-TimeSeries/1-Introduction/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/1-Introduction/solution/R/README.md b/translations/pt/7-TimeSeries/1-Introduction/solution/R/README.md deleted file mode 100644 index 1fe785fd4..000000000 --- a/translations/pt/7-TimeSeries/1-Introduction/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/1-Introduction/solution/notebook.ipynb b/translations/pt/7-TimeSeries/1-Introduction/solution/notebook.ipynb deleted file mode 100644 index 0200c3f0c..000000000 --- a/translations/pt/7-TimeSeries/1-Introduction/solution/notebook.ipynb +++ /dev/null @@ -1,170 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# Configuração de Dados\n", - "\n", - "Neste notebook, demonstramos como:\n", - "- configurar dados de séries temporais para este módulo\n", - "- visualizar os dados\n", - "\n", - "Os dados deste exemplo foram retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014.\n", - "\n", - "Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "import os\n", - "import matplotlib.pyplot as plt\n", - "from common.utils import load_data\n", - "%matplotlib inline" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Carregar os dados do csv para um dataframe do Pandas\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2698.0\n", - "2012-01-01 01:00:00 2558.0\n", - "2012-01-01 02:00:00 2444.0\n", - "2012-01-01 03:00:00 2402.0\n", - "2012-01-01 04:00:00 2403.0" - ], - "text/html": "
\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n
load
2012-01-01 00:00:002698.0
2012-01-01 01:00:002558.0
2012-01-01 02:00:002444.0
2012-01-01 03:00:002402.0
2012-01-01 04:00:002403.0
\n
" - }, - "metadata": {}, - "execution_count": 7 - } - ], - "source": [ - "data_dir = './data'\n", - "energy = load_data(data_dir)[['load']]\n", - "energy.head()\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Trace todos os dados de carga disponíveis (janeiro de 2012 a dezembro de 2014)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "energy['2014-07-01':'2014-07-07'].plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernel_info": { - "name": "python3" - }, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "nteract": { - "version": "nteract-front-end@1.0.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "dddca9ad9e34435494e0933c218e1579", - "translation_date": "2025-09-03T19:56:20+00:00", - "source_file": "7-TimeSeries/1-Introduction/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/1-Introduction/working/notebook.ipynb b/translations/pt/7-TimeSeries/1-Introduction/working/notebook.ipynb deleted file mode 100644 index ac8893f82..000000000 --- a/translations/pt/7-TimeSeries/1-Introduction/working/notebook.ipynb +++ /dev/null @@ -1,63 +0,0 @@ -{ - "cells": [ - { - "source": [ - "# Configuração de Dados\n", - "\n", - "Neste notebook, demonstramos como:\n", - "\n", - "configurar dados de séries temporais para este módulo \n", - "visualizar os dados \n", - "Os dados deste exemplo foram retirados da competição de previsão GEFCom2014. Consistem em 3 anos de valores horários de carga elétrica e temperatura entre 2012 e 2014.\n", - "\n", - "1Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Previsão probabilística de energia: Competição Global de Previsão de Energia 2014 e além\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernel_info": { - "name": "python3" - }, - "kernelspec": { - "name": "python37364bit8d3b438fb5fc4430a93ac2cb74d693a7", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "nteract": { - "version": "nteract-front-end@1.0.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "coopTranslator": { - "original_hash": "5e2bbe594906dce3aaaa736d6dac6683", - "translation_date": "2025-09-03T19:57:04+00:00", - "source_file": "7-TimeSeries/1-Introduction/working/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/2-ARIMA/README.md b/translations/pt/7-TimeSeries/2-ARIMA/README.md deleted file mode 100644 index 0d870d5f9..000000000 --- a/translations/pt/7-TimeSeries/2-ARIMA/README.md +++ /dev/null @@ -1,405 +0,0 @@ - -# Previsão de séries temporais com ARIMA - -Na lição anterior, aprendeste um pouco sobre previsão de séries temporais e carregaste um conjunto de dados que mostra as flutuações da carga elétrica ao longo de um período de tempo. - -[![Introdução ao ARIMA](https://img.youtube.com/vi/IUSk-YDau10/0.jpg)](https://youtu.be/IUSk-YDau10 "Introdução ao ARIMA") - -> 🎥 Clica na imagem acima para um vídeo: Uma breve introdução aos modelos ARIMA. O exemplo é feito em R, mas os conceitos são universais. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -Nesta lição, vais descobrir uma forma específica de construir modelos com [ARIMA: *A*uto*R*egressive *I*ntegrated *M*oving *A*verage](https://wikipedia.org/wiki/Autoregressive_integrated_moving_average). Os modelos ARIMA são particularmente adequados para ajustar dados que apresentam [não-estacionaridade](https://wikipedia.org/wiki/Stationary_process). - -## Conceitos gerais - -Para trabalhar com ARIMA, há alguns conceitos que precisas de conhecer: - -- 🎓 **Estacionaridade**. No contexto estatístico, estacionaridade refere-se a dados cuja distribuição não muda ao longo do tempo. Dados não estacionários, por outro lado, apresentam flutuações devido a tendências que precisam ser transformadas para serem analisadas. A sazonalidade, por exemplo, pode introduzir flutuações nos dados e pode ser eliminada através de um processo de 'diferença sazonal'. - -- 🎓 **[Diferença](https://wikipedia.org/wiki/Autoregressive_integrated_moving_average#Differencing)**. Diferençar os dados, novamente no contexto estatístico, refere-se ao processo de transformar dados não estacionários para torná-los estacionários, removendo sua tendência não constante. "A diferença remove as mudanças no nível de uma série temporal, eliminando tendência e sazonalidade e, consequentemente, estabilizando a média da série temporal." [Artigo de Shixiong et al](https://arxiv.org/abs/1904.07632) - -## ARIMA no contexto de séries temporais - -Vamos explorar as partes do ARIMA para entender melhor como ele nos ajuda a modelar séries temporais e a fazer previsões. - -- **AR - de AutoRegressivo**. Modelos autorregressivos, como o nome sugere, olham 'para trás' no tempo para analisar valores anteriores nos teus dados e fazer suposições sobre eles. Esses valores anteriores são chamados de 'lags'. Um exemplo seria dados que mostram vendas mensais de lápis. O total de vendas de cada mês seria considerado uma 'variável em evolução' no conjunto de dados. Este modelo é construído como "a variável de interesse em evolução é regredida em seus próprios valores defasados (ou seja, valores anteriores)." [wikipedia](https://wikipedia.org/wiki/Autoregressive_integrated_moving_average) - -- **I - de Integrado**. Ao contrário dos modelos semelhantes 'ARMA', o 'I' em ARIMA refere-se ao seu aspeto *[integrado](https://wikipedia.org/wiki/Order_of_integration)*. Os dados são 'integrados' quando passos de diferença são aplicados para eliminar a não-estacionaridade. - -- **MA - de Média Móvel**. O aspeto de [média móvel](https://wikipedia.org/wiki/Moving-average_model) deste modelo refere-se à variável de saída que é determinada observando os valores atuais e passados dos lags. - -Resumindo: o ARIMA é usado para ajustar um modelo o mais próximo possível da forma especial dos dados de séries temporais. - -## Exercício - construir um modelo ARIMA - -Abre a pasta [_/working_](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA/working) nesta lição e encontra o ficheiro [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/7-TimeSeries/2-ARIMA/working/notebook.ipynb). - -1. Executa o notebook para carregar a biblioteca Python `statsmodels`; vais precisar dela para os modelos ARIMA. - -1. Carrega as bibliotecas necessárias. - -1. Agora, carrega mais algumas bibliotecas úteis para a plotagem de dados: - - ```python - import os - import warnings - import matplotlib.pyplot as plt - import numpy as np - import pandas as pd - import datetime as dt - import math - - from pandas.plotting import autocorrelation_plot - from statsmodels.tsa.statespace.sarimax import SARIMAX - from sklearn.preprocessing import MinMaxScaler - from common.utils import load_data, mape - from IPython.display import Image - - %matplotlib inline - pd.options.display.float_format = '{:,.2f}'.format - np.set_printoptions(precision=2) - warnings.filterwarnings("ignore") # specify to ignore warning messages - ``` - -1. Carrega os dados do ficheiro `/data/energy.csv` para um dataframe do Pandas e dá uma olhada: - - ```python - energy = load_data('./data')[['load']] - energy.head(10) - ``` - -1. Plota todos os dados de energia disponíveis de janeiro de 2012 a dezembro de 2014. Não deverá haver surpresas, pois já vimos esses dados na última lição: - - ```python - energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - Agora, vamos construir um modelo! - -### Criar conjuntos de treino e teste - -Agora que os teus dados estão carregados, podes separá-los em conjuntos de treino e teste. Vais treinar o teu modelo no conjunto de treino. Como de costume, após o modelo ter terminado o treino, vais avaliar a sua precisão usando o conjunto de teste. É necessário garantir que o conjunto de teste cobre um período posterior ao conjunto de treino para garantir que o modelo não obtenha informações de períodos futuros. - -1. Aloca um período de dois meses, de 1 de setembro a 31 de outubro de 2014, para o conjunto de treino. O conjunto de teste incluirá o período de dois meses de 1 de novembro a 31 de dezembro de 2014: - - ```python - train_start_dt = '2014-11-01 00:00:00' - test_start_dt = '2014-12-30 00:00:00' - ``` - - Como estes dados refletem o consumo diário de energia, há um forte padrão sazonal, mas o consumo é mais semelhante ao consumo de dias mais recentes. - -1. Visualiza as diferenças: - - ```python - energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \ - .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \ - .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![dados de treino e teste](../../../../7-TimeSeries/2-ARIMA/images/train-test.png) - - Portanto, usar uma janela de tempo relativamente pequena para treinar os dados deve ser suficiente. - - > Nota: Como a função que usamos para ajustar o modelo ARIMA utiliza validação in-sample durante o ajuste, omitiremos os dados de validação. - -### Preparar os dados para treino - -Agora, precisas de preparar os dados para o treino, realizando filtragem e escalonamento dos dados. Filtra o teu conjunto de dados para incluir apenas os períodos de tempo e colunas necessários, e escala os dados para garantir que estejam no intervalo 0,1. - -1. Filtra o conjunto de dados original para incluir apenas os períodos de tempo mencionados por conjunto e apenas a coluna necessária 'load', além da data: - - ```python - train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']] - test = energy.copy()[energy.index >= test_start_dt][['load']] - - print('Training data shape: ', train.shape) - print('Test data shape: ', test.shape) - ``` - - Podes ver a forma dos dados: - - ```output - Training data shape: (1416, 1) - Test data shape: (48, 1) - ``` - -1. Escala os dados para estarem no intervalo (0, 1). - - ```python - scaler = MinMaxScaler() - train['load'] = scaler.fit_transform(train) - train.head(10) - ``` - -1. Visualiza os dados originais vs. os dados escalados: - - ```python - energy[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']].rename(columns={'load':'original load'}).plot.hist(bins=100, fontsize=12) - train.rename(columns={'load':'scaled load'}).plot.hist(bins=100, fontsize=12) - plt.show() - ``` - - ![original](../../../../7-TimeSeries/2-ARIMA/images/original.png) - - > Os dados originais - - ![escalado](../../../../7-TimeSeries/2-ARIMA/images/scaled.png) - - > Os dados escalados - -1. Agora que calibraste os dados escalados, podes escalar os dados de teste: - - ```python - test['load'] = scaler.transform(test) - test.head() - ``` - -### Implementar ARIMA - -É hora de implementar o ARIMA! Agora vais usar a biblioteca `statsmodels` que instalaste anteriormente. - -Agora precisas de seguir vários passos: - - 1. Define o modelo chamando `SARIMAX()` e passando os parâmetros do modelo: parâmetros p, d e q, e parâmetros P, D e Q. - 2. Prepara o modelo para os dados de treino chamando a função `fit()`. - 3. Faz previsões chamando a função `forecast()` e especificando o número de passos (o `horizon`) a prever. - -> 🎓 Para que servem todos esses parâmetros? Num modelo ARIMA, há 3 parâmetros usados para ajudar a modelar os principais aspetos de uma série temporal: sazonalidade, tendência e ruído. Esses parâmetros são: - -`p`: o parâmetro associado ao aspeto autorregressivo do modelo, que incorpora valores *passados*. -`d`: o parâmetro associado à parte integrada do modelo, que afeta a quantidade de *diferença* (🎓 lembra-te da diferença 👆?) a aplicar a uma série temporal. -`q`: o parâmetro associado à parte de média móvel do modelo. - -> Nota: Se os teus dados tiverem um aspeto sazonal - como este tem -, usamos um modelo ARIMA sazonal (SARIMA). Nesse caso, precisas de usar outro conjunto de parâmetros: `P`, `D` e `Q`, que descrevem as mesmas associações que `p`, `d` e `q`, mas correspondem aos componentes sazonais do modelo. - -1. Começa por definir o teu valor de horizonte preferido. Vamos tentar 3 horas: - - ```python - # Specify the number of steps to forecast ahead - HORIZON = 3 - print('Forecasting horizon:', HORIZON, 'hours') - ``` - - Selecionar os melhores valores para os parâmetros de um modelo ARIMA pode ser desafiador, pois é algo subjetivo e demorado. Podes considerar usar uma função `auto_arima()` da [biblioteca `pyramid`](https://alkaline-ml.com/pmdarima/0.9.0/modules/generated/pyramid.arima.auto_arima.html). - -1. Por agora, tenta algumas seleções manuais para encontrar um bom modelo. - - ```python - order = (4, 1, 0) - seasonal_order = (1, 1, 0, 24) - - model = SARIMAX(endog=train, order=order, seasonal_order=seasonal_order) - results = model.fit() - - print(results.summary()) - ``` - - Uma tabela de resultados é exibida. - -Construíste o teu primeiro modelo! Agora precisamos de encontrar uma forma de avaliá-lo. - -### Avaliar o teu modelo - -Para avaliar o teu modelo, podes realizar a chamada validação `walk forward`. Na prática, os modelos de séries temporais são re-treinados sempre que novos dados ficam disponíveis. Isso permite que o modelo faça a melhor previsão em cada passo de tempo. - -Começando no início da série temporal, usando esta técnica, treina o modelo no conjunto de treino. Depois, faz uma previsão para o próximo passo de tempo. A previsão é avaliada em relação ao valor conhecido. O conjunto de treino é então expandido para incluir o valor conhecido e o processo é repetido. - -> Nota: Deves manter a janela do conjunto de treino fixa para um treino mais eficiente, de modo que, sempre que adicionares uma nova observação ao conjunto de treino, removes a observação do início do conjunto. - -Este processo fornece uma estimativa mais robusta de como o modelo irá desempenhar-se na prática. No entanto, tem o custo computacional de criar tantos modelos. Isso é aceitável se os dados forem pequenos ou se o modelo for simples, mas pode ser um problema em escala. - -A validação walk-forward é o padrão ouro para avaliação de modelos de séries temporais e é recomendada para os teus próprios projetos. - -1. Primeiro, cria um ponto de dados de teste para cada passo do HORIZON. - - ```python - test_shifted = test.copy() - - for t in range(1, HORIZON+1): - test_shifted['load+'+str(t)] = test_shifted['load'].shift(-t, freq='H') - - test_shifted = test_shifted.dropna(how='any') - test_shifted.head(5) - ``` - - | | | load | load+1 | load+2 | - | ---------- | -------- | ---- | ------ | ------ | - | 2014-12-30 | 00:00:00 | 0.33 | 0.29 | 0.27 | - | 2014-12-30 | 01:00:00 | 0.29 | 0.27 | 0.27 | - | 2014-12-30 | 02:00:00 | 0.27 | 0.27 | 0.30 | - | 2014-12-30 | 03:00:00 | 0.27 | 0.30 | 0.41 | - | 2014-12-30 | 04:00:00 | 0.30 | 0.41 | 0.57 | - - Os dados são deslocados horizontalmente de acordo com o seu ponto de horizonte. - -1. Faz previsões nos teus dados de teste usando esta abordagem de janela deslizante num loop do tamanho do comprimento dos dados de teste: - - ```python - %%time - training_window = 720 # dedicate 30 days (720 hours) for training - - train_ts = train['load'] - test_ts = test_shifted - - history = [x for x in train_ts] - history = history[(-training_window):] - - predictions = list() - - order = (2, 1, 0) - seasonal_order = (1, 1, 0, 24) - - for t in range(test_ts.shape[0]): - model = SARIMAX(endog=history, order=order, seasonal_order=seasonal_order) - model_fit = model.fit() - yhat = model_fit.forecast(steps = HORIZON) - predictions.append(yhat) - obs = list(test_ts.iloc[t]) - # move the training window - history.append(obs[0]) - history.pop(0) - print(test_ts.index[t]) - print(t+1, ': predicted =', yhat, 'expected =', obs) - ``` - - Podes observar o treino a ocorrer: - - ```output - 2014-12-30 00:00:00 - 1 : predicted = [0.32 0.29 0.28] expected = [0.32945389435989236, 0.2900626678603402, 0.2739480752014323] - - 2014-12-30 01:00:00 - 2 : predicted = [0.3 0.29 0.3 ] expected = [0.2900626678603402, 0.2739480752014323, 0.26812891674127126] - - 2014-12-30 02:00:00 - 3 : predicted = [0.27 0.28 0.32] expected = [0.2739480752014323, 0.26812891674127126, 0.3025962399283795] - ``` - -1. Compara as previsões com a carga real: - - ```python - eval_df = pd.DataFrame(predictions, columns=['t+'+str(t) for t in range(1, HORIZON+1)]) - eval_df['timestamp'] = test.index[0:len(test.index)-HORIZON+1] - eval_df = pd.melt(eval_df, id_vars='timestamp', value_name='prediction', var_name='h') - eval_df['actual'] = np.array(np.transpose(test_ts)).ravel() - eval_df[['prediction', 'actual']] = scaler.inverse_transform(eval_df[['prediction', 'actual']]) - eval_df.head() - ``` - - Saída - | | | timestamp | h | prediction | actual | - | --- | ---------- | --------- | --- | ---------- | -------- | - | 0 | 2014-12-30 | 00:00:00 | t+1 | 3,008.74 | 3,023.00 | - | 1 | 2014-12-30 | 01:00:00 | t+1 | 2,955.53 | 2,935.00 | - | 2 | 2014-12-30 | 02:00:00 | t+1 | 2,900.17 | 2,899.00 | - | 3 | 2014-12-30 | 03:00:00 | t+1 | 2,917.69 | 2,886.00 | - | 4 | 2014-12-30 | 04:00:00 | t+1 | 2,946.99 | 2,963.00 | - - Observa a previsão dos dados horários em comparação com a carga real. Quão precisa é esta previsão? - -### Verificar a precisão do modelo - -Verifica a precisão do teu modelo testando o seu erro percentual absoluto médio (MAPE) em todas as previsões. -> **🧮 Mostra-me os cálculos** -> -> ![MAPE](../../../../7-TimeSeries/2-ARIMA/images/mape.png) -> -> [MAPE](https://www.linkedin.com/pulse/what-mape-mad-msd-time-series-allameh-statistics/) é utilizado para mostrar a precisão das previsões como uma razão definida pela fórmula acima. A diferença entre o valor real e o previsto é dividida pelo valor real. "O valor absoluto deste cálculo é somado para cada ponto previsto no tempo e dividido pelo número de pontos ajustados n." [wikipedia](https://wikipedia.org/wiki/Mean_absolute_percentage_error) -1. Exprimir a equação em código: - - ```python - if(HORIZON > 1): - eval_df['APE'] = (eval_df['prediction'] - eval_df['actual']).abs() / eval_df['actual'] - print(eval_df.groupby('h')['APE'].mean()) - ``` - -1. Calcular o MAPE de um passo: - - ```python - print('One step forecast MAPE: ', (mape(eval_df[eval_df['h'] == 't+1']['prediction'], eval_df[eval_df['h'] == 't+1']['actual']))*100, '%') - ``` - - MAPE da previsão de um passo: 0.5570581332313952 % - -1. Imprimir o MAPE da previsão de múltiplos passos: - - ```python - print('Multi-step forecast MAPE: ', mape(eval_df['prediction'], eval_df['actual'])*100, '%') - ``` - - ```output - Multi-step forecast MAPE: 1.1460048657704118 % - ``` - - Um número baixo é o ideal: considere que uma previsão com um MAPE de 10 está errada em 10%. - -1. Mas, como sempre, é mais fácil visualizar este tipo de medição de precisão, então vamos representá-lo graficamente: - - ```python - if(HORIZON == 1): - ## Plotting single step forecast - eval_df.plot(x='timestamp', y=['actual', 'prediction'], style=['r', 'b'], figsize=(15, 8)) - - else: - ## Plotting multi step forecast - plot_df = eval_df[(eval_df.h=='t+1')][['timestamp', 'actual']] - for t in range(1, HORIZON+1): - plot_df['t+'+str(t)] = eval_df[(eval_df.h=='t+'+str(t))]['prediction'].values - - fig = plt.figure(figsize=(15, 8)) - ax = plt.plot(plot_df['timestamp'], plot_df['actual'], color='red', linewidth=4.0) - ax = fig.add_subplot(111) - for t in range(1, HORIZON+1): - x = plot_df['timestamp'][(t-1):] - y = plot_df['t+'+str(t)][0:len(x)] - ax.plot(x, y, color='blue', linewidth=4*math.pow(.9,t), alpha=math.pow(0.8,t)) - - ax.legend(loc='best') - - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![um modelo de séries temporais](../../../../7-TimeSeries/2-ARIMA/images/accuracy.png) - -🏆 Um gráfico muito bom, mostrando um modelo com boa precisão. Excelente trabalho! - ---- - -## 🚀Desafio - -Explore as formas de testar a precisão de um modelo de séries temporais. Abordamos o MAPE nesta lição, mas existem outros métodos que poderia usar? Pesquise sobre eles e anote-os. Um documento útil pode ser encontrado [aqui](https://otexts.com/fpp2/accuracy.html) - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Individual - -Esta lição aborda apenas os fundamentos da previsão de séries temporais com ARIMA. Dedique algum tempo para aprofundar o seu conhecimento explorando [este repositório](https://microsoft.github.io/forecasting/) e os seus vários tipos de modelos para aprender outras formas de construir modelos de séries temporais. - -## Tarefa - -[Um novo modelo ARIMA](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/2-ARIMA/assignment.md b/translations/pt/7-TimeSeries/2-ARIMA/assignment.md deleted file mode 100644 index 460927182..000000000 --- a/translations/pt/7-TimeSeries/2-ARIMA/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Um novo modelo ARIMA - -## Instruções - -Agora que já construiu um modelo ARIMA, crie um novo com dados frescos (experimente um destes [conjuntos de dados da Duke](http://www2.stat.duke.edu/~mw/ts_data_sets.html)). Documente o seu trabalho num notebook, visualize os dados e o seu modelo, e teste a sua precisão utilizando o MAPE. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | ------------------------------------------------------------------------------------------------------------------ | -------------------------------------------------------- | ----------------------------------- | -| | Um notebook é apresentado com um novo modelo ARIMA construído, testado e explicado com visualizações e precisão declarada. | O notebook apresentado não está documentado ou contém erros | Um notebook incompleto é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/2-ARIMA/solution/Julia/README.md b/translations/pt/7-TimeSeries/2-ARIMA/solution/Julia/README.md deleted file mode 100644 index fafd818e1..000000000 --- a/translations/pt/7-TimeSeries/2-ARIMA/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/2-ARIMA/solution/R/README.md b/translations/pt/7-TimeSeries/2-ARIMA/solution/R/README.md deleted file mode 100644 index 059913015..000000000 --- a/translations/pt/7-TimeSeries/2-ARIMA/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos pela precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/2-ARIMA/solution/notebook.ipynb b/translations/pt/7-TimeSeries/2-ARIMA/solution/notebook.ipynb deleted file mode 100644 index 190cae753..000000000 --- a/translations/pt/7-TimeSeries/2-ARIMA/solution/notebook.ipynb +++ /dev/null @@ -1,1122 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "source": [ - "Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Previsão probabilística de energia: Competição Global de Previsão de Energia 2014 e além\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "## Instalar Dependências\n", - "Comece por instalar algumas das dependências necessárias. Estas bibliotecas, com as respetivas versões, são conhecidas por funcionarem com esta solução:\n", - "\n", - "* `statsmodels == 0.12.2`\n", - "* `matplotlib == 3.4.2`\n", - "* `scikit-learn == 0.24.2`\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 16, - "source": [ - "!pip install statsmodels" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "/bin/sh: pip: command not found\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 17, - "source": [ - "import os\n", - "import warnings\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import pandas as pd\n", - "import datetime as dt\n", - "import math\n", - "\n", - "from pandas.plotting import autocorrelation_plot\n", - "from statsmodels.tsa.statespace.sarimax import SARIMAX\n", - "from sklearn.preprocessing import MinMaxScaler\n", - "from common.utils import load_data, mape\n", - "from IPython.display import Image\n", - "\n", - "%matplotlib inline\n", - "pd.options.display.float_format = '{:,.2f}'.format\n", - "np.set_printoptions(precision=2)\n", - "warnings.filterwarnings(\"ignore\") # specify to ignore warning messages\n" - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 18, - "source": [ - "energy = load_data('./data')[['load']]\n", - "energy.head(10)" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2012-01-01 00:00:002,698.00
2012-01-01 01:00:002,558.00
2012-01-01 02:00:002,444.00
2012-01-01 03:00:002,402.00
2012-01-01 04:00:002,403.00
2012-01-01 05:00:002,453.00
2012-01-01 06:00:002,560.00
2012-01-01 07:00:002,719.00
2012-01-01 08:00:002,916.00
2012-01-01 09:00:003,105.00
\n", - "
" - ], - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2,698.00\n", - "2012-01-01 01:00:00 2,558.00\n", - "2012-01-01 02:00:00 2,444.00\n", - "2012-01-01 03:00:00 2,402.00\n", - "2012-01-01 04:00:00 2,403.00\n", - "2012-01-01 05:00:00 2,453.00\n", - "2012-01-01 06:00:00 2,560.00\n", - "2012-01-01 07:00:00 2,719.00\n", - "2012-01-01 08:00:00 2,916.00\n", - "2012-01-01 09:00:00 3,105.00" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Trace todos os dados de carga disponíveis (janeiro de 2012 a dezembro de 2014)\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 19, - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAA4kAAAHVCAYAAABc/b7wAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nOy9d5xfVZ3//zopEBGwIOiu7Bp0bYuIBXdtYMOKosh3VwHLuqv+lNXVdReNuCgdpBuahNBNQkASIKQnpPdJnfRkJtOSTO8zmfb5nN8fn8+duZ/7Obff+7n3fu7r6SMyc8u5Z255n/M+7yaklCCEEEIIIYQQQgBgXNQdIIQQQgghhBASH6gkEkIIIYQQQggZhUoiIYQQQgghhJBRqCQSQgghhBBCCBmFSiIhhBBCCCGEkFGoJBJCCCGEEEIIGWVC1B2Igje96U1y8uTJUXeDEEIIIYQQQiJh69atrVLKM1X7UqkkTp48GRUVFVF3gxBCCCGEEEIiQQhRa7aP7qaEEEIIIYQQQkahkkgIIYQQQgghZBQqiYQQQgghhBBCRkllTCIhhBBCCCGEAMDw8DAaGhowMDAQdVdCYdKkSTj77LMxceJEx+dQSSSEEEIIIYSkloaGBpx22mmYPHkyhBBRdydQpJRoa2tDQ0MDzjnnHMfn0d2UEEIIIYQQkloGBgZwxhlnlJ2CCABCCJxxxhmuraRUEgkhhBBCCCGpphwVRA0vfxuVREIIIYQQQgiJkFNPPTWQdq6//nrcddddvtuhkkgIIYQQQgghZBQqiYQQQgghhBASA6SUuOaaa/C+970P5513HmbPng0A6O3txec+9zl86EMfwnnnnYeXXnpp9JxbbrkF73rXu/DJT34SBw4cCKQfzG5KCCGEEEIIIQBumLcHe491B9rmP/7t6fjD1851dOycOXOwY8cO7Ny5E62trfjIRz6Ciy66CGeeeSbmzp2L008/Ha2trfjoRz+KSy+9FNu2bcOzzz6LHTt2YGRkBB/60Ifw4Q9/2HefaUkkhBBCCCGEkBiwdu1aXHHFFRg/fjze/OY341Of+hS2bNkCKSWuvfZavP/978fFF1+Mo0ePoqmpCWvWrMFll12GU045BaeffjouvfTSQPpBSyIhhBBCCCGEAI4tfqVmxowZaGlpwdatWzFx4kRMnjzZdVkLN9CSSAghhBBCCCEx4MILL8Ts2bORyWTQ0tKC1atX45/+6Z/Q1dWFs846CxMnTsSKFStQW1sLALjooovw4osv4sSJE+jp6cG8efMC6QctiYQQQkgCGMlkcbxrAH/3xlOi7gohhJCQuOyyy7Bhwwacf/75EELgjjvuwFve8hZcddVV+NrXvobzzjsPF1xwAd7znvcAAD70oQ/hW9/6Fs4//3ycddZZ+MhHPhJIP4SUMpCGksQFF1wgKyoqou4GIYQQ4pjrX96DJ9fXoOL/LsabTj056u4QQkjZsG/fPrz3ve+NuhuhovobhRBbpZQXqI6nuykhhBCSAJbvbwIA9A2ORNwTQggh5Q6VREIIISQBDI1kAQAnTeDQTQghJFw40hBCCCEJYDiTCw8ZP05E3BNCCCHlDpVEQgghJAGM5hBIXyoBQggJnXLO0+Llb6OSSAghhMScq6ZvREf/MADqiIQQEjSTJk1CW1tbWSqKUkq0tbVh0qRJrs5jCQxCCCEk5qw73Db6cxnOYQghJFLOPvtsNDQ0oKWlJequhMKkSZNw9tlnuzqHSiIhhBASU04MZXCouadgm6QtkRBCAmXixIk455xzou5GrKCSSAghhMSU/569A4v2NBZsoyWREEJI2DAmkRBCCIkpW+s6irZRRySEEBI2VBIJIYSQmJLJFquE5ZhYgRBCSLygkkgIIYTEFLWSGEFHCCGEpAoqiYQQQkhMUSmJhBBCSNhQSSSEEEJiykg2W7SNlkRCCCFhQyWREEIIiSkKHZElMAghhIQOlURCCCEkpmQUZkNaEgkhhIQNlURCCCEkQVBHJIQQEjZUEgkhhJAEwRIYhBBCwoZKIiGEEBJThGIbVURCCCFhQyWREEIISRA0JBJCCAkbKomEEEJITBEqUyJtiYQQE1YdbMGK/c1Rd4OUAROi7gAhhBBC1AgIGJVCWhIJIWZ8//HNAICa2y+JuCck6ZTMkiiEWCmEGBBC9Ob/HdDtu1IIUSuE6BNCvCiEeKNu3xuFEHPz+2qFEFca2jU9lxBCCCk3qCMSQggJm1K7m/5MSnlq/t+7AUAIcS6ARwB8F8CbAfQDeEh3zoMAhvL7rgLwcP4cJ+cSQgghyUXhbkpLIiGEkLCJg7vpVQDmSSlXA4AQ4joA+4QQpwHIArgcwPuklL0A1gohXkZOKZxida6UsieCv4UQQggJDHV2U2qJhBBCwqXUlsTbhBCtQoh1QohP57edC2CndoCUsgo5y+G78v9GpJQHdW3szJ9jd24BQogfCyEqhBAVLS0tAf5JhBBCSDioEtfQkkgIISRsSqkk/gbA2wG8FcA0APOEEO8AcCqALsOxXQBOy+/rNtkHm3MLkFJOk1JeIKW84Mwzz/TzdxBCCCGRQSWREEJI2JTM3VRKuUn361NCiCsAfAVAL4DTDYefDqAHOXdTs32wOZcQQghJNELhcEp3U0IIIWETZZ1EiVy4xR4A52sbhRBvB3AygIP5fxOEEO/UnXd+/hzYnEsIIYQkGrqbEkIIiYKSKIlCiNcLIb4ohJgkhJgghLgKwEUAFgGYAeBrQogLhRCvBXAjgDlSyh4pZR+AOQBuFEK8VgjxCQBfB/BMvmnTc0vxdxFCCCGEEEJIuVEqS+JEADcDaAHQCuDnAL4hpTwopdwD4CfIKXzNyMUTXq0792oAr8nvmwXgp/lz4OBcQgghJLEos5vSkkgICRFJIUNQophEKWULgI9Y7J8JYKbJvnYA3/ByLiGEEFJuZDmBI4SExJfuW4269n7svfFLUXeFREwc6iQSQgghxCFUEQkhYbG/kRFbJEeUiWsIIYQQYoFQZa4hhBBCQoZKIiEBcaS1D3O2Nbg+79vTNuBL960OoUeEkKRDFZEQQkgUUEkkJCC+dN9q/Oq5na7P21jdTvcOQlJKNitx0yt70dDRH3VXCCGEkFGoJBISEIMj2ai7QAhJGJVHu/DY2iP4z5nb1QfQlEgIISQCqCQSQgghEbG1tgMAsLO+U32AIksN09Onk8auAXT1D0fdDUJISqCSSEjAHKDrKCHEIeec+VoAwIff9oaIe0LizkdvW46P3rY86m4QQlIClURCAuaLTEJDCHGI5k16yknjrQ8gBMCJ4UzUXSCEpAQqiYQQQkhI1Lb1YUHlcdP9LHFBCCEkjkyIugOEEEJIufL5e1djaCSLqlu/gvHjPCiEqphE/90ihBBCLKElkRBCCAmJoXzW4y/cuyrinhBCCCHOoZJIUk1T9wAON/dG3Q1CSJlT1dKn3G5rW6Q3KiGEkAigkkhSzRfuXY2L7+EKPyEkWkyrWtC3lBBCSARQSSSppusEa04RQqLDS94alkkkhKiYvaUu6i6QMoJKIiGEEBJX6G5KCHHI0xtqi7b1DY7gnN/Ox5I9jRH0iCQZKomEEEJIxEgzv1JaDcuSgeEMJk+Zjxe3H426K6SMyCrkxZHWPkgJ3LfsUOk7RBINlURCANwwb0/UXSCEpBCRNxXShTRdtPQMAgDuXHwg4p6QciKTzUbdBVJGUEkkqUXqZmVPrKuJriOEEOIKapSEkGIyKlNiHkoN4hYqiSS1PFdRH3UXCCGEEEICwUpJZHgzccuEqDtASFRsPtIRSDs76jtx6sn8lAgh7tGym9LdNF14yWpLiB0ZChISIJzZktRimijCJd94cF0g7RBCCEkXkpN6UiL4phG30N2UpBaOzYSQ2EOLU1kiaEokISAUAmOc0JJjjU167l5yAJOnzC9Zv0gyoZJIUkspVnAzWYnrX96Dho5+5f7VB1tC7wMhJL7YqgoKMRXnBa7m7gFMnjIf2+qCcecvd2L8KEkCUa09jMvP9LM6wXH/q4dL1COSZKgkktRSisF5W10Hnlxfg1/N3qnc/6OnK0rQC0JI3AnK/T1q1le1AQCeZMZoS7S5vBeFf0tNe6B9IeWNZklU5bShuzOxgkoiSS2llI0MJieEKLEzJSbMK1GzZFhlWST+Etf8dk4lAOCVXcfQ3D0QUI9IOaB6rcYWJIq/SX6mxAoqiSS1BC0bxymkc8Lmd4SQuJGwSVxr7xAAYH7l8Yh7kgy8WJCllOgbHMHPZm7HVdM3hdArklRUsa5Wb1iWC9jEAiqJJLUELRz1wrl3cCS/Lfe7mUsHxTMhBHDn2RC23Njf2I3pa6o9nXv6JCZNd4IqwYgbtPHrWOeJILpDUgYt/sQJVBJJeglRNv7LnzfkfxKWl1IpjyOZLKavqcbQSDaczhFCYoOwkRFRcMnUtbh5/j5P55552skAgAvf+aYgu1S2eF2r1BYlnZ7edWIYB5t6vF2MlB1anOLKA80R94TEGSqJJLUEbknU/bzveHfBvu11nSZ9KN42a0s9bp6/D4+sqgqwd4QQ4gzNuuAnqQVLPFjj5/ZIuE98861HNuAL9672flGSCFSvleod0Y77yV+2hdkdknCoJBISEKpBX79tYDhTtF+lqPbnXVV78v8lhBA9e452leQ6XjzR4mQRTQKe7pfUhTI4bGF/I62IZAyu4RAnUEkkqSVoIamKMdFvUSmEqhW+0XTVjBVIJZmsRENHPzr6hqLuCikBo3LIxed+/by9ofTFyEjWu8s756DW+L0/o27KHCaIHn54JEAYYU5Si9/EAYoGizfpNFGng/nYCjFJI//17HbM35XLDFlz+yUR94aETRzndONEzoroSUek4HKFFyVPQp8Uzf744Qzj29OC0t1U8VHm5j/8WIk1tCQSEhBW9YkA9zGQXCFOJ5qCSEhUaN4MXuq7ahNSurNZ0zdUHH7gFCmlq/HhT8sOeb4WSS7Xzq2Mugsk4VBJJOklaEOiTUyiU+9RzfrI+kWEpAcv9fLCwq50j6M2AupLufKZu1YC8K9MO3lvqlt7/V2EJAa999LMTXUR9oSUA1QSSWoJehKjjkl0f5VxnF0RkhrioxoGA9e23OHV3VTDyeJj4KEVJLY4zW5qBnMhED1UEklqCTpFu50l0SnjaEkkJHXE8XP30iXt72AJDGd4uU36d8VRMXQ+CuKQB1ccLun1nttSj81H2kt6TeIcKomEBIR+HHaTVKConfy5VBIJIaXmeNcJDGe0Oone26FeUsz2ug7UtPYF0pbezXRhJeOYiT1VLX22LuSVJSqvo/HrF3bhXx/ZUNJrEudQSSSpJWi3Ti+ZTJXtBNAGISQZxO07f2WnTuFgncRAueyh9fh0PhbRD8Y4xB31nZbHU2FPDyrLtF7GLNzdmD9QfT69TYkeKokktQQfkxhQO3kpT1lNSHqIy/c+4nOWqFkq6G0aHm4XFuj6SzRaewct9/tJVkXKDyqJhMSMIDILEkKSxdbaDgyOeC+LEBQZXXHEOGVcJYTYY5ekaLyNC5X+i+cchFBJJKml5KurDuWtlriG8pmQ8keviBW4ekZEUG7zJDykLHw2do9JP9L98tntYXSJxBi9jBmf/77NZj/6XAj8/gmVRJJa4uqAo/VLE9b7G7uZljpBVLf0YtXBlqi7QYhv/EmduErY9KFfD31xx7HoOkJCx27te5ydJdHF4kMYSCnR0TcUwZWJCiqJhMQMvZA/2NSDL923BvctOxhdh4grPnv3Knz/8c0YGI7edZDEn3k66+G2uo4IexIMXM4iJBqklNjf2GN5zAQbJbHQklj6r/mhlVX44E1LcbzrRMmvTYqhkkjSSwAL3UMjWfuDXPKbFyoB5Fb0tBW1ebuid0Mj7vhsAFkMSfkza3Pd6M8zNtUV7JNSomdwpKT9GVfgbup+kjhWJzGoHhG/8FGkA7N6g/rP2C4mseA8vx3ywJK9TQCA410DEVydGCm5kiiEeKcQYkAI8Zf8758WQmSFEL26f9/XHf9GIcRcIUSfEKJWCHGlob0r89v7hBAvCiHeWOq/iSQTuwBvJ/x81jbHx7pNAiEBnDQh94keae1Dcw+FZpI4xkGOeGDvse7Rn5ftay759fXKnZ9JIhUTZ7T0DNoq47saOjGSKVyQdJNghNlN00HfkP2CkqYkmr0SUddnZgkw5wxngjdSGInCkvgggC2GbceklKfq/j1lOH4IwJsBXAXgYSHEuQCQ/+8jAL6b398P4KGw/wBCNBbvaQq1ff2qX2sP/fQJKXe+MnXN6M/9DiZ9QeNfneDsTsX6w62m+zTriYp9x7tx6QPr8IX7Vpse8/zWBl99I+lhvM2CQTZ8vcMRYXhplROHmnrwzt8txILKcL3MSqokCiG+DaATwHKHx78WwOUArpNS9kop1wJ4GTmlEMgpjfOklKullL0ArgPwTSHEaU7a39/YHfoNJvGl5MlNbeZOBwyxBKsOthRYO6Ne4SOElD8FlkQPIofupmqunL5p9Offza0s2NfWa74A2NKTq2tX3dJnekxn/zC6B4ZN9/NRpINymCLsqO8EADxXUY+B4QyT9plQebQLALBkT2Oo1ymZkiiEOB3AjQB+pdh9lhCiSQhxRAhxb145BIB3ARiRUuqzduwEcG7+53PzvwMApJRVyFkd3+WkT1+6bw2unuHcXZCUF3EbOP/fn9cX/K5NDjSoJBJCwka/MKV3kd9Q1Ya6tv4oulR2GGNPrWS7mbJtdDG1nEybtLHnWBc6++mhUi4EMUXwu0gUFFUtvXjPdYtw28J90XUixpRqEa6UlsSbADwmpTT6RewH8AEAfwPgswA+DOCe/L5TAXQbju8CcJpuf5fF/lGEED8WQlQIISpaWpienpQeO3mrcq/QT9K4oEZIuohiklYw+chff2gkiyse3YiL7lxhe77W5SBivklhIqGguWTqWnzzofX2B5JEkAlAYMTFA0CbDz27uT7insSbsIeIkiiJQogPALgYwL3GfVLKRinlXillVkp5BMCvkXMxBYBeAKcbTjkdQI/D/frrTJNSXiClvODMM8/EvuNG3ZOkjVIIQzfJagZHsrjg5mWF5+tOpyWREBIF33x4neNj6W7qHqNkP9Z5ApOnzMeO+k7HqrbV8GClsFe3mruxkmRhlsBItdnsnYjL4s6E8bl+cN6jplTPqVSWxE8DmAygTgjRCOB/AVwuhFD5ekpdvw4CmCCEeKdu//kA9uR/3pP/HQAghHg7gJPz51ly+8L97v4CUnaUWhiqBLhxItXaW+hiqj+DvvmEkLDRZ8LUJM7uo+4XVakkusAwNqw5lPN2mrGxNorekITiJNml3SyiMLtxdHOOscUmCpIoKZWSOA3AO5BzK/0AgD8DmA/gi0KIzwgh3iZy/B2A2wG8BABSyj4AcwDcKIR4rRDiEwC+DuCZfLszAHxNCHFhPo7xRgBzpJTW1UTBAYwkD6qI5U8UxYsJ0TPOb+IaSirXGNf/tAVMCfNJsvEu+7nrPRZJb0hyCMLqVkqlLOykK2kg7ClDSZREKWV/3q20UUrZiJyb6ICUsgXABwGsB9CX/28lgP/SnX41gNcAaAYwC8BPpZR78u3uAfAT5JTFZuRiEa920ifqiMQLe451eU7N7OVb1isN1B/Kn1mMvyA6olC4CkMS3V9/1ALAUdY7ultXijn7HYsOhH8REjpmSqLqOw7ivWrqHkCjj3rAP35mq+k+znesKZUuP6E0lylESnm97ud7MJaoRnVsO4BvWOyfCWCm2z44XS3ZXteB889+PcaN44CXdura+nHJ1LX4/sfehhu+/r6i/SqZZjdREibnaehXmGllKn/WV5nXUiPpI8ykJWYEZkngkOkYq1gy1W082nki0OsPDGcCbY9EQ9Dxe3bN/fOtuWp2NbdfEuh1AX0CLGJFWSSuSSrrDrfisofW4zuPbbI/mJQ9rX25eMGdDcaEuuboV/C8ye+xkxbutnfN+OFTFfjq/WtsjyPxhPEXRE8U74PvOonBdaUsGM5k8Z3p1nOIYnfTHBLS8TvARUSSNXFy4qtBvJJaJdGJ2G3oyNWEWl/V5sukTsoDLXGMmVE5jOmcXrg/ub7G9vhl+5o8JZkg8YAqItET9fvgx0U+6r7HhcV7GrH2sLWHgPE+6xVDMx1xQ1WbZRuEqEiKwjj5jFNyP1CQWBL24lB6lUQHq3N6V0G6Y5CRvJI4YZz6sxmxyT6qjguwfg8TIs9JQNCQmC6qW3ot90fx/RdkN/UxAaFVPEfGR1bqxbsbTRcljxlcTt3c7U3VbfYHkbKhpWewaFtcv85vXfB3AID3vfV1AOLbz6gJQr5mshK1bdYlcFKsJDo5aOxHTtaJNtiPNxm1T4SwkJCUVT8SDFHEoJHo+Ozdqyz3R+FCyDcwWJxM5ozPWTujbyiD4yF4MV09Yxv2HHMeNkGSzQ+froi6C47RPheW/HKGn7t037KD+NSdKy2PSa2SSIhbtHHcxJDooAEv16SgTBNeJujDmSzWHmLCm3Li2c11uOb5nZFcuz4fZgF4jEkczW5KvKLXKweGvWXTNmsPyA1Fl0xdW/C7FRU17Zg8ZT52H6VimXSSUqKGOqI1o5+0j/u00YFHQWqVRA5gxCtB6m1276GbS/11a4OfrpCIGRzJYM72o67Pu2vxAXznsU3YWtseQq9IFEyZU4nntzbYypq23sHA4+UfWVUdSDs0iud44NVDvs63ynzqvA1fXcDSfU0AgDVcjCobnFm4S9ARs2vnZz90W1cTxG1xUqYovUqigxtcUC+KFh3iE29JIJwfe/vC/R6uQKyYuakOP3zK2lVn99GuQFxjqpqtYwNMz2vJndfWO+S7DyRe2K36f/jmZfjobcvDu76n7KYcK/UcbLKOO1XhZH7ip9yB1/kMny0pFZxylwAHcia9SqKDu2NcwWjqHqCySEqKm0GZpTyD59q5lViWX0VXsam6DV+9fy0eX3ekhL1SQ8lUfpiltI8zaXE3zWZlYHFT7X2FCzz6+UkQlhRjE72DIwW/23mhmM2XZm6qw476Tl99I+lkJGMt3EbrJJa7IIk5qVUS3XKktQ//fOtyTFsdjCsOiTcnhjJFgf1ehJV+TcG4vjCcydpmRHWDWUIdEh71HbkMg3uP+y87YvZ+XTFtI/71zxsKth1p7cNP/7IVgyPMukzCw4vlaFRJLPPZ3duvXYArp28MpK2HVlYV/F5YqzL45Z/hTHGbRw3ZUp1w7dxKfOPBdUF0icSQMC3Hdyw+YH1tltJxxPzK456rLzi5t6lVEt2OX/+Rdzmzq3dEkoPVO/CbF3bhkqlri1Z4g+S3cypdnzNzUx2au9UxSMyMGSEhmvE2VLdhc01hvOHv5lZi4e5GVNR0hHdhEjhuB/OorcN+9JM0SKON1dHFAQetOw6P2Jut6UhVPkT9fe40sUBr7xjfNWv01v0GXbIxV23Q3dQctzGJGnxxywerZ7mtLjf57h0YMT/IAQUrwoYp32tPGm/fgKGP186txPce32x7LVIagrjlmaxEfXu/Z0s1n3s4DAxnMGzjEuWWG+btdXV81OENnuKoA+9F+iioVemzraGRrO+kZpQxJGjs3mvGv8aD1CqJTlAJRr646UL5DgT0Ckwcb//5qS7VrCiMC9CSGCbXv7wntLbvW3YQF96xAnVtxauBbmKeuIAVLO+5bhH+xeDm6xe3K76JfqQURyXl57O2K7cfaOxx3dblD6/HPUus3QGHHFgeSfwoZVZc68bVm0frJCZa+MWfjr4hR54QVBIBLNtrnpjCCCdi6UD1nP3OeYxtOtHpVP0wsy5QRwyPJ9fXWO63EgurD7Zg9cEW0/3rq3K1ilTK/83z91led2A4g6Uu5BdxR+RJOSIeb3xZMjlWeqZAlJvcR+OCtSZHitryMC5sre3A1FcPWx7z2btXum+YEBs4xy4N2+udhaqkVknU+/P+8GnrFPd6+AITN1i9L04SO6jSnJs1SUtiPPne45tNXYQB68WHF7ZZu4m5kV0ketyOH5kEupsS/zi576WytAxnsnjYkFgHABo63Ce6IeGSpCkAvfLc8ak7V+CL964e/d3v/XNS4QFIsZLo5AbT3ZQAuYLVQaB/c25dsC/wTLlJGiDKkfr2fnSdGHZ9ntVzc2fJoWyKO27HDz+18ILA1+Upj2KB03HB7FGf0CVb2ljdhhaTcAeSMJx4MrlsUkqJW+bvdTQOmsmW2RX1lvvTSm1bPw40uXcdN8WhXEitkugEp5o2KT+0yfnqQy348M3LsPJAc6DtO1UQVXLSKDx7B0fQNzhCS2IEaLdcSokL71iBz9+zytX5O+o7sSWfoVT1rAeG1XE/bh61lDLyBCgkR2FJHPtnkui4nCT3PQL074P+847TwvSaQ634yC3LXJ93y/y92FobXSZYMkaYb9OcbUfx6JojOP+GJZ76cWKoOPtzfN7+ePGzmeoYZKc4nUKkVkn0qgByrpUuttflYpL0sUleB20vE3Wlu6lh2/v+sBjn37AELJMYDJuq2xxnA/zVczsLfjdLKmRGQY0xxbMeCiC75qUPrMM5v13gux3iH+0Rrz7Y4uiZuC3W/u7/W4hvPhRk3ToOeCrCKI3kdkGg26HXgp/F7t5Bf9m9NR5dcwSXPxxsEigSP5p61OW5VDidD3X2u/fOIcGRWiXRK1QS04GTx1zZ0BV6P1Qd0W9aWHkcADCSlbR8B8S3pm3E/z6/0/7AhFB5tATvKXGEtsC0wqFnglt308GRLLbVeU+2Y5y40d1UzYV/fDXwNt0uIj6kiBNU4cfB5Fezd3g/mcQaJ6+F23fy3W8+zfGxSi8p3Vb9z6rM38QfTnJiAFQSC1h3uBVbdEWrGZOYXjTZOE4U/q5n3q5j4ffDRku85q+7Rn+mt6l7DjX1YPKU+aN1MZMMF7Dij/aMJjg0+0f9TP1cflOEhebDpk/hFueXqD9flUJQ3dpXzrp+Kgkz9ODUkycAAD4y+Q0O+uFsGwC09TEONmjobuqBq6ZvCrwuFkk2mnVO5n4pwK2w9SKblYJU97N+rsmYRPesypemmL8rZ5Ft9ZikKIhhN+pJIgkf7Rk7XcUtdeKaIC6n/WVHO5n90g1mz9rvM4liWPjUnSssMz7OJVwAACAASURBVDqT4NhW14GB4eAXLexQXXNcfkLiNZba7LSoE3iVI07lQnqVRIsb1NIziGV7m9RBtHxXU0GRBU8ZG+ikHZ/9sKmTOGH82Cc8Lr1fsy09A8N4aOXhohgvbbKuDUK/eNZfMLgfKFtSQP4ZO8446fGd2He8Gy/tOOrtZJ/X52scLH7vp5swBCklegb8xYDVt/ejtq3fsjYsCYZjnSfwzYfW49o5laG0b/Xu+b2mOimfVB4QQGg+8ciEqDsQR66avhEHm3qV+zgApgNpMZnT9pUi86Dab3+M8TpTIi2J5tz0yl48V9GAd551Gj7/j28e3W50Jw46SP7pDTWBtkeSjbb45HTi7jW84ct/WgMA+PoH3urqPOPV0hhesXxfE045aQI+9o4zou5KILgpgfHEuhrc+MresW0eVgk+c9dK1+cQb/TlEwvt8hB37tSbwYw5230uQrmoAZ1JdJrnYOk6MYzXvWai73ZYJ9EHNa3mQbJMJZ8uavMB089srMWqA4Uro05cIPy+L3bn6z9zv0K/nNGy9A2OFHoHaHdMe5b6W/jY2iOO2zd7TE+uq3Hchhu8JCkayWRxuDnAOkvENVaLTyqinht5EV9Jl0L/8VQFrnh0Yyonpov2NPpuY8Tivmlu/SQYRt07Y/Kuuvn2nZT30qC76Rjn37AEK/b7L8lGd1M/WNw8TsTTgSaSNEvd4EgWjzisbWjapgc5p5L9Zu2wBIY5o7GlhnunDbKjk3fdx3+TbkXdK1EPbXO3j5XyuHPxAVx8z2rUtPZF2KN0o70PTr/VoCdHaw61KMMoNIJYBI36nQ+KP7y8u6TXC2seHPWwoH+n/nPmNkeF1okzNO+hTEgvj1Wzp08K3hFR/67oL53GBRsrNh0xTwq2/nAr9h3vtm2DiWtCYmttB5q61bVgjrT2YX+j/cMh8UeTVef+7ekAgG9+qNhty8mEKowpl94FTL9mEfVkINbkb87PZ23Hz2ZuM25WWhLd8PJO+0y3VpPzIFC9a3ctPjj6c0VtLoNri8fkPGmlti04pVqTGY7dTQOcGx1q6sF3H9uM9/5+kfn1Qrx+0nhpR/jZq8Oie2AYn75zBXYf7Yo067VqjOSEPzjGa0qiz3s6ogv6U8WSZrOy6FmecpK5kuhkbqSuAa0+NiwlOGqe3VyHyVPmY2gkuKDLK6dvwpf/tAZTlx/CuRay3ilUEj1Q3aKeNHzmrpX40n1rStwb4hU3g6dKRrmVy17ie9ykiSZqVhxoLnBzekX3s+YZMJp1MuBr6wfLq2dstTzWr9WILjnh8P0AszS6tSQGGd7gxYLjRWaVzWJVgj+njVVtqGnrx33LDtofnMfPq9beN6Tcft+yQ94bJbZMGJ/72rTYRK9ocahVLepcHG+/dgHO+e2Cgm16GTbsIbNMVnGK/hXUy75MJsEfowV3LD4AwH0maCdy+Z6lB61L9dDd1Dt2985vMP9IJsvVtBjgd/7l5D3wfw1n24g5P3hii+k+zV1ndEAKcdl9Q3Wb5X67K1ebDOAamazEZ+9eiVdKUL8zTQwGuMqrvWaHmq2fpfH4IHAy5Biv5ze7aZJj+PWLLjvrO/HLZ7eXLPZLL4b+uGi/h/P1bvTOZZrxSKd/7e9fUrvmzthUy0XNENFurd/XcuneJgBAt3EhyaJdfejV/zy30/U1bbOb6ijXBVDtDrpO9hTA7WDiGh/YTQpae9WrZk459w+L8ck/vuqrDRI2Uvf/homP9l+3lkQPH/acbQ3FG8tTXkaCNs5pq5pWFp7fzqn0tbgzMJxFXdtYUiy3qeY/d8+q0Z9Vuuwvnt2B6pY+XPP8LuX5ZWPhKTHjAwz21d4eM8uLkSB1kigUtnKZ2/3w6Qq8uOOYrat298Cwo3ggO/T3zUvG5VJ/60G6yxHnaN/0qBu7xwc/brQUlLfz51ceL7j+trpOW+umqqtmly9bJVF3EyZPmY+VB/wnpDFy1fSNvs5PrZLoR4j+1yx/tdQGR7I43qWOayTxwIlMciZQ/Qm3ZfuKhUZBTCKn/r4w3j2ruzlrcx3ece0CiyOKMT79F3W16z5+m7uFIilzMQy3Ldzn6jxVO8Q5DR0n0D/kz51rlPzNd1quJsjJkSNLYsArUEl+1fR9156W3eO46tFcPJCUEhuq2iK3pPq9enVLH4Z9uPpJqYpzLdzSOziCP6+qik2GziTiZuFadcz4cQaPGgfoRZhKTtnNcdWWxLGf9xwbW2yxypibbArHgdlb6h2d5eZurDvchsGRTJFLK7Obhsx3pm/C9rqOqLtBIsTtBCAoMedn3rG1tsN3/EI5cyTkzJ/6Z9fj4TlMmVOJR1b5y7JL3BPUe+E6jtniY3frVlyQOdChEPHtLp/gFQkvXa/M16ubX3kcVzy6EbM2O5v0GfHr9V6Q0MxnWwsq7ctWmF2jrW/INl7t9oX7cPvC/VgcQPmN1OLzM9OURDfySb/QpfpWvHjd6Bep1leNhWcwPKuQaS4z7f9i1g584vZXC+4js5uGzNrDrfj1X9VuXST5GAe9AiEoFdtKiNfLdvUP4/KH1+PnPi3hUdDeN4SHVh4ObdIpIbGroRMdHly7koKW3ZS4R5VkwQ+fe+9Zjo6zett/NtPdd6yfZ5lNuurbC2sEW1kWpZTosvleegaSuyClyiLd3OPMA6i+Pbdq7yYzbpCiTeuvO3kZTjzY8xXWirL2jgQZ+5sWjI/G64KA9p4Yn/VDKw+bnqO+1thGO8VO6W5qckq5lp4L6s+yKokBjNU/9aJsU0n0Adc2yp+xFZvip+02cU1QCo7XdobyK7o76zsD6UcpmfLCLtyx6AA22whDI8e7nGcNqzNMkIOgKBEIpUYiCcrtU3v+kyaOD6Q9N+j/BrO5wsX3rHbc3rTV1Tj/xiU4ZpGZL8kLE6pHfukD64q2zdpcV7RtxqbaXBserz047F1hqm/vx6GmXGKkOBhgBgx/S1N3YVxngo3NscHNLZy+NjenUc0jjJusakPbuczbyUw7d9PC7eX5khQlivL4Z/5urrOarl7mH1QSCfFIVANwQaxMeS6wFdGbd810Gx/zMYdxfyL/v7AJaqzzmzyLWGOclASlJAZtkbRDX/OsUEn0726quQcalUT9V5RkN7HCmERz2TBzU7GS2NCRuyeVDV2Or6d3ab5+3h7H5xm58I4VuG2h+4yoZqjeAWMtPav7Y5yYfmWqukxYWsayMHCjRO0+WpxYqSafUM1VTKLjI53DRVTvuFkQdwOVRB/4Xd1YtNve159ERTAiUJUVNSo0AZzEwTisPk+ZUwkgvMEprHaDyKBInBOUruO2meWKxFVu+J6uxqN+uAozW6C+5QATw5Ye3R/iVf7Ylb3Ro1eevLrp7j1WKBdcOZu6sOJc81d1yYPO/uLFK6evWpkai0pCELcum5Xu5JzNN+FFxqTtHSgKa/LxJD9+u/2CuJf7m1olUV9QOyr+a9aOqLtAHBIn4WU6mNueqP2Q5Jlb9Axnsnhs7RFHad/bXFj8SvWKlavrTpgE7SrutL29AS4G6CcgbiaDxvfcTeHsJMcSFWaRTgY/eHKz/UEmBPGorn/ZuwWUeCcI8TRrS13kpSbSNjIF6b0U1qNLpZLYF1Q6c5+4XTV4vqI+NJMyscbrB1gYkxhMX/R4ETEJnreF6o7i9L78ZWMtbnplLx5be8T22P6hTMHvVr0P6rHY/R36iftLO45ixf7gazMlHeO3GrTX5HUvlX4yrf+bnLqBSgC/eq5wMfOdv1uIGotsr8Lk56Th2AIWo6mtcdIZxOKGmxaM8Yduzyfu8D4vKT7xWOeJAJREbwtRGoPDGfuDiClVLb2W+6evcZ8ZPZVKokpqLd3b5LqZqpY+/HlVVQAdsqdnYBjX/HUXrpq+qSTXI+Y4nRSEbbFZsqcR3Tq3JLsJWZIH61LECzq9guYK1j2Q/Eyov3h2B37w5JaouxF7AktcE+FHmC1YsHLeEZXXzeFm88lIkuWMnsLYb2vpIKXEPUsP+r7m5CnzXcUxGlF1043kVJ2velXCyESa5MXLUvDo6mpc//IedcIZl1+d6pmOE8JVK3aPy63MrG/vVy4ylDNGd3y/48O1+fAZM+5aMiajnHp5pFNJVHDTK3s9nXe7IkD8Bh9B52ZoCQ9aegatDySB4MRX3O4TW7i70SDQg5s+tfcN4cfPbB1N6OKkdU1ocyz2h/ZIvQj0qcsPmU7Q6zvoJRBXgs5uGgVOsps6Zfx4MZrd0Kqtkycmd4rhRpFu6R3E1OWHArnu0r3e6wX6yZZoduyrCk+DThelgujd7p/Dzb24ZcE+PLm+RpmF23X9VcU2gVxcop82Cva7fPDzdh3DSROSKy+8kAR3/HQ9EQuCHLyfWFeDHgdWBgrP5ODlWRlrjq077DyJgR1erJSa/E+AXDIlrG9GSuf3ZWeDvxIiZq5+TtxXSTQE9d5FKfP1MsOpu6lV3O2Ykmje1htfe5LD3pWe3/x1F+ZsazDdr5/A2ckG1WKxVxoCXCwKYl6z9nBrAD0xh9Mge07owhYKPAJGiza7a085fxDCkbJ5uLnHtOxNYXIsd30aGMog7W+D378+jLkdlcSQOO/6JWjvY5r6cqHzhH/Xwj8EGNTvxRKgrRKWwnUzaOKk2Gor614nYOkeBpOB8RkFZ0mMB04Xmf71kQ2m+8blZw9G64O+7TgvhM6uqMevnlNn6QSc3yMpgTnbjgbVLczZ7r0to2Vi3eE2fPbuVY7O/da0jZ6va0WcYjaTiv6xKmWRy/HRzJLo5J2/+J7VoWTSHE5wuZy4EIa8TaeSqPig6tuDd/UK1DU0RpPkNKKKWXWiuIQh9oSwF+ZWhXLjpHC5JaxhxNM9CSCZURj0D2WYwTRgAiuBEelzGXvJM377IYHx+YAa320lACv5UC5/vp9FbavySnb3Z97OY46OIzmUr6JrS6KiXeFfzulPb+oecN2ntL0DR00sskbCMDg5nfOkUkmMyxzZ0/eQP2nR7uNo6Cj2TSfO8aosaUkborTIeXl30jCZ80ru1rh7nl6tS6VYWX/Bo2XjPdctxKOr3WdAK3fcxOroOdTUU/B7pCpigTXCf3vHu3KTwC01Hf4bizlJ8b5wOukMmiDuT5IXL0vJxPFj03bP2U0hC5LehcHPZ2237oOh82mzOKuyips9z//38PqQe2NOKpXEUiOlxOqDLdh91DprWW1bn+0xGj/5yzZcMnVtEN1LLVYC1mq86ugfRr/DMiphxtC5Yf3hVnz+npzbUZLH4p31/uIB40ApdPXjHieLA8NZ3LJgX8C9SR5BWfwW7TYkIYlwHqT/7odGsvjSfaux6mCL7Xn/cNapRdskJKpbcmUwnt1cZ9hXfugVmIESpOm/8J1vCv0aSWPR7uOYPGU+ugII/Uga+vcvCGVaNc+MfA056uuXGLtyFXqqLUoO6QnjFlJJLAE/enorvvf4Znz1fmul7lN3rrQ9Rk8ahWVcGBrJYjhrna45Tiuj//fSbozkzQdJlsVBpJkHcq4wxpqjbp9X5IMqiT3FWZKjQx+vdrzzBPY39timTAeASQnOUBoGpShD9f6zXxf6NUpFUAsuD6/KeThUu5hclyNB3M4DjcX3MIin5KZvxvjZrEyXLVGd2dTfHTB6rgTBhMBbTCGNXQN4y+smFW3XXvll+9Q1GN0IT+19StNHFGcGhrOOkhWUUuzpRY5Vts4kKjdBp4r+3mObccCnQPV6G5N4/9OO1+9YNRGKA4fzE22v7onTdC7Jp5w0PpA+xRn9U9xaW+heG48nmnxsZXxMvp2o0d8G4x1x6varkmdm81Enmfq9UORuysfrmw4XpWmcUvIlQiHEO4UQA0KIv+i2XSmEqBVC9AkhXhRCvFG3741CiLn5fbVCiCsN7ZmeWyo+etvyUl+ShIzdeNXn0N00LJRCXvdzc88gntlYW7oOJYzmHndB9SriHJN43GXSAFJIOc5X9CJt77FuX21trG4f/fmnn36Hr7bihL7UgFPKKUmU19hCt4l9NJfdsBSQcqNQMfT/vqmeidnCsmlsobIN875lshLTVleZhupkLRLXlNEnZon2dx7vOoFbF+zzHAsfJFH4kTwIYIv2ixDiXACPAPgugDcD6AfwkOH4ofy+qwA8nD/HybmREuSL3d7LchpxwmmdMaMgnfLCLnSXYGD88TMVuO7F3WPJjQIeZErJdS/uxmoHsVN+eH5rA4Yz1u7DQSFlcQ3NoJm5qc7XAPOHl3bjh09VBNijdFLkbhplTKKuLx/4u9cDcOZKatfnSRMNlsRkiZcCrpoeThkIt5TTpFj1pzxXUQ8A2N9Y6M1x37KD+PKf1qgbilP8RoQU1En0vFCp2iaVSwRaoj6/vLLrGG5dsB93L8mFjBgtx0mbl/jF6m3+n+d2Ytrqamytiz4pWEmVRCHEtwF0AtCb3q4CME9KuVpK2QvgOgDfFEKcJoR4LYDLAVwnpeyVUq4F8DJySqHluVb9iPuruKGquOj6p+9aWfqOEFNUmamc8OyWerz/+iW+r283NrTlFxW0sMkjbc4Cn+NIqSyifYPurMNeJ3JZKfGzmdu8newCu+5ZxTQ/taHW1E0+jXh91kbLTJQTIf2cbEI+Q+I7zixOShMkSVN2ttWNJcbSdz1od3c7EnbbsNCYoEmH6h0YyeRLZhi237fsEPYd7w4s9rxckA4VQ8fyRdHGgyuqQn3vevPjq2ZJVLmbpklRtPpLtQVrKYEn1x0J5fpOJVrJlEQhxOkAbgTwK8OucwGMVrSVUlYhZzl8V/7fiJRSLzF25s+xOzexXPFoPFYz04yd281tC/c7aiMqkdfWl6vROTiSc+tJ2mQtCnoHw89aCACv7m/GcKb4gZRyHvp8RT3Ov8H/YkW5EtT3EitLok6maa7STvpDAw5xwv5GtQuzXWiEhv41m7r8UDCdShiZrLT1mlHdu6FMFq29zutym332QyP+vGmsxIlmAR1nIlDiEq8dJ5q6B3D9vL2R9qGUlsSbADwmpWwwbD8VgDEfbxeA0/L7jJJH22d3bgFCiB8LISqEEBVdnc7KTPgljHfeuPri1vpB7OnsH0JjADFdYa6KaTXKzBgYzgn7Odu91ctLKm29g45ccFRH3PRKaYTxL57dodxuNniGwcqQ3XfLjR6PNcWMTzQu8yCtX04yZNv12bi/XKwBUo5ZP6K4dtLodxHPubG6DdvrOvDSjmOj26zEX317P3pTEL84bXU1vvf4Ziw3eHHovyn9+KZ/TY609vmuVxmmoqb122ycS+I77werJ6U9R8dhTSFSEiVRCPEBABcDuFexuxfA6YZtpwPosdlnd24BUsppUsoLpJQXvO71waeXVrlHhDHnM7q9/CmlK25hsnRvcG52aw61BtaWhgBwucPiquUueDdWt6Ern9Fr77FufPjmZaPxLlZ0hpAFzC9BDwjllFAjan45W63Y26EaA0ZKFPtqpGCimf/v0c4TofYn6Qrj0xtqbI8JZTE4ofdN9b6r7s/SvU247KH1jkMJLrxjBapakhsy4RQth8AxQ9bhQndT9bluxg+zNlQeLm6w+ha0/o0zmRdnpSz7+QqQy458m8NaxHHw4iiVJfHTACYDqBNCNAL4XwCXCyG2AdgD4HztQCHE2wGcDOBg/t8EIcQ7dW2dnz8HNueWlCfWuvcbzkrYJsuQUqLJwqpVisK+aSOoybqAwJ9XVQXSllcyNrUck8zAcAbfnrYR59+4BFJKHGrOrQ2tPVwc00vGMC+N4u69v/mVvZg8ZX5ZKqNBTdKLYhKlRCYO90vXhSGbMchuohKHiYwfVhxoxs9nbceDKw4X7YvDoyolu4+VxsvKD+X8SDQrm9UUxGyfGyug2RxH1UZQ3/eokmiiJUoA23UxwYX7yuepX/7wejyiKyEUFU6fa6mUxGkA3gHgA/l/fwYwH8AXAcwA8DUhxIX5RDU3ApgjpeyRUvYBmAPgRiHEa4UQnwDwdQDP5Ns1PbdEf5clTpSNp9bXWO5/dks9/vlWltgoJSMhm/g/+vbSVWl56+tfU7JrlRr99/V8xZgXezkqLV74rUmh9KBuz3QPC2NpwzgQW6V594Ofd96v9cBI0j6/J9bVYN7OY7hz8QHTY6zmU37rrSqJ6B56dau24qkNNY6OW+bQgyfhaxKWaPpTUVKXgp/1rqdj292sB9eaJLKzkyOP+5D5WtPjTd1NJa6dqx6zygXH7usxeslLoiRKKfullI3aP+TcRAeklC1Syj0AfoKcwteMXDzh1brTrwbwmvy+WQB+mj8HDs4tGapP66v3r7U9z04ob6ymVaTUhO0H7ncSZXa6fhXuda+ZCAA4+w2n+LtYjNGPNU3dAyXPQOiHUnT1+a3G8G9r7N7LbFZia2279UEkEpzIFLNaa3GIewmbxq4BzN5Sp9znNYY5TMrpiTh17X9RF58IjLleGmtXJknOu0WYWBL176heGXx+61hohRtL4lMbvGUMv9Embt/K4qf1z9SSWE4vvQl6bwUnf24c3vUo6iRCSnm9lPI7ut9nSin/Xkr5Winl16WU7bp97VLKb+T3/b2UcqahLdNz44BdjZk/LT/ka5BOw4dVasK2JJbikWkJKVTXKpd3pjBbY+mvn1RXb6/jzrQ11bj84Q1Yf7gwzrZc3qdSIBFO3I2fJkdsTBB++huXd+Mzd63Eb16oRHufu3rDUXklmFl60sQn/7gCQK52op7op83hoclm41un/10fc//IqjG3xSDc2FVNOG12tCazCVr/zMafNGQ31cd/P7zSPBRp85H2ouOjIhIlMU3cMG9Pwe/GVTHAfpAmpSX0OD6fstDNIJkGwQtEE7Pw7Bb7BDlJob1vyPYOHsy71R01JFUoR7x+Np+7eyUes3DJCmsxw5E1zCT5hV9L4pM2IRNRs+ZQC07kF3TcjrXarSm1YrJ4T/JqlLb2DPrOrqmix8RFr769H+sOB58YLkq0+6eqIahh9r1lAxAuflr45B9XWHrG2bub+rh4QtBbBp2ULOlzkTHYQ28cHUUlscT8z/PusuSV86pZXAnfklg6aVjOglc/1uj/zld2HY/FClyS+METm22PMZsAlvEr5pqqlj7LUiotPYOobrX2LvGCW5GVdaEk2lmet9d1FiwcxO19ONBoHTNYzjKylPz4ma2htGtUKlp6cpPrT9+1EldN3xTKNaNC88Q0Lu46WQQKwm1cdRnTRGeKbVZKota/uSZluVLg9R4znN3wdCqJESYOqDxanD1sYMj7hLacsj6VGjPhlwkokYN5FslAmic6JAoXVJp6nBcWThuq96+2vd+xDEvD69sS4vuztbYj8DbdjgP640ds5J2T18LMOvDI6mizOzvB6t5RVkfPeEMM2w+frgBQnrG02t9q/NOc/KlBeA35baN/yFxJ1No2q/FsNf6Uy3doZ/SpajEsIMbgD0+nkhgCZmZhu1VMADj/xiVBd4c4wPj97TvejfVVraEnFYn+sy8PCupZelh5jZIYxKO7ZrTP8b61gXDhHSuKtsX9nbJD33v9pHPqq/5r7U4cr36hF1Q2+m47UFzGXHERNnqSKCs948OSmJXe67kGRd+guXuknaIbty9ta20HXjSxenrG5l2uaesv8MoIdyGE7qaxoNnjivT/Pr/TtoYiCZYv/2kNrnx0U+gZpdISJxg2P5+1ffTnokB/3mJThADm7zpesE1K+0Ha7KtIuvLklKAG7CBih7zwo7wFBih8ZnO2+Z8I6f+icnodyulvSSrjUqQlan+r8b1zIjICcTdVbXPR7Kknj/d87bjNiy5/eH0kSndlw1iW+oCrExXQPeAs6zCVxJjy160NSrckozk/Zt9Voohq7In6mZXjKxO3ASbOvLq/2df5ErJA0fngTUv9dilVjB8f/LDr9vXXP78L3vaGkl+/lNgt+llbErVGAusOcYnR3bScGXXW8GRJVB/jZhEvzAU/u6cYZxnihRNDGVQ2dKFNl6DGSWKnn/xl2+jPVvHtfvnBE1scHUclMcaoYkXK0A0/MsyEUtjK4476TvuDSsSm6jZMnjIfdW3W6atJ+WCWettukB5Nzy6BGZvG6myFUYC7nInDnFf/qP/jk+dYHutWHoaeHdoHD68qfvc3WNUiLreZawKhJdHZwm4QlkSVl4Ob2++0CypltFwWem9buA9L9zbhq/evwdceWIuP3f7q6L4kvspUEkuMm+/gO4/ZZ+4qj88qXoSRxjuuaAXXNx6xmCglACnNs52SYNDuqRDA7qPdrs6ta+tHo0nCgqQQ1CsVhrtpVkq8vPOY+X7DNfW/zrGJu3HyLelj9657aY/FkdHyxLoa1+dIKVHdwrqFURGHRZVSIUZjEu2P3WRY3AhizHPj3qhS9JxaIlV/X7kM2Y+sqsaPnq5AVV5mDI3Ed9HMCVQSY47KVUb/Ie5qiI9VipCoMA46f90a7xqGpVqIcFrTUAjnSToEBGZXuLu/F925Ah+9bbmrc8oBlfwOwxvksTVH8F+6GF0jxkLb+jGkIAGUV2I2w5NSYmN1G6SUvr40CWCeIX6XlJYkWl+8oskLoyxW6V7fmrbRUZulXDBt6xtydNzVM4rLpcQpu2lYCWOS+CpTSUwg+kFr99FudPY7+zCJM9I0KGnCt7492e6mKwxxdlNfPRxRT0i5EtRERe+qGxRNPdZWWuOkJ2jXrpjpiJixqQ7fnrYRC3f7y656tOME2h0UvSbhUNnQlSp3U+0v9aKjBPEN+o1JvN9i3NU/xsV7ihem4uSlfveSA4G219DRj7WHws+cHwZUEmPOlpr2om3GCf3AcIy+rjIggd+xb6yEexI40NSDhg5nVjOihi66peFgU6/9QS6xs0w/urq64Pegn3Xc3p2a1pyr11GfMmHO9qO4fl54ySOINV97YG2qxuNx+sBvl5gpeFF+mtp3CNjLKCeeLK29g7h2bqVrF84jrX1Yd7jV8fHrqorDbzJZie8+tgnrq5y3o/HZP5TmDwAAIABJREFUu1Y5Ch+LI1QSY4JZnIqTiS9rOQVLUKs9S4Jw4wqZJK5sAWrL5+0L90fQE2/E7Zs1m5OoEho5TZ1N4sPdSw8W/J6WBGhx+86IB5I6SHlAi780esI4eY/nV/p3i3ajmzopFfbpu1Y6bs+JTLpx3l7M3FSHRXvceQh85q6VuGq6PyWtvW8Iaw61Wrr1mzGUL2f34Ap10rg4QyUxJtyxOFjzNvFOUPFim48UW4GDIMw6jltrO3Dn4mCVratnbA3cxe7z964KtL1S4zbxS9h0nRhG32BxltKL7swVlZ+38xg2570abp6/r6R9iwtuFY7GrgG098XTVTFJmQSPdp7AZ+9e6SrxkZ2IZIhGSIQwNKVHRfSnD6880OL7+m5kXNDlMpw0p7nNR5HM6LoXdwMAWnuHEp+Mxg1UEmPCggBWgUgwlNvC5coDhfF6VsL48ofX48EVVYEOAAsqG/G7ubsDaw+gi3UYzNhUZ7rv57O2o5ZlUlzx0duWl2zl+JmN7hZhjN/3h29a6qsMTpgWuxkba1Hd0uc4GdVv51Ti0TVHLI+58I8rgugaKQHlNh5bYbYA7Gc4dlcn0ft1SoG2uBVFnKreeuk2cVuceGRVFSZPme/4eCqJJSaIj7C40Kr/Nkn50txTaM1o7R3EwHAGAHC4WR0fFcY7FWahXkLCppxeX+Pf0tY3hF+/sDOazjjEqQfFrM2Fix2q03oUVnMST9JUkirqMTLMqweh140pif7bcoPxuQwn2JLodkGRSmKJGQzg5SqnyUqUpGWFUhXv+t18EPWO+uBLqPQMDKPrRHHc2jRD8gwSL8zkSkOHvYUp6skN8U9Yad+9sOdYF04MZaLuBokB9y47aH9QmdDZH228t0qMt/YE45p9jyEuen9jj+s2djV0AQg35AYodnH+z5nblMc9vaEGk6fMT5T7qdtbRyWxxLQynXZsMJvXllvKbdXcb0tNh+U5fqaL512/BOffsKRo+1oX2cVI6TFzGfykA9e8WxekM04xqaie9IgPJTHINYKegWFcMnUtfvFsLkGEWdPvuW7haJxQKfpF4kO5Lkq99Q2vUW7389f6vVMnhkuzWGM17fr1C7swecp8HM/HJZd6jragsjBRjnZ5TfFVxfPHFbeWeSqJMUFleSHRUGY6Ymoz/O07Hq/kMHHHz7zLLgaMRMdIpniVW/Ws42JJ3FSdS5C0rc56IWtgOFvkOqWyPpaZOCcAHl1THl4pzT0DoSsYAy6UvLDmCgccWA2txh+jbIoicY2RE0OZUctvPCRnOFBJjAlulETjC/lcgoNoo2TjkeJaOOWH9FaYN8YrtTe/4qxu2bVzK0PuSXnhpo6UGSeGMkqlhESHKnO2ajLox2UqSGnxw6cr8j+5nwl++9GNAfaEuGX+rtIk4Asrc3ip+adbluMrU9eEeo3zri/26jEjrGH/i/etDrQ9r5ZEVd1xr+gztu8MIWwnLOhumgKM6cvvW3Yoop4kl/VVrabZGmOwSBUocVb4vDB9rTOrVbk9x7CpqLW23Djhvb9fhH97YkvBNv2EzsmKclxJ6me0SpEaX/W3BBEv75dhh1ZPPVUtY8m3jJM1pVstFzEST0yM3oHgJGt0uY3hKnpc1N/16u31L3/e4O1EBXrr5g+e3GJxZLKhkphA0pTty4z+oRHcs/Sg59Xvlh7z2NCwg6JLiZTqxDUaH3v7GY7a2dXQiUsfWJuoZBLl9ByThDH29F8fGRuYr1BYevqHRrChKg1W/Wg40ORMMY9D7cR/t5hsmX3On7t7FWpa+xxfwywJBUkOr+5vtj8o4UShGLoqlxHwtTe5sA67sSS6UT6BnHwII6FfXGjvdZeIiEpiAklrjJmeh1dWYeryQ3h2i3ltNz1Pra/BQl0tylaLD6W9r7wKLde1nyjadtqkCQDMJ4bGrde/vAe7Grqw51iX536Uesyjihg/VFac/31+J654dCOOdxW/p3GinOSu6i8pVS02K9YcGltgcLPG4yYh3OI9TW66REgk6Nd2SyV5YrBO5Ag3SqJdcisjpXKZjgq35X+oJCaQID7kHz61Bc9sqPHfUEQMZ3I3oWfA2Qv/h5f34KczxlaQ3/XmU02P/dPy8nHflQAeX1fsnvm9j70tt9/hu6QdZpTNaw+1FqzUOZ0s/s9zOx0VdE2S5ZLYozJqa6nQ+wb5rEtGDGaDgyMZ/PfsHTjaab044EQ5j/6vISRYIrEklvyK3pg43rmSaDQI6I0A7X1D2FTt3otFoHgu1Nw94LqdJEAlMYEEocQs29eM617aE0BvouGkvJB4vqIe020yne09VpzlstzKXLhF+/v1lkS9W6r5+DR235q7B/CdxzbhF8/uGN1228L9jq7/wrYGy/0zNtViR30nPnPXSkftqUj5I44l1o8kKVOU5KO0JJb4/q860IK524/iojvUJVaM74rXMAu6nZMkov8aX9p+tHBfSApkGM2G0dcJLpRE4+d/9YytAHL9+tBNS/GtacEku/pCwMl54kIqlcQjLuIXSEzJf/k1bf24eb51jbaws4clmYxOgM/YbO66q5LzWv0kfXzIk+tqzNuAREffUEHK71f3q12/fjd3N77x4Do0+lidY+xudOxqcB7ToT2lGBi3LIl7/9wQ9N/itL31h1vR3JP7prVTMlmJQw7jJs2YZSK7yumZkXShX8B9ccexCHuixknCHQB4wmJO4JWJ472rLsc6c/JnzrYxxTuImHitHEa5kUolkeNG8mlzEYOiIi3qg90kSe/+19Q1ppCZWRXMFuXXHCrOoGhk3eE2fPCmpQXWwX9/siJRhWiJMy59YB2qdVknrdCs2pTLpUP1fZdCobpy+iZc9uD6ou29VjJA16/9jd3oUkzG9BM+QlQMjmQwb+exxGQKtepmWH9CRW3wpUX2NwZfr9iPJ5h2alPP2HxHlVDNC9ttarsmkVQqieVI/9BIwc8Pr6yKTXHkMOh2GItYYVIXhy5IOZzW97F7kxo6iuOKzFLNNxsyy577h8XhJAviI46UDtXKquKZaJ9iHLJrWhHv3plz5mknF217dI2zMjJhoMUgzts5Zh1xWr/sS/etwbemOU9j/8dF++l2TgAA9yw5iJ/P2o5VB+0XNONAFOJQnzgqKEZKPA8dGM6gqqXXdjEgjPt72UPFC2BJh0pimfBN3ct51+KD+OOi/QWDcFpZvKcx6i4EjhvlX0Li6x/4W+U+Y8IIy5ikvETVVvCue3E3PnXnytHdoxN83YTsR6NFse2ZvaUeT2+oweQp8wsWPPzAuWG0DAw7S0Qzakm0eP3aegfRkaCsw3G3VqhKB5W6y6/osgjeuqA4lrm5ZxAnhjJFSbP2u6y1uSIF5RKIPdp413UiGW6BVuNxvKVLIWEYK6xk1XuuW4TP3b0Kty7Yh4MKN/batn40dDhzlTVDCJGacBYqiWWCfuDsHcwJwcER+0nakj2NsU89DwCzt9Rh0e6xSYXTz/M1E8eH06EywDiJ1wte/c8X37MKOxtypS+0+/7MxtqCc7NZicGRTMHkc4WiiLcZEhLTVucSELX2BKMM0IJQWuoMMSpXTd9UdIwqG7FQJFEy8uGbl+GDNy312cPS8det1omZSkmSP4OZuljDXofeI0bcyCFS/iTFi6hcHMFKbUnUeHTNEXzhXnUymWV7i3Mh+A1hKlcmWO0UQjwDB4sWUsrvBdYj4ovhTBbPVeQmKE5Whn/8TC7TU83tl4TZLd/85oVKAMDqaz6Dvz/jFN/tlVPNMyvM3gHVMGl2Rw43O4ste3xtjaPjzNDG7rQ8m3Ljz6urPJ2XnMQ1zjtYr3C/LmfCenZSytH7/sCKw+FchCSa7XUdmDRxPN77N6dbHhdz8VKElbyJu6eCnqT09av3r8WG334u6m7EDjtL4mEAVfl/XQC+AWA8gIb8uV8H4DyNHQmd+nZ/ZvS4820X8ShA8gaGMHC6bupElpvWNBNiNNupV+rbTzjuhxPS4g4SF/w+NyeeD3FGmpniI8YYAxwVXiaLQog43UoSQy57aD2+/Kc1WHGgGb2DI/jV7B3o7Fd4oxRHRMQa7bXPKixxWp3oJBBKWQ1InBjK4M7F+/Hx25bjE7e/6up8lTX5eJc6k7pKbs2vPJ4aTyVLJVFKeYP2D8C7AFwipbxKSnmtlPI7AC4B8O5SdJS458Udyc/41tg1gF88u33092MmH7IZxu9Yy6T5WISJG0qNmYz2IryvnrHNdJ8fmRnGQJIWIR4XvK4Y7z2ey34XRqr0IHHz1019NXlWL7ui9l7Ze6wbk6fMxyGHHgmEeKGquRd/2ViLOduPmroZAsBShathFEx5YVfRtoJ1pnzkxqAiflir9ZcEwkpI9tDKw3hwRRWOdQ2EJrsAYMam4vI6m48EnwU2rriJSfwoAGOe2E0APhZcd0iQbKxO/ot88/y9eElRI8ix2DFoCuf+YTG6TgxjeUqSGVjdJ+OkXu/mGWVm3OSskRI9ficDh5qSrUSk2eJl5SI+b1dOfj/gUXEul9gsEi76Mau5ZxAfvXV5wX7tHX05Jgn9nt1Sb7lf6+84xSw9SXG2YX2/ThOjqeSymwXktSFkfE0SbpTE7QBuFUK8BgDy/70FwI4wOkYIUFwP5/RJlmG0Rahkwdxt8UkqESWft1htff8NS1y1JaAWvF5qJAUVw+CnlhJxj0nFE8eMGxfv55XJSGwrwzpYduw55vwb3n20y3Sf18n54+vS4/VBvGMsw9TY7c7rKA7oh6zuEzmvp6QvPoURk6hqUuWWa91Gwm9siXCjJP4bgE8A6BJCNCEXo/hJAExaEyPK7bUfb5g4Thife2X/7g2vcXS+Sk+IKttWFEgp0dztMCZJd1usLIl7XUwan/CQzCY9T6e88JtwaHzMc23fvfQAvvnQeuw+2oVN1W2YPGU+qluSbf0Miu11udQEX71/bdE+P3OxeC8bkDhhzLitJ5uVWFCZrHJYF925AusOJ9+KVarp1m/nVJbmQnlunr+vpNeLCsfDspSyRkr5cQD/AOBSAP8gpfy4lLImrM4Rd7y04yh+/ddiP/ckY7QGaS5t737LaY7OVyUvGfJr8kgYG6rbijf6sLJ9Zeoax8d6URz6B5OdwCS1OHzU+lI2esbH3PJbmS8D0943hBfy3gh6l/40L278cjYdikj80MrybHXpAXDrgn34/uObw+iSElXdUiBXRmjfcffeOHEijJhEVYuzK6zdd4k3XK/dSinrAGwG0CCEGCeEiPn6b3r4xbM7sLW2vNyhJhgsiW5dCpSWxARlBislxrtyuNld0eqgsol+7YFia4QXYq5zlB1Ovyoz98Uvvu8twXXGBc09A/j9S7sxbLN4pGUUnDBOjJYZqmnrC71/SYclbUhUVNTmFnHsvm0j01ZXY9XB0sX93bYwZ5VSJUSpbUt2xvpSOm6psvurvD0EnHs4DCQ867ZfHCt4Qoi/FULMFUK0ARgBMKz7RxLAzvpOtPcFU6i8VIwfXzjTdytvVHrCSMosiSrWK9xYjD76VhninOJUEDM+IPk4fYZmuvtZp03y1a4batv68IeXdiOTlfj9i3vw9IZavGqTzEpzwR43TuAT/3AGgMIYab7DznH8rgjgg3//+pB7Q8oVTUHJxnzIP9iUW5BduLvYJTbp4TGllIsX3rGiaJtZRnynvVqZoCRBYeDGCvgIgCEAnwPQC+BDAF4G8JMQ+kVC4OsPrsM3H1oXdTdcMdFgSQxC3gwnXOgGQYXC4my8t25uE612pKXXYeyr7mWpc7BK3pMvWxMk/z17B57aUIvKo12jli67yYzmNjVOiNG43LuWHMSjq6sD71+5M9sms6OerhNchybe0OolhlWGISjGq1KY5nHrPRU3QnE39dumyYQlyqzuccWNkvhxAP8updwBQEopdwL4DwD/E0rPSKDM3a65RyXLdcEoPHsHR9DVr540fPX+NTjv+sUF21SyYNjE/78ccSNL/YjH383dHXibJFmsO6yIfbXhojuLV35LgVZMeTiTHXUrs5sfaPHRmawsOPaWBTlXMb7rznGaMXU4k0V1C116iTe05CJNMc90apXYORNzBdeOuFtx9UxfwwU/I27qCWSQczMFgE4hxJkAugG8NfBekcD579k7bY+RUkLKeKWinzC+uC9rTTJ+7T5aPPEQCi0x6e4bcUWlkNcyZosYiIN00UTc/a8exsBwbhajrXibrVJrclFKWZR12W3MU6pQ3E6nE1/KauKGJ0zKpVwT84R+Kw+0oM/EYyLp30BYVly/zarOr+9IlhGlFLixJG4C8JX8z4sBzAYwB0BF0J0i0fDL2Tvw9msXBN7uusOto5ZMtzQrVgCdTDCyWWkae5imCZ2bpBG+PTgU27bUOEuklPDFUuKB70zfZLrv1gX78H6DV0CQaEreal1yCu0dPOe3ahmoLXhkpCzKunzN8zv5Dpugui1+MzY6LaRN0kWT03JPMaROkXQFSH6scxjdT/YdSRZulMTvAliV//mXAFYA2A3gyqA7RaLhpR3qYsdba9t9Caqrpm/Cf8/eiZ4BZ7ElN87bi6V7mwAAzT3FQt9JX741bQP+4XcLldYt+p3Hj7nbj0bdBVIi5uWLqpt5BAC57ILdA/li0gGt6TR3D2Awn6nOaAkE7Cce/UO5czNZWVTT8UUT2UnUGJVst9y1+EDRtn97onQlC0h5kM1KTJ4yH4+sqjLdXyruXnJQuT3p85U4xoMeanKXuT3NuKmT2CmlbM//fEJKeZOU8jdSSnXRK1IWLN/XhMsf3mBZqNYpxzrt4wKGRrJ4fN0R/OjpnIH69EkTi45xInQ0C5aqLEMMZVYsiDJVfXVr8G6ptDZEz/GuE0Xb3D7r37+sjnd1yz/duhw/n7kdgDpRhNOFMCnVNR27HS6CpQ3V4qDTmphm9ePmKBaV0p6FkLhjz7Gu0djYOxWLDgDwSAmTUi3b16TcTiUxeJ7eUKuc78Swq5HjpgTGRCHEDUKII0KIASFEdf73k8LsIPGPn8myVnfmcHNxrRkjU5cfsgz8dTIveHV/oaBUpT/PZtWxhk6vmaa6XU5iUTXKTUA6dXUl4fHAq4d9t2Hm4aAim5X44VNbsKm6MImOpgAuyXsotCo9FBxeQ0pl3PZft3pzqS93Zm0uzmRqkcyxgPuWHVJuH+QCEPHJJVPXjtbkNfv0Dzq0OO091o3Khq6AelZIHJUsN4Sh4yb8liQKN+6mdwC4GMD/B+B85EpffBbAH52cLIT4ixDiuBCiWwhxUAjxw/z2yUIIKYTo1f27TnfeyUKIx/PnNQohfmVo93NCiP1CiH4hxAohxNtc/E1lTyYr8Z7rFnk+36kyBgD3LD04mk1MhZN8OA0dxZYHI3YxiUn34Y8K1X3bfdT5wMcyGMSIl1Vwo4Lnho7+ISzb14xvTdtYsN34ah9TWDidLh5lJfDevzm9aHuasib7RSWiZ26qc3x+3xCVRBI+ThW0r0xdM6pwBt+HUJotGTvqO0Np1+9tUcVFtygWD9OOGyXxXwBcKqVcIqU8IKVcAuAyAP/q8PzbAEyWUp4O4FIANwshPqzb/3op5an5fzfptl8P4J0A3gbgMwB+LYT4EgAIId6EXPKc6wC8EbkkOrNd/E1lz188uIn+fNZ2TJ4y33JlrH9oZDS+xzn2WoSVkqlhpwTqd6sUU+qQalS3ZYaLiRvvKzFipiRq9cv0SClR1dJbpOC5QX81vZww9kIVE+f0/X1y/RF8ZPIbirYnPVV9KVHdqWvnVpa8H4QA5nIqDp900t1Nw+B41wnfz2bxnmL33g0+FijLFTdKotkM35H9QEq5R0qpqeky/+8dDk79PoCbpJQdUsp9AB4F8G/5fd8EsEdK+byUcgA5hfJ8IcR7nPQpDbT1FU/G7NASS6w+VJz5T+Mff78YX7h3tat27SxNTi2AdslJfzZr29g1VTGJjq6SPhbtboy6C6TMMJvgfOm+NcrtxsLpZhmKzdCLkL26lWKjbFEmrnEoGMzqQXIu5xyzWENCSsHaQ+qkWVLKAot2HFw9S5k8Jyn8bOb2UMKG/CbUKkfcKInPA5gnhPiiEOK9eWvei/ntjhBCPCSE6AewH8BxAPpc47VCiAYhxBN5CyGEEG8A8DcA9IFVOwGcm//5XP0+KWUfgCrdfuKDTFZaKna1be5qyuibymYl7l16EK29Y+Z9NzFBRqpbxmImF1RS2fHCyRPdiANC7DGzrjWaFLc2ihujZ8Gqg86Tk1wydcz9yzjPUnoYOG5ZDSdzzgnLBY0QJzyyWp3NdPGepgKLttUXXdPah2km7aiob+/Hot3u8zzSQ6F0xKhEeGxwMyv8NYBlAB4EsBXA/ciVwbjGaQNSyqsBnAbgQuTcRAcBtAL4CHLupB/O75+RP+XU/H/1fo9d+WO0/UafSP3+UYQQPxZCVAghUl/XUTVAm1nxhjP5AtMBrNoMjmSx8kAzAKCitgN/Wn4I1zzvPLGKhqqvn717leJIk8Q1lLlK/lERZ8WFNeIHv9/aRoP7z5EW6wRaZnJKv31gOKPMrimlxPoq87IcdsTB6kAIsWcko15oPjFcWNDeyrvpykc34tYF+9HVb5/VeGttBy68YwV+8pdttsca4eKTmjDEbYeDZ5k2JljtFEJ81rBpZf6fwNgiyycBvOr0glLKDIC1QojvAPiplHIqcrGEANAkhPgZgONCiNMAaDOC0wEM6H7WUk715n/Xo9+vv+40ANMA4OS/eWeqvzpVxq5pilTPAsBNr+zN/+xfW/jyn3IuZiv/99OjE6q+wbG4RtVDUW3z66OfpuymbhhWDJxu4F0lRtwqTsajjae7/fS7+ofxulMmFrSz6Ui7MjuplLkshV7hXI6Q5PL0hlq8/+zXFWzLWnhF9wzmFMotNe22bd++0D7XghmUKyRKLJVEAI+ZbNdeW01ZfLvHa6tiErW2x0kpO4QQx5HLpro0v/18AHvyP+9BLmYx1xkhXptvU9tPFKj8rlWFrfWHHe20zzrqlN7BEUzIT9LMXCnOOu1k0/PdCE032VnTzrDL+C8j9yxVFwMm6cXt/OZHTxU6ehgXdOza21BVaHn87uOb8MJPP47GrjH31l//dScmTRxfdK6EVMYqOoWWRELih8oaqFooFqJ4UWrEYrLRM5BTEo+Y1H0dGM7g5AnjIIQYPRYAatv68LYzXuuk6wDobkqixdLdVEp5jsm/t+f/nSOltFUQhRBnCSG+LYQ4VQgxXgjxRQBXAFguhPhnIcS7hRDjhBBnAJgKYKWUUnMjfRrA/wkh3pBPSPMjAE/m980F8D4hxOVCiEkAfg9gl5Ryv6e7kRK8ZPx8dX/zaFFkv+4P+jpj2+s6cKAxZ9lcqPPXt9LtslI6tmsqj6PMVaJSEjk+ET/M3+UuBseYaMsoaroUWVH1rD5YuNi1/3gPrp1TiU/ftXJ021mnTcLrTyku7yulwyxsJjALISHxQ/VZqsY1KYu9rLQC91JK3L3kAKoU7u63LCi2EjZ2DeA91y3Cn1flPLROmjA21X6+wl09VbqbqmGps9JQqkwVEsBPATQA6ABwF4BfSilfRs4KuQg5F9HdyMUpXqE79w/IJaOpBbAKwJ1SykUAIKVsAXA5gFvy7f4zgG+X4O9JNMr07w40p968e4U+2YwXsrrJWFYCX7wvlyX1ZzO3OzyfbpFhsLG62G1m8xGmhCbRYfzWp7562NX5GSlHJ3oaEhIXvK24hIWEOuupU2hJJCR+fHvahqJtytAWKfGIIuwGAB5bewT3v3oY33tss6NrNnTkkvr9cdF+1LT24TU6z4UHVhx25dbOxSc1vCulwc7dNBDyytynTPbNAjDL4txBAP+e/6favwwAS164wGsylxX7W/CFc9/s20deSn9RgUFcnzhD7yZDSJioJ27u2nhhW+EqfSZbLGvMvKql9OeezhV/QuLHlpqOom2bjxQviJp9vXuPdY9mWR6xClLUoY95rmrpxYTxhXLl8ofXO2oHoLupGbwtpYE571OI00LSxgnTtXMrcfE9qxwLSjP8zqXcrNirjqVscY7fOEVCnLJEUdw4iAWdTkPGOmnirp6V/mIS0z6Z67RxBSYkzph9vvqMp04T+J00fmxqnZXFcy431sGUixUSMVQSU4iykLRCderoKx70O/uHAxBaEgNDGcsjmrrNXVq5Yl86VKnCCQmD3sHi9ONhfOpmEzQJKEtjOCXtYukDNy61P4iQmGLu3zQmE/5/9u47TK6y7B/4957tve8mm81ms8luyibZ9E3vCamUhIRAKCHEEIo0aUpCkRZpgl2UpqIvivhTRFGxoLzWCK8FRTESQARF6R2S5/fHzJk9M3POzDlnTpuZ7+e6cmV35pwzz0555qn3/dwrb1kaOC1J6CRaC5xjhstNjX3rd/8MuggFgZ3EAtNYVWoYuMZoP9rnH3rC8eM88Kd/4Yd/Tp0ZAKKNqY/96PGM1zDLP5Qu4ljqYxlU0KxzLSv02RHyj9XBqzlX/zDh9888uA/ff/Q5y49j+p5WKqu8oBy8IspdZtVCcp3w1b1Pm17j10+8gEM++lO8895gR9JoNYSdqoLfwcZefpM5Df3ATmKBqa8ocTUthNkG7O1f2IuTksLZa5Qy7pQme9Fk+dKNDzyOf79qLXgO69fsvJFhxpfILUZLuYxWtv9Tl84CAPZ89zHs+OJvs378g4qBa4gK1Q///G/D25NrhG8+Yj6Ddem3HsVf/vVqQhTUAwdTl5va2jLDwScKEDuJhUaAR595OfNxaejrtx//xbhi1fzt36+m3KaUwsRhdQZHJ7o6TQLay7/9p4znAybhry2dSUR+MsrVmqkx9T+/fsr24/z9eeO8ZirLPYlsyxHlrudeecvw9uRB9V/vNx/g1uqPd3RLUg8ohRV9bQnH2RlP4uATBYmdxDz39rupM0F2w8ink2m9/JP/fSPlNqsj9maNOTuMl5uy0iXKBc++bNxw01x4zx88qc2IAAAgAElEQVRceywF46BeVnHEnyj/2KkR/hAbgD//7t/Hbztw8GDCHkW77GyvIXIbO4l5zizvTzb0+4Tefi+1E/pv3YicYdJaWNv749WGbVa5RPnnlbey26OiFFBZWpT5QBPcO0SUf4zaKl+xsYIh2wDhHHyiILGTWGDcmJ3T++SP96XcNvOqwcAShtWbxTrv7/95Pes9haxgifLPC6+/g56LvpNw29MvpK5asEMBCUmv07nqO4+l3Maqhij/GO2V/uyDqe0eMwcCThlGlA12EslTZpG9kqtdsyWgH7k/tTFm6/Et30hEueI3+1/Au0npWbIdUHr0ny9nVTVwQIoo/xjNJNpZNZDtTCJTPVCQ2Ekk2+w0xowOVVBoqSlzrTzpZJujiIjCx6gOeifL1tg9Dz+T1fkMMEFUGOxMDnIZOuUydhLJU0YpMpQChjdUJtz2lV+b5x7Kxo0PpOZjZJ1NlH/qK0qyvkY2dYM+NxoR5QejmUS7KSy++htv2jdEXmMnkWxLrh7TRQu96YcGnTQAn3/oiYTbrrjPWkoLIiKjNQrFkWC/zn74WPp0QESUe4z2JNqJOPreQYW9T77oZpGIfMNOImVt5Ae/k/kgHaNROD+XanEmkSi37TMIwJVF9oo4LkUnIr1/v5qahsdOGi3uVaZcxk4i2fbSG+9kdf57Bww6iVypRUQWXfu9v6Tc9vSL2UU3JSJK9tIbqal17PT7XsyyvUQUJHYSKa2e1uqU2954JzU3oh1/+/drKbf5OpPI2QKivPPcy6kj/nb95okXXCgJEeULo/bCC68bd/xmdTem3Papn1hPl0EUNuwkUlpdzVUptxkluX/TRsfxXYMohH5GAHvrXU5bEuUbN1Z1PW4wgEVEhctO02RIbbl3BSEKADuJlNYb77yXcpvRrN8HvvZ/lq/55V89lXKbn/sEH/zr8/49GBH54s13s1vhAABFERc2NhJ5aMnY1qCLUFD+89rblo/lGiXKN+wkkm1GHbqHn3zJ+vmsSonIZVd823qE5P+aLBdjJ5HCbmBk6pJG8s5V33ks6CIQBYadRErLKPyz0UziS29a35y9bFxbVmUiIkr2to08hf96xXj/IjuJFHZuRPElbxgNoG+bO9L/ghC5hJ1Ess1o74+dfX6cRySiMCpiC5yIHDKKsMxxJ8pl7CRSWg/97T8ptxkFrrGDeQqJKIw4k0hhZ7S6h8Lhkaesb7shygXsJJJtdhLJEhGFzVMvGOdUFM4kUh6rKCkKughElEPYSSTbsg81z04mEQXnHy++aXj7K2+mJs4mCpNsxjG+fcY89wpCRHmPnUSy7Rd/T12CSkSU6+77w7NBF4HIM6NaqoMuQsFxIzUPUVDYSSTbvvTL1DyHRERERDToToO80ES5gp1E8t1jz70adBGIQq2qlHuH0uHzQ4WK+2aJyC/sJJLvGAGMKD02BNOrKisOughEgWDNQER+YSeRiChk2BBM79+vvh10EYgCwfEjIvILO4lERGHDhiARGWDVQER+YSeRiIiIKAdwKToR+YWdRCKikGEzkIiMJPcRT5g9IpiCEFHeYyeRiIiIKAckDyCdtawXE4fVBVIWIspv7CQSEYVMJMK5RCIywOWmROQTdhKJiEKGzUAiMpJcN7DPSEReYSeRiIiIKAewU0hEfmEnkYgoZAZGNgVdBCLy2PDGCtvnRJJ6icJ1B0TkEXYSiYhC5sbNk4MuAhF5bOuckbbPYZeQiPzCTiIRUciUlxQFXQQKme+eOR+XrhuPzsbKoItCAUpZbspeIxF5pDjoAhAREVF644bWYtzQWvzz5bdw80//HnRxyAVO+ndcXkpEfuFMIhERUY5gF6GwdTVXJfxuNZDNl04a8KA0RJTP2EkkIiIi8sENm/rjPzuJVDqls97R484c2ejoPCIqXOwkEhEREflAqcGf7fYRW2rKUm6zeg2zDun1G/uN7yCigsdOIhEREZHPxOZU4uiW6pROod1rpJYhq9OJKI8xcA0RERGRD3QTibY6aLedOANTOxtSbrc8kxj7f+7oJvzv3/5r/YGJqGBxJpGIiIjIB0q33tTOJN7iMa2oqyhJmTm0OxN4x4kz7Z0Q8/4lox2dR0S5y7dOooh8SUSeFZFXROSvIrJdd99SEXlMRN4QkR+LyAjdfWUicmvsvOdE5Jyk65qeS0QUhMpS5jkkj3B5YE5TmQ+xxW5KDKedzLmjm209DhHlPj9nEq8G0KWUqgVwKIArRGSaiDQDuAfAbgCNAPYCuEt33qUAegCMALAYwPkishIALJxLROS7hsrSoItARCFUpO+VOdgQmLon0eJ5sQNTzrfYyZza2YCmKtZrRIXEt06iUupRpdTb2q+xf6MArAfwqFLqa0qptxDtFPaLyNjYsScAuFwp9aJS6s8APgdga+y+TOcSERERhUJnU2X853yfFL7s0L6gi0BEWfB1T6KIfEpE3gDwGIBnAXwHQB+A32nHKKVeB7APQJ+INAAYqr8/9rNW85ie61aZL1473q1LERERpRg3tDboIpBPZnQ1Yl1/u+Pzk2cOLc8kmhxfUmStGcgoqESFx9dOolLqVAA1AOYjukz0bQDVAF5OOvTl2HHVut+T70OGcxOIyA4R2Ssie7P5G4iIiNy0ZGxL0EUgH0zprAcAVJdFA8u70fGyuydRb/LwelSWcf80ERnzPbqpUuqAUuohAB0ATgHwGoDkYdRaAK/G7kPS/dp9yHBu8uPerJSarpSant1fQEREROQ/EcH0EQ263+2fr9E6rZbOs/cwOHtZr80ziChsgkyBUYzonsRHAfRrN4pIlXa7UupFRJel9uvO64+dg3TnelpyIqI0uDSL3HTXjlnxn7OZOaKwyC7G6cLewZlny3kSDQ708r3UVluWkO6DiHKPL51EEWkVkc0iUi0iRSJyCICjAfwQwDcATBCRDSJSDuBiAL9XSj0WO/0LAHaJSEMsIM37ANweuy/TuUREOenrp8y2lJvsisMn+FAaCtJAd1PQRSAXJPeZBIK+9uD2o3Iwi4jS8WsmUSG6tPQfAF4EcB2As5RS31JKPQ9gA4ArY/cNANisO/cSRIPRPAngQQDXKqXuBwAL5xIR5aRpIxrxgRVjUFqcvppmQ48oNxRFoh9WfWfxsMnOg9gAqXkP7Rxnp+qw+jhElD+K/XiQWGduYZr7HwBgmLYiljZjW+yfrXPdwMUSRBSkoXXlePK/bwRdDAoJttVz19C6cgCDnUR3Atc4F4l492Yq8vDaROSPIPck5gRWc0Rkl58Nee5RI8oNV6+fmPC7G5/cbOoaATBvdLPp/WVJqxjsDJozrQtR7mMnkQpeR0NF0EUgIqI8V1Ne4vo1RQTK4ZqnUxePRklRxLSjePKC7sHHsXHd2vJiTBhW56hMRBQe7CRmwOWm+a++0v0vbips2czuPbx7ua3jnTYQKTw4G1xY3P7MOg0iWlfhzXdfQ1WpJ9clIn+xk5gBv7qJyK5sloA1soFFlNeOn92F4ohg0ZjWrK5z+uLM0Y+tMOu06m8VAVNaEBUYXwLX5DJWiUQUZmy3EeWWCcPq8LerVjs+P/kj71UdwLqFqLBxJpGIyGV2JxLXThrq+LHYjissXN2SX9xYapxtHWDUGTxyWofrj0O5I1PqJSoMfBdkwC9kIvKaFhrfidndjS6WhIjCYl2/tRyKXiwDXT6+LWEZqoj4MrNYUVLk/YMQEQDg+o39ae9nJzED5qQiO+7eOTvoIlAI+JV4ev+eNRjdWoMvnTTgy+MRUf4x6vwplXq71c5oNp3JjdNTZzCJyBsbDFYM6BV8J7GlpizoIlAemd7FWR2yvwIh2xH6eT3muc6IKPfcvXO2aT3i9hCU1WiryfXUJhsdutLiCC5YOdZOsYgojZV9Qzx/jILvJH7ztLlp7+dEIhEFiXUQUeFJF+XY7cA1RueLGDxO0u/XHGm8VM1oP9ufLjsEpywalbEsrO+IrJnf6/3gcMF3Etvr0ydST142tnVOl4elIaK84GJLh8EiiArP8MZKy8d6kSs1m+WmNx83LeU2v5bgE+WiGzal3xsYlILvJGair9duOWE6Lj20L7jCEBFRQWNbO78YvZ5rJg5FSVHEctcv65lE09uVpeOSdbdUOy4LO5NE4cFOog2su8gLs7ubgi4CuWyEjVmATKxWO1WljApIVIi8WG0gknrhbDqjbD755wdnLwi6COQDN9LnZMJOIlHAvnjSzKCLQC67cfMU1661a814S8fd+/55rj0mEQXH7vJRJykwDp+sS69hFt009rO2PzKbZa1WB9kPHEx9jIW9LY4ftxD1tNUEXQSyqbgonN2xcJaKqICEtXIg5+oqSly71rLxbZaOy2aJF+UOP0aPKTOrn/Fl41o9K4PW8Tpy2nBb5/31ilW4YdPkjMdtnjEcdRUl8QGobKIpWl1G2j+8PuW2bPLIEoVde105Rof0+5utU6IQuHvnbOxcmDnyGxERBa+h0upAkHedem0CcefCblvnlRZHEIkMlstohrC2vBjdLdX43SUrMCwW4M8smmkms7qtp4ZaO2moo8eg9Ni+CK+ff3ApKhxsF/EiYFUydhKJQmB6VyOOmdkZdDEoh3xt5+ygi0AuiXByMKfVlhf7+nha51B732Qb7KW7OXEW44rDJ2D2qNS98kapLawYY2P5I2M/EFnjx6oSf2s2IiIyNTAy84j70TM70dFQgRld1kfnKdwY0TH36F8zv9PUHNR6iS69by47rA937X06/vuxs0a4cl0KDz9mnci5sH4DsJNoA/eCEJEXtK/vZeMy7z+8ev1EbwtDvouwk5i3vHhptfrCrUuXl3gbGdlO98SonZVtig9i+zUfcbkpEcWVOVzqQ0ThtrZ/KB66YDGKuO604Ew2CNSSUazXFMTgQnssiMz8nuaMxxp1Zu8/a777hSJH1vW3Zz6IfBHWcUK2OpOcsbQn4ff6ytKASkKFRj8q1N9Rl3DfRzZMRHsseAAR5Y+mqlKMaqlGR0MlKi0ELwhrY6LQTBhWl/mgmKKI4LDJxg3y6V2NpjlOzVJbHLS52nSYi98dPz5vER7ZvRy3bp2R8djBVbGDBR07pDbtOXx/++fjR7uXqonCaccCe0GtkrGTmCS5fpoyvB41Pm9KJzpyWkfC74dPGRZQSfLfKYuCjfp24tyu+M9eN5CWW0ynQdTTGs6Q7GFxzYZJlo/dd9Vq3JQmd2pNuXGkVLPFZNqAotXq4mSb0U/TKSsuQkNVKUospG6yuhjOyqwkZc9p4CHynpPlwFaWYW9MakvaxXdMkvVTBxvjwxsrMLyxEtNGNARYIipISb0F7ifwzsimqkAff9UE/0K+V5dxwCvUQrT3aqKNmbJ8YyUap9WQ9V7U3Hbj1gT17aHNhGYqZ5euDjY79NcfWmorSiqlum6jsxQmXrKeSoaSZVpuXlYcQU+Wnxl2EpOM0FVW/R3RvQLcNJ3fDh4MugSpkrcmcQmOd4w2f+tn97zm52trtnyNvPW546e7di1WBd5bOcFm0nivPlYm143v9UtTebTVlg3+4mElk7zqxYgbg5ytteUod5BLjsKNkZ2d8+OpYyeRCt5BFxrOt26djod3LwcAlJc4+1jpi1ESiSTMagvYwHfD/j1rLB33odXjPC7JIMYqyX9uLvMttrDMj7LjZuMrm2uZRS+0MpN47ooxg2VwXoSMtgyY5/d1kqmDnQZ33HfGvKCLQB7L9Elxo8XIb5s0vKyszlrWk/kg8kVrbXnW11gytg2NVdEgRz8+d1HW1wMSlzwxRL6/9Ptt3OjEvX/JaNP7Ohv9W+7KYYbw0X+0qywsBz5hTpd3hdHheyV4ZuOC6/qjS9RXpBl8KNOltQj664PfXv7ra09dLs6B5vzCmcSApTz/Lr4gDYyaGho3HTXZ1esNrXMnktwRU4ahu7kKPzt/MSKcbsppZq/e1M56tNSUcUl7ATp3RW/Kbf+zY1bG8+oqgtnD01xdlvkgcpVZvdDXXof9e9ZgdKv5fqNh9eXxtElB7WmPB9ixM5NodBu//rLG5zD/+PG5ZicxDS/b5cfOGuHdxcmWhqpwdNiT2wOtteX40bmLMLyxMpDyUHasRE31e2kVO6PhYfRadDUHG0SJnPFuS2I2VxYcPjm6ZSGoDoJRCgzD45L+zn4nuSMpJxm9M46eOdz3cuQki5/r5JRqdrCTmIZZxXbByrFZXhdMmkyU5y5YOZbLyslTayb6Fxm3voCiENodoU93dDaj/dkM6ojYT5XhNqvFP6g7UAS43UIORnLHvacHu3fR6D0yqYODBEbWJ6VCy/i5jj25x6TZN5wJO4lpaC9A8ps46LxqVAA4hpBzPnpUanhxqyPpfuFEYn4Z354+Mbmb7tg207fHykUzRzYa3p5d4BrnosHOsi9DNhpj22paMixVTu4Mm63u4di6+yZmMcvkhuSXdOnYVsfB//LdDUdNdjVSthUF/UpkSiwaloYd5ba5o5tM77twVXaz0mTNyQu68f2zFzg6N11DrbGqFFM76/GB5b04YkpqKHgtcm6QgYdmdDHPaxgNvq9y43tmWL07e63z1e0nuj/7ld1MogymygjoPXbktA589Kh+bJs3MuW+Kl06iym65aXp2l1Xr5/obgHJE3ZWOCS/3txek15Hg7/1cEF3En9+4RLD26/ZMAkAN/qSO8YPNR/tXzbOvdD4ZO7khaPQa5JUNpuG2NTOetxz6ly8f6nxstKWmugIemut8Uj64GqF9IXoy2LG6IsnDcR/ZnS78NvqU/TSdO6yEECHdAQoNUlNkk074pgB53uzhtVXxNMoDXQbz3J6LRIRHDGlI2V7zQPnLMCD5y+O/75xeuZciwAwdoh/M+f5yK/q384KB7az09u1JjEd17ihtaiMDbBY3eubzSBRQXcSq03CjZut4w/be3kPR9VygpMZaaMzDrJ978iQ2vJ4ehK3XBTPo5j+tT12YAQ+ccwUHDU9u43438pi30h5CRNQ55JLD+3Dnz58SKBlYDRl+/T1fLrUFHYsGduG+T3Nts9b0NuClpoyzBnVjP171mBEU7gCIo1urUmIlstVW94TZBsIyRt85dMz+mxoqzr8qKYLupNoRhtt0ZaIaaPvQVdkycsWWa/mPv1rmGmWJ4wVfC7w4nNiNbR7JCJYO6k960a31UBXx87qxOqJQ9BeZ5z70+130LD6Cpy8oNvlqxaGdB/3ytJiTLYQ4dGrmeFM7zY/A+bkIv2g1JqJ7Vld644TZ2LfVattnWM2q+mFCcOc72m7+bhpOHtZaioYAPjVh5bijDT5ZSk/MAd0lJ32ndGRRjER3FDQnUSz9+bc0dGRu00zoksg4pu/s3is0a3V8Z+dfq/ftjUxcEBQ+wzIPdpyRCu4UjAYbj3vpy32PuDVFYdPxKe2TMPPP7jU88f6+NFT8LWds/HB1eMyH5yjVk0YEthje/Vx15YgppOp3fZRl3PLho2TATmzp2zNpOw61JGI2I6G7me7u6QogpV9zj4nK/qG4EyTCNBtteUYyn2wee8cg3yxhcisnWH0UR6cuBq87cBB69e0o6A7iWaGN1Zi/541mDYicR1/kAMeNeXFqYF22Ef0nZNGo9nLtH7qMNSWG4eVN5q1ZifRGS8+JlM7o8FgTrSxf+y8Q8ZikkkkOd+ioLr4HlrX3472PG/E9ZjsY3WD1dlot6OK9qRJwK4RkbSzlJmCvgHh2Fvpl5StKTY/xgddrNx7WqtxznI2vCk4dt7/m7LcilGIjGqLBo9SFBV0J9HqTJwbmz+9EK7SFIbrN3kzpQ8kfvCNIqL6Ge4+nzjteH1kw0R88piphvc1V5dh/541mDPa3n6hTG1BfqbDJ+jgUrXlqXvnp3ZGl6J6NXCULthWIbD7XZ/6MmR3/shm53sIf3DOQozL4vVzknibWyFyg9X64mNHT/HlcWiQ2VNm1HzR9iTq80lGRPCjDyzE2CHuDmwWdCdRkykAzMHYNK7dtuaXtw8kjKZuySKhpZGg90gWmqrSIlSWGgc7SsvmyzSyuQpD61JnaG48ajK+tnO2/ccnR46a0Wm6VMzpR8+sMWW0fMQLbMzZIwCWjWv15NoZG1Jp9sJ/afsAfqaLDummJWNbCz7YkZPPYVb5EHXvhY3TOkz36fnhazvnBPbYyTJ9Rm47cQYuXjvel6X8heTQ/uz20R7MIsqeUqogO5l29pd//Ogp+MQxUzCqpRoLe1vit3e3VOP+swZTfcWvmEXdVNCdRK1SP3xK5j0agP3nec7oZhwT6xgKEN+7w74dAfZHq6vKijGjK5hQ5vksyO8jbcR/MJ+Zt5aO9WZW7KbNmfeoHT2Ty4rcUllaHHg+sWNcHvTMZdkuN7143fj4z9du7Eexj4FnkllZSuyFm4+bltI5eS82Ql9i8nwsHtOKbfNGFmSnwi4/2518OdKbOTK1HWfnOauvLMXaSdY78vqYKHYVdifR4nF2Rt9/8cHE3IuDe42yawAancu+pr+cztxa7QxWxEbvRzQxmayRGoNldwBwzZGT0p6X7Zej/vrDG6MzvE6Xnic3ZnatHZdwu1erA+7YNhN71k/EhmnW8pGlM21Eg6Pzupudf1GRsSAbY1cdkb8pmATAeoPB43vTpKLJ5rOb7cxNPljRNyRlmeM770U7ifqO64PnLUo5t8oknRkl8qszfYD5utK640R395lnMrWzId6+tKugO4lW2WnAJS8T1Dak6xuVTr5KjB6bM5K5QQT47HHTsC5DQ6C9vgKfP3561vsB8tWK8cZBg7L9GGT64tRvrHf7S7asOFpxWw1i4tTC3hZsnunOzM+XThrAry/yPnpqGIh41xHza/aYnJnfm7rfeGLSfr0dTP8CwLvOx8Zpw7GgtyUhzY5Rzsft80d6UwDK6PPHT0+5bblLeUKPsLjKL9dUlKZ22Mw+Q2bBDdOpMRg0cbrPuaA7iVZH/uJf5g6+zRNmEtkayGlmL983T5ub8dxD+obg40mdP6MZ6mXj2xxVCpqTF+Zno+WE2SMsrdm//PAJKbdl+tw5Cndvcs0LVo7FNRvMZzbN/gQ30uzY1ddei08eMxUzbS5hrigtQmuNcR7GdFYGmE4ilDLmRc3OrG4uTXfK6nf1qYsS98LN7o4GHDOahcxnc0YNBlq70cX0KHWVJfjCtplorU1f35QVF6HYj8ziOaw44n5z//6z5mNZUofw8MntmDCsDkMyvGZWeJUHNkweOGdh7CfjvzXTdjijuurhi5dj4rA6S9tAMuEcPSx8IaR5n1aVFuH1dw6kOTW7N/molirse/71rK5B3uq3kPTaL0V5OhKxbHwbvvHwM4b36Qd7jP76yhL3qrlM31mnLHIWQGFwg7l/r9+9p89DJCJYM2koui68L+X+lpoyPP/q2wm3mUV7zaSvvbbgl4Rl+q4w4/QdEbZo3LnE7tJR7fiv7Jjl+DG/edpcvPb2e47Pz9bdO2fj7w7bGifM6cKl9/4JgPUYD+SNK49IHSgFgJ0LR+E7f3jW+oUsNF3HDkmNomsn9zMN7hc0aluUFkUy5kg1Oq+kKIJ732++NF5z3cbM0foLeybR4nHa1HBJkdGST2svoIg4+tI+OmmJmH4Dap72B8LLaURL0ySp7r+A+TzuZhoiOsN5t2xNXQ6TcF0fnzSzhwpiJjGS4cvnp+elRs90mhicdRXw0AVLMh9kwO5z96ktU7FrzThLA5S71owzvc/Kx4Kzle7pH16PuTZT6rhpelcjNs1wFlyKkdbDr6K0KOEzfdysEfGf6w1y7IUhEraImMYioChtS1umzqTRR7S+IvOqtYLuJGq0xrrZc3zdxn6cs7w3nkA78Vyrj6H7OfZqWQnbXBbbsD0v9uVxgi6lhrafibylreXO9CG0Il/X2PvBLOG0vvLraEhNHdLRkD4QkJOvQvfbRP6kwLDDaN+EU7m6asjNgZyGqtKE3y1mwLB9zOqJQ7F9frfhfTO6nAUdMpM8iJlP3HjPHsVE4b4x+37IJ06Dhmn0HS59ELPvnDE/5VinT6cbL8OYWK6/uaOb8zZGw/qpwwyjnNo1ObaSbWhd9st7jfjSSRSRMhG5RUSeFJFXReT/RGRV7L4uEVEi8pru3+6kc28VkVdE5DkROSfp2ktF5DEReUNEfiwiI5If37xcKeU0PK6lpgxnLO1JuL9O64Fn2u8U+8BEIqmPZ2XvWXlJEX587qKUJO4MP+6OxqSGW7K22rJ4bsKICy34j7q4X6OQKAWcsbTH8D7tc3TSvJHO8lja+FbLdo+E2fmDM4nudUru2jELnznW2vLQ3rbEyKOruH8wzuu2p1cDA0bFttKpC9E4Reile2/s37MGH8kQeZncUwgBNVf2ZVcvrzAJKGP01Dl9OjPVZ5m+WxSAvvY6PLJ7OY50IRp3WN2waTK+evJg3utRLc6if5+1rBc/OHsBetpq3CpaAr9mEosBPA1gIYA6ALsAfFVEunTH1CulqmP/LtfdfimAHgAjACwGcL6IrAQAEWkGcA+A3QAaAewFcJfdwmnT6nYmih7ZvRwLe1vw6S3TLF3bKLqp1Q/hyOaqgk9u7BWjcNp6I5urUFdRgpqyYly8dnzaY3PB4Cbp3GNWiS4d14rrNvbjvEPGOLqus5lEd5vSWs4jN0YWNQPdTVg5wdry0C0D0bG19VOG4Y+XHZISZInc58bKhOQlYfr9QAMuvpfsujXDEu9cUAATU67aPm+kK+9pp4y2A+Ubo68dLdeutfMF/UkRes2cvni05esmP4ZVPzs/dUuDJnnlRb6LRATLxrXaPq8oIpY6iEYvi5UqzpdOolLqdaXUpUqp/Uqpg0qpbwN4AkD6HlbUCQAuV0q9qJT6M4DPAdgau289gEeVUl9TSr2FaIeyX0TGWimX9mbWvgzsLN+MRAR3bJuJeT3p9xDoo5ua3UfBSVehbRnoxGeOnYaSogj+cNkh8Q356fbxhF02SVXDqKasGCKCI6d1+DKQ4hN5q48AACAASURBVNVHdl5PM/bvWRP461NdXozqsuJAk3kXirWx/Z0Le1sM7zcaYMzk/jMHl42dtaw34/HpUivlf5PbXJiWfeeKXWvH429Xrgrs8f/faXNxxhJnHZtc1p2U2sCt1ShnL+/F/j1rXLmWnr7da7REMqX0bCe7wml/I5CWgIi0AegF8Kju5idF5B8icltshhAi0gBgKIDf6Y77HYC+2M99+vuUUq8D2Ke7X/+YO0Rkr4jsTb6vvKQIZy/rxddPmePo79FPGQPApI46fGh1tJ86mCdRX5bo/5uTNomfv3KMq+GjKTtXHjER9ZW5NZpVaAMPRyV9hqwsB71odWIn38lz5vRrONvXZ55HgS2yXUZbCPuB3DR2SA1Gt9bgoQsW44rDjZPSX7ByLNpqyzCq1Xp+q6bqwZlE57M6scFTh2eHVXeLszxhVoShU/nDDyx03IZxi18BbPasn4gvbEtMSN7XXoczLQyMkH2HT06f41kvc7KAwZpFe7/cduIM3f2Fy8uv0ZzpJIpICYA7AdyhlHoMwH8AzEB0Oek0ADWx+wFAG1Z/WXeJl2PHaPfr70u+P04pdbNSarpSynAdzJnLeuKbZe3Slog1xCJEfev0edixIBqUpq+9DivGt+EjR05K+SJpqCqNnwMApy4anRI+Ol2lG4LvpZznx3NoFiXMre/Tn5y7yPCx9qxPbHyeNC//Ew5bqQe3JT0PdjpI2VbiNxyVOeS0mb9esQp3JDWM3KLt53G67/bgwcGfL1hpaSFHTih2eQnb8bMTt8x3NFSitNj4a3h+Twt+9aFlaffZZvt+9LL+C0PHSa/NRm5Pq7MxYWrQjmqpzjqwSa7YPLMTC0xm4POZG50Iu5f4yxUrcf2mwcmL5DoshWiPk/mRtHGsuaOadbclBwuxVMyc8f2zF5jeF6b6RONrJ1FEIgC+COAdAKcDgFLqNaXUXqXUe0qpf8VuXyEiNQBei52qX3RdC+DV2M+vJd2XfL9v7toxC/eflfrilxZHcPPx0xPyyei/gML4pigkXjVk9MmFk22Y6u5m7C79chPdGyr5b9udB3sqg9JWW5YwoOP0fdPXbm0/iJHS4sw5k6xYMzF1n6I2E+i0k7hwzGCDrbEqc0CuXLFtrrsDK8kz336z8vKmO+Z7Zy3A9wy+51KuEcKWnZ3E0iLm383fOn1ufGBOy0s71uEAM7krfO867xmlr3BTWXFRwvfOhw8zzsNolUpoo0js/3QnZPVwoTOsPjUCuybdgHXyykO7DIMTWRh18K2TKNF3wy0A2gBsUEq9a3KoVuqIUupFAM8C0A+/92Nwmeqj+vtEpArAKCQuY/XFQHcT2mrTj1QavR4HY0P4i8dkNypWCJu2c8kn0iQdH/Awt1ie1aeeSP6kWHnOfnHhUvx21/JQ5I7K1ieOmYJ9V61OuG3x2OiG+cOnJC4rshoMqLm6DLecMB29bdU5t0TbTETcTQMSRnbHBMYMqXG84iZorUnfz/2x0PFmmqqN38eTOurjA3N1lSX44kkz8dnjcj9QTz4ZbyOYS667yIUYCVY6C2ct67G07FQbIDK7ZKZHciOKfK46NPn5jT0V+65ajavXG29LsMrplhI/ZxI/DWAcgHVKqTe1G0VkQETGiEhERJoAfAzAT5RS2jLSLwDYJSINsYA07wNwe+y+bwCYICIbRKQcwMUAfh9bxhpeus/AjZsno7+jDp8/YUamQ9PiLJEz2Y54/+aiZY7P9WL9ub4iCONovteSN/G7JRIRRCKCoXXRUcDiSO4GdhGRlBnJUS3V2L9nDSZ1JDac+zvSN6T1lo5rw/fPXohig9lOblmMUlku6025nitXSTTSo89Q2Bi9TzWlRREssriccX5Py2BKLApUJCK4a8cs3Ll9wPQYp1E7w6DNINCL3bRPg6tGBm+zUj+ftawXN262HvXa6JKXH9aX8bHyvY+Yru4/YorxKrOiiGS933dGl7PJCb/yJI4AcDKAyQCe0+VD3AKgG8D9iC4R/SOAtwEcrTv9EkSD0TwJ4EEA1yql7gcApdTzADYAuBLAiwAGAGz2429yy5Kxbfjm6fNMl5Elvy+0TkCRCOZmiKxK3lBplnTGb0/42b9az6/AAWHVWluORRlm5bN5ij5/wnTctHlyQqoBsua9AwczHxRCbs4eV5VFG3R2wtZ7yeijcO6K1NnjNZOMU6ks6rUfsj0XbJnVCRFBT55Fgy4EA91NaKgqNVwFccXhE3Cuw1RJYbDO5HNoR6aBqh/rYhw4oV3WqDM4vr0OUzpTBx71JQkwi4ovgmqiOZ1I8isFxpNKKVFKletyIVYrpe5USn1FKTVSKVWllBqqlDpeKfWc7ty3lVLblFK1Sqk2pdQNSdd+QCk1VilVoZRapJTa78fflI16G6OOyW8obXlqRKJJxPkllh0nH9jyEnsfm+RGppb8PduORmdjZcqI6Wn6UdI8qmztNNPtzlrZOb65ugyHTR6W+cACdsAkq3U2y1DzZaZmZHMVvvy+AVx5RHb7ejTZblMweqWMAuncsMk44FJdZUne7cerKSuOp8PiBHjuOs1gxvDYWRmCroSAWfChjdM6ICJp97RZoVXPRm2fYfUVjlYS7Fk/EX3t0YGvdBE3RIBTFo5Ke618D1xji4sVkFG9Hpo8iRRVXlKEyw+fgLt3Wg9TnTwLNSm2j2KuC6HwV00YkvU1CtHmmZ3xn53UX4f0teHaIyfh7OU9WZVjVEtVyvsgXxrTfhrWkN2Xbj474GCd6OKxrTh2VmfK7aXFEWx3GGG3KoC9gW7Nyn/lfbMSfp8zqtm1nJ5TOhts5TIrxCXo6WgRoLuaKgdvTFiGN/j+T7c8lcgtZkHvpnS6E7l2WH10yWpN2WBbQUtcv3Nht6VrXLpuPKbqZgQ3z+yMtye1anOhwSoDQXRJcMrturo2pd7N4ZEaoxWCubbn0t5iZsracTZHsuqSIldN7WzAHy87BNVl2b90c0Y14bt/fC7zgZSgpCiChsoSvPjGu6YNyXT1gIhg4/TsoxzqE553NlbiqRfeyPqahSD5Nettq0F7XTn++fJb2DqnC4fZyAmV7+aOasLWOV3YsaAbjVXWZgJLiiK44vCJ+NIvn/K4dLmhtdb7pcm71ozD628fsHRsQp4yi9fP187ljFj6qoRGqsmx2S7DI8pGpqjDh9z4UwCZVzpdv3Eyfr7vP+jUDYxUlxXbGmzaOncktmaI/Hz1+on4+sP/SLjNysDbIX1tlssRdqNbqvGXfyUmW8ixPiI7iWF00ryRGDOkBuUlRYab593oIJK3/AjUoV+y9s3T5uLfr76dVIYcHoLzWWdTJf758ltYMb7NtRHbfFBcFMGlh/a5dr21/e34/ENPuHY9ito+39oMwJC6cjzzUjxuHIY3VqY5Ojthr34Eg2U0a7fp/wQvnysK1pi2mpTGfC4ZM6QGj12+Erf9734c2p9+kLOusgSrDNIgZWvwsxT9NJnlfzWi//zlw/fv2ct68dEH/mrYIcyxPiKXm4bR7rXjsWn6cBza355x5CXk38Oh53RUJ9Pz7sfr0qpLDt1QVZqzoendZve5F9NfyC3aazJ5eD0uXDXW9vlBBmQa3pBd5yBMy4tmdQ8uZYtINCKtGSsBunJfai8xIe0Jv2ALwsbp7uYuzobTj1p5SRFOWTQqYYWRn7SgXDXl5pMYblQjWwZStzKEyTdOnYPl483rVVvfBx7Xu1YG8thJpILmdBnVsQPRZcOVJnulDoZgGD0ERXBNkY2K1ckMavIoKGVvl0n+rp0GgQs2TE3fSAsy48gCi6kQzITlHaUFOdM+H9rrYCVQRZg6um4ymknU7yFtZhRj8tjpi0dbXsofZsfNHoFda8bhxAzLUPPdlM6GhCX9v7tkBf5w6Yr477lWlbKTmONy7P2WNz6wohf7rlptGoAinzpoYaAtXZlqED7bDd0tseTYDPzjGv0SyEz1lFmwBs2WAf+jEuoHG4Y3Og9uFLYOVrxjFCvWHSfOzHiOk78g7MvdRQYnCvUz1d0tgxHDP71lqs+lIj+EqZ4/95Ax+MTRmfMPhqsWSVVSFMH2+d1pl5mapgxL88fpO1ybpnfkxOT+YB0rqKsoQU354Pst19KUsZOY47Tolk4qvdoQVZRBMfu8plsuED0vNSG5np31+F7JhcrUqumxsOBfPMk8SbJTbbXluGRdH24/cQbGt4cjf12+yfa9ePICa3vu3OTWl3mQs6DfOn0uzlneC2AwSEu8YxRrdnY2VeLB8xalnKuPbJtj7Zq4IbWpycf1Mu1JbKrmTGI++tbpc4Mugm3aZzBXP4sA0BFbum+2cmSHQT2vb9tedmh2qYO2zunK6vxMlo1LjOjq5KWa0eXnnszM38yMgJLjPrh6LLYMdOL5197OfHCSKcMbcMe2mTioFE687TcelC533HfGPLz61nvYfPMvAUSXgGSjrqIEG6Z2pET3csNFq8ehp815fswtA52481e5E3ly/NDaeNjsKgtBm46c1oGfPf4fS9fWR3RbNMbfxODdDvJRFaogRl/1j5jNpFimjoqXJnXUY1JHPVZPHILOxuj7LXkmEQBGNKW+Fy9eOx73/f7Z2LH2n/9cGKTSZilyueFN9iWncg160ltfHu3H8UNr8adnX0k5NuiyOvXE1avj9cj1m/px3cZJ8ftExDS66rQRjbj9xBmYO7oZJVnst9y/Zw2eeelN3P7z/Sn3nbm0Bzf98HFL1ykpErx7IPVF0P99RnWsVV/aPoCX3ngXA1f90P7JNlmp14Of7qCslBUXoaetJmXZ4/GzrS3PWtjbgsU+N47DRPuI9LXXYVZ3E/buWoYLVo7FpI66rK+tjQg1ubzf4H0LutN2aOb3RGeXzb5M1kxyP7JZmFhJdr9kbCtuPm6aD6VJ9fMLl+DWrdPxzRwczfbLeYeMCboIrtg6pyuwQBJ6o1tr4qsb4h2jDOe0Zdm5zYXGLPciF6Z0KS9Ptpgr0E3KoyGV31y0zJPrWvXI7uXxn5M7JHYGnhaNac2qg6hpM9hjPKWzHmfHVltY8YEVid9Nd2ybib9ftTrh72mriz7Oal0U2ZuPm4YlYzO3tcuKiwaD/3hch1rJ1xv8txe5YmpS2ODKUk4SO9FcXYZTFo1yZeZi0/ThuPbISdjm80buzx0/HT87f7Gvj5lrbt06Ayv6hgTy2O31FVgyti1hn0K+2r12vKPzTtPN5A+tC2YmLmx7CV3n5d8n3jV8nTh/pfGgg/YUFBfl+WtNCUY0VSXUTfr3aksAS4z1M4na8kqzrQ92guJpA9SdAaVvaQhZQJ7iokjKIMAd24z3ZH/zNGuDuAt7W+IrnTStNeX4/aUrcOqiwSBtK/qG4NatMyxd049Bq/NXjsH82Ha1dNiTyCPze5rjy+zOXNqDzzy4L+AShccRU4bhG488k3K7l8vYIhHBxunDPbu+mfKSIgxvrEz44ls/NfPsGpHbBmL74KyqKS/GtUf2J9z24HkBDXjkab8h3T68Y9wKLx+e/iEA4PDY6oIvbJuJ42/9dfz23tYa7FjQjeNmjcB7B1Uo9pKTe6Z01uORp14yvO+keSOxasIQ7Hv+NfzZYFmnn/Qdv46GSnz9lNnoa6/D3b8d3K6idRzszNBHIoJbTpiOiS6sjMqGlRk0v3QlLa2v1Q3W6peS9g9PDJJ3z6lz8JsnXrBctdW6MQjs4XfQqYusbalijZinKkxSM1h12uLUMPVhdPYya8sESgp8pDiXl+/l+4ROPtMaP8Xp1nfpTB5ej5UTEmd4c7nhPqolfPtOByN6Jt6+f88aXHXERPceJ2QdRSA1nUkkIvjQ6nEY3liJkc1VGFbvPIothc/JC9K3Y9rrKzC/pyXhvaqtIFg9MbEeuuzQPtfLF5f0WZk2otF0KaDd9FpLx7Ul5FT222OXr8Tnjp/u2vWybQ5snmE8cP/9sxfgVx8yX547tbMBJy8cFcp6zUu5++1LnogI8MljpqIoyJB8HvjQauOcbfnc/yiEysysAzmr294MFnljaF200Z08k33JuvFZpZXwg34WtNnhErRjZ/mfuiMTLTWF10uagq5+Lna41DnZA+csxL2nz3PlWhROm2cMzqBrA8rJbSAvByutdPy0aOpBf67sKi8pShsJ3ksVBh1tETHck9rbVmMpX+XI5sGlu17tXw3TwHh+9QTIsYtinajRrdV5GdikvrIUzdWpFUCYPoxuC9uXybr+dleuU2ZhZunL22dlPIa811JThsevXJUSevzEuSNx98458d+tjEnduX0Ad+2Y5Uu00K+fMhuf1QU2+tzx03HNhklpzjAWxpxYI2NRdXuziJCsZ9a+DXKQateacdg2z5294KNbqwNfrkfZqS4rxg2b+k3vr6sswS8/uBTXbezHnNg+rZVJe9anDPcuNYHZZ+XnFy6J/3zo5PbYsYMHX36Yh7ObOeTYWYOd/PVTBgckT5o3Etdt7MeX35eYOkt7Br9zxnzbj7VywmD7+CSX6hi/tdvY589OIgEA5oyOJrPOtxlEve+cmVoh5PVsW8B/3EyL+9EqbS6N/rWFiG3JG8kpOCVFEcPOUltteXy2rrw483tg7uhmDHQ3OSyD4I+XHWL5+GkjGhOCf7XUlGGTyTIlfaMkFxwxZRi+edpcrJro7WDgxunGudDCIowdeHJb9DtwzqgmrDfJzacZUleOI6d1YFRLNfZdtTplsHxiR517e3aTNFQl7ovTaEFsSosj8eie+q/142Z3eVKeXGO20uOsZT04cloH5oxKDNCiPYdOB8qcriyxSptZ9qoZ890zF1g+Nn97BJSRUUSv5NGzsLMTQS95Xf6iMalRqfJJkKH35/c044wlPQm3TRqWOhp/2aF9+OCqsbauXV4y+HexoZfbbj5+Ov5nxyyUxwYKvHo9BYJqCzk27br5uGm44ajJCbctDVGQBiMikhKUwQvJEbeDkG4/ax5X/RTz9nsHAdiP0ZC8PLLf45nkaSMacd4hY9DVVGk4uKovznVpZkQLgVGLb5NJgMBMbSCj75tbTpgeb5MEtcxci3Zb7NGkTV2l9aA6BdlJtBpEoZC01pbjkd3L8f4l0YhH6/JwyWmyGV35vW9tQ4aRU80mD0b8ZyY9t3+5YqVrSzPKiotwyqLcCKxE6dVVlGBWd1N8CZVnVbNL101uwBmlUbnFYpjzvGbx+d46pwtfOmkg84ExOxZY2wO0bFwbAOCzx03DtrkjDdOo5H2KE8IhfUOwcVoHdq1xtj81+b2Z7eKcdN9bpy0ejZ+ctzghNZL2cPr3aiHntQYSl9sCwK8+tBTt9RU4Y+ngoPQ5y3vxPzsybzkx+r5ZOq4NJy+Mvk7my8y9XaVVVVqEHQu6cdfJwW+bKchOYk9bTV5uRE9umNvVUFUan1nraatBVZYRUt20MBaV7oKVibNO+d7Ry0ZpcSS+fyvdl9s1SSkH3Hjdd+q+DOeMakJZcZH5rG2GxprR3doyHMoPVbGlnVqgG7ele4fZCXK0M4BE20FqNUg+bcXYITWWjtuxoBvzejLn6gKiS8fOWtaT8bhh9RXoiu27HDe0FhevG284Y8BOYv4rLynCtRv70eLwfVxdnrj6YJLLM4q3bk0f9VOb0DjKZKl7IUpuy7TF2jj6XJBnLO3BrDRbE7SPvtOVK1p6i1KPVmuJRKMu97W7+377wdkL8JX32et4FmQnsTgiebkR/dTFo3HXjlm4/yz7m3HD7qI14zB9RAPW9SfOcM4d3Zwx+Izd5YyFbrHN5XKfOXZaym0lJpXncUnRHkVg2oPVZg38SCxLwZo5shEfPao/ISLl/WfNTxtsIp2+pETUWh2RbZQ9fcMjUwNPvyw6V33nzPm47wx7A6rzRjdn1dkfP9Q4ifhZy3oT9olqTpjtLIIs+4hkl1n6BKeWjG1Le395SRH+cOkK7HY4E5qPzAa8tY+zlTm+e0+fhzOXZh5wMnPHtpm4/LA+1FdmjoYaJj1tNZg9yt6+/tz/FqO4oohgoLsJY4dEv2QzzQjZ2bPmViQ8p3rbanD3KXMMGwnJe43uOXVOQr6rIbqlRv938XLvCpknrt/Uj4cusJ7APDmvXTqXHz4h4XcRMa3UtdnjdI05tvPyg4jgiCkdCXuHxg6pzRhswsz0EYn74bSBhhuT9g/aVVlajEVjWlJuT+5IXbex31ZwgLBqri7LOJp92BTrUYu17QyZ3LCpH+NMOot6zdWluOywCRmPM2IlSjKRXhB74GvKS/I6doJdh002rm8OxLcsZH6uJgyrw9nLreXYNjK8sbJgggaxlsxj92UI72snlPztJ87E1evdS7TsqqRextTOBlxvMgOhD2SwJOQBJrzSkGH0q6y4CB0NlWmPSUeLAKcFFUpXZxeJ4ODB1G7iSfNGoipNoJG8jkpLWUt+e2jvQa/eNlpaCc2R0zpSbstXpyx0f3/w+qkdWD4uc/18zylzHT/GVWH9PqOcc9URfC/5RUtRkkzrHJblwQqOMOGzmce6khop+un1VROG2Fp61V5fgaNnZhf++eNHT7F87Ke3TDW8XV/iyw6N5giy0/DTL120MlKd67RQyvrX2s2/+55T56TcdkVsZF9bcqbNCBpZ1z/U8PU7d8WY+M9p36UcYCUDyYMI8aVIHF1wnYjgy9sHLOVBtbPH0WDsKEVnU+pgltWAgMnRronMZHorDmswXl59RdLKmfkmHRzK3qH97Thp3siUuBXZ+ul5i/HrDy119Zq5hJ3EAuLHRv2fX7gEf7tyVfz3c1dEp/Tn9zRbTqZ+0+bJlpZ1xGcHdA0/bc+b6br1AutUaJ3E5L/7W6fbG4FfPXFIQnJxjRbmXp/MVlsaM7q1Gr/44BK8b75xsI9h9RWoKS9BV1PqjEtFaVHaBv0xA504pK8NJy9glNNCkyntzdY5XViaNAvl5jIxoysV+r7ZOaObM0ZJvnTdeGwZGIG/XbkKbbXmncUVfdF9WgczdOgXmAw+zexKv+fmmg2T8NWTZ6c9hgjQ56tL//meM6rJsG2R/A6eM7oZj+vaR06t629P2XddSJqro6uh9AGySosj2L12vOtB7TqbKtFqY9VdvnE/cRSF1oLeZnz0gb9aPl6r4H5lYxSlXbcXMCLA6Ut6sGVgBCrLrEfMPGzyMNz/x2fjv+vzjmWqiD98WHR2savZ+XLJfDJmSA3+87f/oiwpWfmkjnqMaKrEk/99w9J1zlnei9GtNVgxvg3f/9O/ACRGE7v8sAn40i+fSjkvXQAL7bU0C5Sj7SVdOi51c39dRQk+e1z6wCEAMKXT+3xw5K9MM0xLxramdCAGZxJTj180phVD6yowqqUK133fev1IiTJN0m6dG02BE4Ggt60G/3rl7XhU20kddfj9P14GgHh+VX2exU8ek7qypMik3X7V+vR7FDcxUiRZpEWvzLQ1JyKC/o56/N/TLyXeYfChMAvqZoedVVn56P+dNhePPPUS1hZAqragsZNYIJ64erXt0XRtFK2m3P7b5MOH9cUjATZUWY8AVRL75tc3BHea5BYyavhpf+PQugqsnTQU3/79s6knFpBPHzsNjz7ziuHo2r3vn4eXXn/X1vVuPn46ui68L+V2JzM1+lOG1VfgmZfeTLh/aF0FfrtrWcY9lGb271nj6DwKt+QZ5qOmD8dde59Of1J8T2LiuXt3LUNTVWn8/eu0k1hoKxSy9cktU6P1Uiyp81dPno2xu+8HMLgSYdn4wcEho/3jbbqG+7ffPw9rP/4QAKQMiBE5NWFYHa7ZMAkrJ5oHZ9sy0ImiiHEANv0gqdFKHHKmo6Eyq7gJZB2XmxYIJ414rS3mZJnq8bO70NtmLVeWnrZsy2xUOuH2WLnYQDNXW15iGvK4trzEcE+PVdk+7+cdMrh3wGxpWVN1GSO7UYIbj0ocRR/RXJkxIfsRU4YBSK1XmqvLEupGK1GcuavRWLr64Le7liX8nlwvlZcYd+y0QGP6az9x9Wpcs2ESLl43mBZgwrD8S2lF4bBpxvB4XjwjjWkGwStLi/DY5SuxZ/1ErNANeowdUoPhjd7khCVyEzuJZGrxmOjobba5xdJJaViYjPhr9JGrtFPv3pkaPCV6bXYu7Hp492CKkE8c482SlpMXduPCVWNxqG6P6gErUSqIgJTk6ycvGIV5Pc3xVQiaS3SdiEvWRZehz80QOOKeU+fify9ckvYY7b1apIuQUlYcQWVpEW7anF2KjVymDfAZfV80VTtLZm70NSAi2DRjuGE6JCKvrUla4rhlIJan02Cgs6GqFOUlRdg8szOhPXL/WQvws/PT1zNEYcBOYoGy0n+6cfNk/Oz8xaZr6I+c1oHbT5yRVTn+b/eKhA3Y6fYOAdE8Zdo6dO1vGG+ygdso8InWgJk8nHvVjDRUOt/0fe/p8/Dt92dOvP3BVeOwMyls/ieOmYrFBvnniDLRPtMzuhoBDNYLJ8b2wOmPaastx6QO81mn6rLihByrRuKdRF0lKiL404dX4rDJw+z/AXliVncjjps1AtccOcm1a9bH6iM39nERueEmXa7V4ogk5GHWa6wqLYgI6pTfWPOSqfKSIgxvNF+OuGWgE4vG2Ms1OD9pFqCusgRf3j4r/ruVfGbaHslMEQWrY3n29HsqS4oi+POHV+KeU4xnHwvVhGHRLzP9aGemQBQXrR6X8PvEjjrHy75mjmzEbSfOdHQuERBNibN4TEu8s2hG6+Q5HZQYnEnkSgW94qIILj98QsJewWzdvXMOrtkwic81hUaxxQGLgZHp6yGiXMD1GgUqqHRhH1w1Dj97/GcJt9XpZq+0jt/UNFEptVHl4gwNh4vWjMPo1ur4sllNRSkDGyS7c/ss/DMpcIy2H8jMij7zzfxEfutpq7E00KCtbP6ALhenHWsnDcWvnniBEZR90NlUmdW+aSIvlem+I5ObVEcxii7lAXYS89zHjp6CKoNOkdOciXduH8CWz//KcXky5b7Slm50NFRi2ogGT3xSTgAAE95JREFU/PbJF1OO+cCKMSgtiuDwKYNLuxb0tuDlN95JOK6mvATbTXL0UaK6ipKUCKjLDVJPEOU6ZTH3mZljZ43AphnDGUWTqMB947TUfMNLxrbi1q3ZbcMhCgt2EvPcoSYJ7IOK6ZJpBvPL7xuMUqg15pKLWldRgl1rxyfc9oVtXKrotkhEMKqlCvuefz3oohAZOmtZT9r7P3PstJQVB/EE2Q43W4gIO4gWdTRU4B8vvpn5QAB3bJuJJhvpkpLduX0gvsWAyA9GEdzPWJq+TiLKJdyTWKCanUabM7BhaoflY/VRSy87tC/lfn1eIe79CZ72had/XYjC4qxlvWnvXzlhSEK+PQCoiEXFLHbaSyTLvnHqXHxt52xLxy7sbckqlcXc0c3oZ0AyCsjuteMxurUaYxyk/iIKKw67FZjm6jIURwQXrhqb+WCLrt/Uj68//A9Lx45srgIQHeFfOSH9nrayWO4s7iEMzmGTh6VEbLx03XgMYaeRctRnjp2Kex5+BqNaqoIuSt5rqSlDS417A5JEYTWjqxEPnLMw6GIQuYqdxAKzNympcTYaKu0vDaopL8H+PWssHfvxo6fgnoef4chcyGzVpRYgCkJfey1eeuNdR+cOravAaYtHu1wiIiKi/MJOIjlSHBF0NQ+OxP/momUZo43a1VZbjlMWjcp8IBEVlPvOmB90EYiIiPIaO4nkyMykHEBcUkRERERElB/YSSRHgsqzSERERBSUR3YvDyxCPJGf2EkkW7INH29m15pxENa6REREFGINWaRqIcol7CSSLbGsFI4TUZth0nsiIiIionBgoiiypSjWOawoYVoKIiIiIqJ8xJlEsmXOqCacsWQ0TpjTFXRRiIiIiIjIA+wkki2RiOCcFWOCLgYREREREXmEy02JiIiIiIgojp1EIiIiIiIiivOlkygiZSJyi4g8KSKvisj/icgq3f1LReQxEXlDRH4sIiOSzr1VRF4RkedE5Jyka5ueS0RERERERPb4NZNYDOBpAAsB1AHYBeCrItIlIs0A7gGwG0AjgL0A7tKdeymAHgAjACwGcL6IrAQAC+cSERERERGRDb4ErlFKvY5oZ0/zbRF5AsA0AE0AHlVKfQ0ARORSAP8RkbFKqccAnABgq1LqRQAvisjnAGwFcD+A9RnOJSIiIiIiIhsC2ZMoIm0AegE8CqAPwO+0+2Idyn0A+kSkAcBQ/f2xn/tiP5uea/CYO0Rkr4jsff755939g4iIiIiIiPKE751EESkBcCeAO2KzfdUAXk467GUANbH7kHS/dh8ynJtAKXWzUmq6Ump6S0tLdn8EERERERFRnvK1kygiEQBfBPAOgNNjN78GoDbp0FoAr8buQ9L92n2ZziWiHDSqpSroIhAREREVNF/2JAKAiAiAWwC0AVitlHo3dtejiO471I6rAjAK0b2GL4rIswD6Afwgdkh/7Jy053r4pxCRR352/mLUVZYEXQwiIiKigubnTOKnAYwDsE4p9abu9m8AmCAiG0SkHMDFAH6vCzzzBQC7RKRBRMYCeB+A2y2eS0Q5ZHhjJWrL2UkkIiIiCpJfeRJHADgZwGQAz4nIa7F/W5RSzwPYAOBKAC8CGACwWXf6JYgGo3kSwIMArlVK3Q8AFs4lIiIiIiIiG0QpFXQZfDd9+nS1d+/eoItBREREREQUCBH5rVJqutF9gaTAICIiIiIionBiJ5GIiIiIiIji2EkkIiIiIiKiOHYSiYiIiIiIKI6dRCIiIiIiIopjJ5GIiIiIiIji2EkkIiIiIiKiOHYSiYiIiIiIKI6dRCIiIiIiIopjJ5GIiIiIiIji2EkkIiIiIiKiOHYSiYiIiIiIKI6dRCIiIiIiIooTpVTQZfCdiLwK4C8ePkQdgJdz6Lp+XJ/Xzr/r89rGmgH8x8Pre1H+XH0f5mq5vb6219fP1Wt7ff1crlty8TOaq9f2+vosu//X9vr6Xl57jFKqxvAepVTB/QOw1+Pr35xL1/Xj+rx2/l2f1za9fs7VL7n6PszVcrPsfF4cXt+zuiUXP6O5em2WPf+unctlT1evcLmpN+7Nsev6cX1eO/+uz2sHw4vy5+r7MFfL7fW1vb5+rl7b6+vnct2Si5/RXL2219dn2f2/ttfXD6RuKdTlpnuVUtODLgcR5R/WL0TkBdYtROS2dPVKoc4k3hx0AYgob7F+ISIvsG4hIreZ1isFOZNIRERERERExgp1JpHIERG5XUSuCLocRJRfWLcQkRdYt5BT7CQSARCRn4jI9qDLQUT5hXULEXmBdQt5jZ1EIiIiIiIiimMnkUhHRLaKyENJtykRGR1UmYgo97FuISIvsG4hr+RcJ1FEcq7MRJQbWL8QkdtYrxBRLsqpiktEipRSB4MuBxHlH9YvROQ21itElKtyopMoIkUAoJQ6ICLNIvIxETlbRPqCLhsR5TbWL0TkNtYrRJTrcqKTqJQ6AAAiMhfAgwDaABwK4FoRmRy7Lyf+Fgq91wFUar+IyJAAy0I+YP1CPmHdUkBYr5CPWLeQJ0JZQYmIJP1eJiJfBnAJgI8rpY4CcDqAfQDOBwAu5yCX/A5An4hMFpFyAJcGXB5yGesXCgjrljzGeoUCxLqFPBGqTqJEFSmllP52pdTbAH4KYCKAmthtjwL4LoDhInJk7PxQ/T2Uc5RS6q8APgzgAQCPA3go/SmUK1i/UIBYt+Qp1isUMNYt5BlJqteCKYRIRD+iJiLVAC4C8CqA3yqlvhcbpfsmgMcA3KSUekZEWgCcCmABgDVKqbcCKD7lARF5GMCHlVL/L+iykLtYv1CQWLfkJ9YrFDTWLeS1wEewRGQlgCtFpDP2+3YAfwcwDkA/gI+LyHGxUbpbAMyK/YNS6nkAPwYgAOYFUHzKA7FAAuMAPBJ0WchdrF8oSKxb8hPrFQoa6xbyQ+CdRADFAJYBmCkilQCmA3i/Uurw2Br+HwG4EgCUUt8E8FcAK0VkfOz8XwPYoJR6wP+iU64TkY8A+D6AC5RSTwZdHnId6xcKBOuWvMZ6hQLDuoX8Epblpp8EUAvgCgCvKqX+KSI9AD4PoAPR9fxfUUqdKSJTAXwF0c3gd2n7ALRN48n7AoiosLF+ISK3sV4honwX6EyiLhrYTQC6ACwB8IKIdAP4KoBfKKVGAbgZwOkiMlIp9TCA7Uqp/9FXrCrG37+AiMKK9QsRuY31ChEVikA7iUopJSISi8z0XQBrEF1jPQrAC0qpC2OHliG68XtD7LyfAakhp4mINKxfiMhtrFeIqFCEYrkpEI8M9g1E1/K/BWA9ohXsAgB7AZyqlHo5uBISUa5i/UJEbmO9QkT5LAyBa7RQ0q8B+CKAuQCeQ3SdfwmA65RSW5RSL8fyEaUts4iU6q/rZbmJKPxcrl+q9df1stxEFF5u1iux63WLSG3sZ842ElHgQjOTqBGRuwA8D+ASpdR/dbcXKaUOpDmvE8AeAO8A+IdSapfnhSWinJJl/XITgPcQzYO2Qyn1ntflJaLwc1qv6I47DcC1AI5XSt3tXUmJiKwLzUi4buTsYwBmILq+HyJSBAAZGnA7EV3a8Syiyz6OEpFbY/eF5m8komBkWb9cBOBhAE8D+DCA5QA+mXRdIiow2dQrSfoBvIhoSo0et8tJROREaDpQsc3gEaXU/yKaZPaQ2O1pK1kRqQfQA+B0pdQHlFJfALARwHoRqVVKHfS67EQUblnULwLgIICVSqkzlFJ/APAQgNpY8IpwLcUgIt84rVc0WmcSwOMA7gIwAGCeiJR5UV4iIjtC00kEAKXUwVhi2jcB/MXsOK0CjTXg3kY0/9D9sdsiAOoB/BnRSpuIyEn9UhzrBN6glNorItNE5C8ADgXwdwCH6/dAE1HhsVqvAAl1S/JM42wAtwH4NoDDAIz0rMBERBaFqpMYcziARwDck3yHiDTElpF+BojnGHpTKbVXKfVKbGT/IKKhp18F8JqfBSei0LNTv7wX+//t2CHtAD6hlKoCcAOiibEvEpEaPwpORKFlWq8AhnXLgdjtWhvsaQDDAdwCoBzA0SJyhYhM8rrgRERmwhi4xnAJl4hMBPBxAE0AXgFwvVLqHqON4SLyaQDvKqXO8KXQRJQTXKpfJLbM7EgA1wMYr5R63Y/yE1H4pFt6nqZuiWjbYUTkpwBOVErtE5F7AawCcB+ALbEIqkREvgvdTGKaPT6liIaa3grghwDeJyKlSqkD2uZxEYnElnFMQ3R9P0Rku4ic4n3JiSjssqlfdIpj/7+KaLCJWi/KSkS5IcPeZLO65aBuufqvAFwmIn9AtD55CMB+AFWeFZqIKIPQdRI1IjJWRBaKSGvspj8AuFsp9VsA3wOgAJyuHR77XyFawf4bQIeI/AjAlYgu5SAiAuC4ftFC2r8rIuMQzYn2XaXUs36WnYjCy07dopR6J7bkdCiAPgA3KqUWAvgIgEb/S09ENCiMy02LEF23vwnAbxGtPM9XSt2rO6YawEkANgA4Tin1pLZ0Q0SWI1oRvwDgY0qpD/v+RxBRKGVRvwiAakQDTJwGYAGAa5VSV/n8JxBRCDmtW2K3jwTwL6XUG74XnIjIRBhnEvsAjEY039AKALcDuElEFmgHxNbo/xDAPwGcHbvtYKySfgnApQC62EEkoiRO6xeFaCCsxxHdK9TJDiIR6TiqW2KeVkq9oQWyYf5VIgqDUHQSRaROF+VrFoARSqn/ADiolPoIouv1TxCRbt1pf0U09cUEEblKRH4BYKFS6jdKqQ9zszcRAa7WL8uUUk8opW5WSr3q6x9BRKHjUt3yvwCWAtHB7tj/4VriRUQFKdBOooj0iMj3ANwJ4OsiMgLAnwA8JSKTtQoTwNUA+gHEw0Erpd4BcADRivkEAJ9VSv3I1z+AiELLg/rlB77+AUQUSi7XLZ9TSn3P1z+AiMiCwDqJInISgB8hmlvofEQ3ae9GNHLgvxBdrgEAUEr9HtHN38fFzi2K7T28G8CnlFLDlFK3+/oHEFFosX4hIi+wbiGiQhFY4BoRuQLAk0qpz8V+7wDwGIBeRCvUqdDNDorIOgB7AMyIrd0fBuB1pdRLgfwBRBRarF+IyAusW4ioUBRnPsQznwHwNgCISBmANwDsA1AB4GuIbv4+S0T2xSKAzQDwfS36l1LqmUBKTUS5gPULEXmBdQsRFYTAOolKqX8A0SheSqm3RWQ8ostfn47lDvoYonnI7hORlwCMAbAlqPISUe5g/UJEXmDdQkSFIsiZRAAJUbwWAfhLbFM3lFJ/FJENAKYA6FNK3RFQEYkoR7F+ISIvsG4honwXeCdRRIqUUgcAzARwf+y2UxAdfbtSKbUXwN4Ai0hEOYr1CxF5gXULEeW7wDuJSqkDIlKMaISwVhH5KYAuANuUUs8HWjgiymmsX4jIC6xbiCjfBRbdNKEQIhMB/A7R8NHXK6WuC7hIRJQnWL8QkRdYtxBRPgtLJ7EUwOmI5g16K+jyEFH+YP1CRF5g3UJE+SwUnUQiIiIiIiIKh0jQBSAiIiIiIqLwYCeRiIiIiIiI4thJJCIiIiIiojh2EomIiIiIiCiOnUQiIiIiIiKKYyeRiIgIgIh0ishrIlIUdFmIiIiCxE4iEREVLBHZLyLLAEAp9ZRSqlopdcDHx18kIv/w6/GIiIisYCeRiIiIiIiI4thJJCKigiQiXwTQCeDe2DLT80VEiUhx7P6fiMgVIvLz2P33ikiTiNwpIq+IyG9EpEt3vbEi8gMReUFE/iIim3T3rRaRP4nIqyLyjIicKyJVAL4LoD12/ddEpF1EZorIL0TkJRF5VkQ+ISKlumspETlVRB6PXe9yERkVK+crIvJV7XhtplJEPiQi/4nNnG7x5xkmIqJcxU4iEREVJKXUcQCeArBOKVUN4KsGh20GcByAYQBGAfgFgNsANAL4M4BLACDW4fsBgC8DaI2d9ykRGR+7zi0ATlZK1QCYAOBHSqnXAawC8M/YMtdqpdQ/ARwAcDaAZgCzASwFcGpSuQ4BMA3ALADnA7gZwLEAhseuf7Tu2CGxaw0DcAKAm0VkjK0ni4iICgo7iUREROZuU0rtU0q9jOis3z6l1ANKqfcAfA3AlNhxawHsV0rdppR6Tyn1CICvA9gYu/9dAONFpFYp9aJS6mGzB1RK/VYp9cvYdfYD+CyAhUmHXaOUekUp9SiAPwL4vlLq77pyTkk6frdS6m2l1IMA7gOwCURERCbYSSQiIjL3L93Pbxr8Xh37eQSAgdgS0ZdE5CUAWxCdxQOA/9/OHbJmGUZhHP9fwVnUKbYhBsExP4DBIJgMFoMmZX3rJllZUfwEBqsiYjHsCyz7BZbEIYzXNNhsgsfw3Lt9w1bePaDu/f/gbg/nnHo4F88j4AGwm2Q7yZ2TGiZZTrKVZJLkAHjBcAmcZS6A/Xa1PLILLJ3UX5Ikl0RJ0jyrkep8A7ar6vLUu1BV6wBV9bmqHjJEUT/xJ9p6XP/XwA5ws6ouAc+BnGK2Ky0Oe+Q6sHeKepKkM84lUZI0z74DN0aoswUsJ1lNcq6920luJVlI8jTJYlX9BA6AX1P9ryZZnKp1sX3zI8kKsD7CfJttjrsM0diPI9SUJJ1RLomSpHn2Etho8dDHsxapqkPgPsMPa/aACfAKON8+WQW+tvjoGkMUlaraAd4DX1pMdQl4BjwBDoE3wIdZ52omwH6b6x2w1vpKknSsVI2VtJEkSf+SJPeAt1V17W/PIkn6f3hJlCRJkiR1LomSJEmSpM64qSRJkiSp85IoSZIkSepcEiVJkiRJnUuiJEmSJKlzSZQkSZIkdS6JkiRJkqTOJVGSJEmS1P0G8XdW8bXHiqkAAAAASUVORK5CYII=", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "## Criar conjuntos de dados de treino e teste\n", - "\n", - "### Dividir os dados em treino e teste\n", - "\n", - "Para avaliar o desempenho do modelo, é importante dividir os dados em dois conjuntos: treino e teste. O conjunto de treino é usado para ajustar o modelo, enquanto o conjunto de teste é usado para verificar a sua precisão.\n", - "\n", - "[!TIP] Certifique-se de que os dados estão bem misturados antes de os dividir, especialmente se houver algum tipo de ordenação nos dados originais.\n", - "\n", - "### Exemplo de divisão de dados\n", - "\n", - "Aqui está um exemplo de como dividir os dados utilizando @@INLINE_CODE_1@@:\n", - "\n", - "```python\n", - "from sklearn.model_selection import train_test_split\n", - "\n", - "# Dividir os dados em treino e teste\n", - "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)\n", - "```\n", - "\n", - "[!NOTE] O parâmetro @@INLINE_CODE_2@@ garante que a divisão seja reproduzível.\n", - "\n", - "### Escolher a proporção de divisão\n", - "\n", - "A proporção de divisão entre treino e teste pode variar dependendo do tamanho do conjunto de dados e do objetivo do modelo. Uma divisão comum é 80% para treino e 20% para teste. No entanto, para conjuntos de dados muito grandes, pode ser suficiente usar 90% para treino e 10% para teste.\n", - "\n", - "[!CAUTION] Certifique-se de que o conjunto de teste é suficientemente grande para fornecer uma avaliação confiável do modelo.\n", - "\n", - "### Validar os dados divididos\n", - "\n", - "Depois de dividir os dados, é uma boa prática verificar as dimensões dos conjuntos de treino e teste para garantir que a divisão foi feita corretamente:\n", - "\n", - "```python\n", - "print(f\"Tamanho do conjunto de treino: {len(X_train)}\")\n", - "print(f\"Tamanho do conjunto de teste: {len(X_test)}\")\n", - "```\n", - "\n", - "[!IMPORTANT] Nunca utilize os dados de teste durante o treino do modelo. Isso pode levar a resultados enganosos e a um modelo que não generaliza bem.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "source": [ - "train_start_dt = '2014-11-01 00:00:00'\n", - "test_start_dt = '2014-12-30 00:00:00' " - ], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 21, - "source": [ - "energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \\\n", - " .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \\\n", - " .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 22, - "source": [ - "train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']]\n", - "test = energy.copy()[energy.index >= test_start_dt][['load']]\n", - "\n", - "print('Training data shape: ', train.shape)\n", - "print('Test data shape: ', test.shape)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Training data shape: (1416, 1)\n", - "Test data shape: (48, 1)\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "source": [ - "scaler = MinMaxScaler()\n", - "train['load'] = scaler.fit_transform(train)\n", - "train.head(10)" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-11-01 00:00:000.10
2014-11-01 01:00:000.07
2014-11-01 02:00:000.05
2014-11-01 03:00:000.04
2014-11-01 04:00:000.06
2014-11-01 05:00:000.10
2014-11-01 06:00:000.19
2014-11-01 07:00:000.31
2014-11-01 08:00:000.40
2014-11-01 09:00:000.48
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-11-01 00:00:00 0.10\n", - "2014-11-01 01:00:00 0.07\n", - "2014-11-01 02:00:00 0.05\n", - "2014-11-01 03:00:00 0.04\n", - "2014-11-01 04:00:00 0.06\n", - "2014-11-01 05:00:00 0.10\n", - "2014-11-01 06:00:00 0.19\n", - "2014-11-01 07:00:00 0.31\n", - "2014-11-01 08:00:00 0.40\n", - "2014-11-01 09:00:00 0.48" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Original vs dados escalados:\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 24, - "source": [ - "energy[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']].rename(columns={'load':'original load'}).plot.hist(bins=100, fontsize=12)\n", - "train.rename(columns={'load':'scaled load'}).plot.hist(bins=100, fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - }, - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Vamos também escalar os dados de teste\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 25, - "source": [ - "test['load'] = scaler.transform(test)\n", - "test.head()" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-12-30 00:00:000.33
2014-12-30 01:00:000.29
2014-12-30 02:00:000.27
2014-12-30 03:00:000.27
2014-12-30 04:00:000.30
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-12-30 00:00:00 0.33\n", - "2014-12-30 01:00:00 0.29\n", - "2014-12-30 02:00:00 0.27\n", - "2014-12-30 03:00:00 0.27\n", - "2014-12-30 04:00:00 0.30" - ] - }, - "metadata": {}, - "execution_count": 25 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 26, - "source": [ - "# Specify the number of steps to forecast ahead\n", - "HORIZON = 3\n", - "print('Forecasting horizon:', HORIZON, 'hours')" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Forecasting horizon: 3 hours\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 27, - "source": [ - "order = (4, 1, 0)\n", - "seasonal_order = (1, 1, 0, 24)\n", - "\n", - "model = SARIMAX(endog=train, order=order, seasonal_order=seasonal_order)\n", - "results = model.fit()\n", - "\n", - "print(results.summary())\n" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - " SARIMAX Results \n", - "==========================================================================================\n", - "Dep. Variable: load No. Observations: 1416\n", - "Model: SARIMAX(4, 1, 0)x(1, 1, 0, 24) Log Likelihood 3477.239\n", - "Date: Thu, 30 Sep 2021 AIC -6942.477\n", - "Time: 14:36:28 BIC -6911.050\n", - "Sample: 11-01-2014 HQIC -6930.725\n", - " - 12-29-2014 \n", - "Covariance Type: opg \n", - "==============================================================================\n", - " coef std err z P>|z| [0.025 0.975]\n", - "------------------------------------------------------------------------------\n", - "ar.L1 0.8403 0.016 52.226 0.000 0.809 0.872\n", - "ar.L2 -0.5220 0.034 -15.388 0.000 -0.588 -0.456\n", - "ar.L3 0.1536 0.044 3.470 0.001 0.067 0.240\n", - "ar.L4 -0.0778 0.036 -2.158 0.031 -0.148 -0.007\n", - "ar.S.L24 -0.2327 0.024 -9.718 0.000 -0.280 -0.186\n", - "sigma2 0.0004 8.32e-06 47.358 0.000 0.000 0.000\n", - "===================================================================================\n", - "Ljung-Box (L1) (Q): 0.05 Jarque-Bera (JB): 1464.60\n", - "Prob(Q): 0.83 Prob(JB): 0.00\n", - "Heteroskedasticity (H): 0.84 Skew: 0.14\n", - "Prob(H) (two-sided): 0.07 Kurtosis: 8.02\n", - "===================================================================================\n", - "\n", - "Warnings:\n", - "[1] Covariance matrix calculated using the outer product of gradients (complex-step).\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Crie um ponto de dados de teste para cada passo do HORIZON.\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 28, - "source": [ - "test_shifted = test.copy()\n", - "\n", - "for t in range(1, HORIZON):\n", - " test_shifted['load+'+str(t)] = test_shifted['load'].shift(-t, freq='H')\n", - " \n", - "test_shifted = test_shifted.dropna(how='any')\n", - "test_shifted.head(5)" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
loadload+1load+2
2014-12-30 00:00:000.330.290.27
2014-12-30 01:00:000.290.270.27
2014-12-30 02:00:000.270.270.30
2014-12-30 03:00:000.270.300.41
2014-12-30 04:00:000.300.410.57
\n", - "
" - ], - "text/plain": [ - " load load+1 load+2\n", - "2014-12-30 00:00:00 0.33 0.29 0.27\n", - "2014-12-30 01:00:00 0.29 0.27 0.27\n", - "2014-12-30 02:00:00 0.27 0.27 0.30\n", - "2014-12-30 03:00:00 0.27 0.30 0.41\n", - "2014-12-30 04:00:00 0.30 0.41 0.57" - ] - }, - "metadata": {}, - "execution_count": 28 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 29, - "source": [ - "%%time\n", - "training_window = 720 # dedicate 30 days (720 hours) for training\n", - "\n", - "train_ts = train['load']\n", - "test_ts = test_shifted\n", - "\n", - "history = [x for x in train_ts]\n", - "history = history[(-training_window):]\n", - "\n", - "predictions = list()\n", - "\n", - "# let's user simpler model for demonstration\n", - "order = (2, 1, 0)\n", - "seasonal_order = (1, 1, 0, 24)\n", - "\n", - "for t in range(test_ts.shape[0]):\n", - " model = SARIMAX(endog=history, order=order, seasonal_order=seasonal_order)\n", - " model_fit = model.fit()\n", - " yhat = model_fit.forecast(steps = HORIZON)\n", - " predictions.append(yhat)\n", - " obs = list(test_ts.iloc[t])\n", - " # move the training window\n", - " history.append(obs[0])\n", - " history.pop(0)\n", - " print(test_ts.index[t])\n", - " print(t+1, ': predicted =', yhat, 'expected =', obs)" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "2014-12-30 00:00:00\n", - "1 : predicted = [0.32 0.29 0.28] expected = [0.32945389435989236, 0.2900626678603402, 0.2739480752014323]\n", - "2014-12-30 01:00:00\n", - "2 : predicted = [0.3 0.29 0.3 ] expected = [0.2900626678603402, 0.2739480752014323, 0.26812891674127126]\n", - "2014-12-30 02:00:00\n", - "3 : predicted = [0.27 0.28 0.32] expected = [0.2739480752014323, 0.26812891674127126, 0.3025962399283795]\n", - "2014-12-30 03:00:00\n", - "4 : predicted = [0.28 0.32 0.42] expected = [0.26812891674127126, 0.3025962399283795, 0.40823634735899716]\n", - "2014-12-30 04:00:00\n", - "5 : predicted = [0.3 0.39 0.54] expected = [0.3025962399283795, 0.40823634735899716, 0.5689346463742166]\n", - "2014-12-30 05:00:00\n", - "6 : predicted = [0.4 0.55 0.66] expected = [0.40823634735899716, 0.5689346463742166, 0.6799462846911368]\n", - "2014-12-30 06:00:00\n", - "7 : predicted = [0.57 0.68 0.75] expected = [0.5689346463742166, 0.6799462846911368, 0.7309758281110115]\n", - "2014-12-30 07:00:00\n", - "8 : predicted = [0.68 0.75 0.8 ] expected = [0.6799462846911368, 0.7309758281110115, 0.7511190689346463]\n", - "2014-12-30 08:00:00\n", - "9 : predicted = [0.75 0.8 0.82] expected = [0.7309758281110115, 0.7511190689346463, 0.7636526410026856]\n", - "2014-12-30 09:00:00\n", - "10 : predicted = [0.77 0.78 0.78] expected = [0.7511190689346463, 0.7636526410026856, 0.7381378692927483]\n", - "2014-12-30 10:00:00\n", - "11 : predicted = [0.76 0.75 0.74] expected = [0.7636526410026856, 0.7381378692927483, 0.7188898836168307]\n", - "2014-12-30 11:00:00\n", - "12 : predicted = [0.77 0.76 0.75] expected = [0.7381378692927483, 0.7188898836168307, 0.7090420769919425]\n", - "2014-12-30 12:00:00\n", - "13 : predicted = [0.7 0.68 0.69] expected = [0.7188898836168307, 0.7090420769919425, 0.7081468218442255]\n", - "2014-12-30 13:00:00\n", - "14 : predicted = [0.72 0.73 0.76] expected = [0.7090420769919425, 0.7081468218442255, 0.7385854968666068]\n", - "2014-12-30 14:00:00\n", - "15 : predicted = [0.71 0.73 0.86] expected = [0.7081468218442255, 0.7385854968666068, 0.8478066248880931]\n", - "2014-12-30 15:00:00\n", - "16 : predicted = [0.73 0.85 0.97] expected = [0.7385854968666068, 0.8478066248880931, 0.9516562220232765]\n", - "2014-12-30 16:00:00\n", - "17 : predicted = [0.87 0.99 0.97] expected = [0.8478066248880931, 0.9516562220232765, 0.934198746642793]\n", - "2014-12-30 17:00:00\n", - "18 : predicted = [0.94 0.92 0.86] expected = [0.9516562220232765, 0.934198746642793, 0.8876454789615038]\n", - "2014-12-30 18:00:00\n", - "19 : predicted = [0.94 0.89 0.82] expected = [0.934198746642793, 0.8876454789615038, 0.8294538943598924]\n", - "2014-12-30 19:00:00\n", - "20 : predicted = [0.88 0.82 0.71] expected = [0.8876454789615038, 0.8294538943598924, 0.7197851387645477]\n", - "2014-12-30 20:00:00\n", - "21 : predicted = [0.83 0.72 0.58] expected = [0.8294538943598924, 0.7197851387645477, 0.5747538048343777]\n", - "2014-12-30 21:00:00\n", - "22 : predicted = [0.72 0.58 0.47] expected = [0.7197851387645477, 0.5747538048343777, 0.4592658907788718]\n", - "2014-12-30 22:00:00\n", - "23 : predicted = [0.58 0.47 0.39] expected = [0.5747538048343777, 0.4592658907788718, 0.3858549686660697]\n", - "2014-12-30 23:00:00\n", - "24 : predicted = [0.46 0.38 0.34] expected = [0.4592658907788718, 0.3858549686660697, 0.34377797672336596]\n", - "2014-12-31 00:00:00\n", - "25 : predicted = [0.38 0.34 0.33] expected = [0.3858549686660697, 0.34377797672336596, 0.32542524619516544]\n", - "2014-12-31 01:00:00\n", - "26 : predicted = [0.36 0.34 0.34] expected = [0.34377797672336596, 0.32542524619516544, 0.33034914950760963]\n", - "2014-12-31 02:00:00\n", - "27 : predicted = [0.32 0.32 0.35] expected = [0.32542524619516544, 0.33034914950760963, 0.3706356311548791]\n", - "2014-12-31 03:00:00\n", - "28 : predicted = [0.32 0.36 0.47] expected = [0.33034914950760963, 0.3706356311548791, 0.470008952551477]\n", - "2014-12-31 04:00:00\n", - "29 : predicted = [0.37 0.48 0.65] expected = [0.3706356311548791, 0.470008952551477, 0.6145926589077886]\n", - "2014-12-31 05:00:00\n", - "30 : predicted = [0.48 0.64 0.75] expected = [0.470008952551477, 0.6145926589077886, 0.7247090420769919]\n", - "2014-12-31 06:00:00\n", - "31 : predicted = [0.63 0.73 0.79] expected = [0.6145926589077886, 0.7247090420769919, 0.786034019695613]\n", - "2014-12-31 07:00:00\n", - "32 : predicted = [0.71 0.76 0.79] expected = [0.7247090420769919, 0.786034019695613, 0.8012533572068039]\n", - "2014-12-31 08:00:00\n", - "33 : predicted = [0.79 0.82 0.83] expected = [0.786034019695613, 0.8012533572068039, 0.7994628469113696]\n", - "2014-12-31 09:00:00\n", - "34 : predicted = [0.82 0.83 0.81] expected = [0.8012533572068039, 0.7994628469113696, 0.780214861235452]\n", - "2014-12-31 10:00:00\n", - "35 : predicted = [0.8 0.78 0.76] expected = [0.7994628469113696, 0.780214861235452, 0.7587287376902416]\n", - "2014-12-31 11:00:00\n", - "36 : predicted = [0.77 0.75 0.74] expected = [0.780214861235452, 0.7587287376902416, 0.7367949865711727]\n", - "2014-12-31 12:00:00\n", - "37 : predicted = [0.77 0.76 0.76] expected = [0.7587287376902416, 0.7367949865711727, 0.7188898836168307]\n", - "2014-12-31 13:00:00\n", - "38 : predicted = [0.75 0.75 0.78] expected = [0.7367949865711727, 0.7188898836168307, 0.7273948075201431]\n", - "2014-12-31 14:00:00\n", - "39 : predicted = [0.73 0.75 0.87] expected = [0.7188898836168307, 0.7273948075201431, 0.8299015219337511]\n", - "2014-12-31 15:00:00\n", - "40 : predicted = [0.74 0.85 0.96] expected = [0.7273948075201431, 0.8299015219337511, 0.909579230080573]\n", - "2014-12-31 16:00:00\n", - "41 : predicted = [0.83 0.94 0.93] expected = [0.8299015219337511, 0.909579230080573, 0.855863921217547]\n", - "2014-12-31 17:00:00\n", - "42 : predicted = [0.94 0.93 0.88] expected = [0.909579230080573, 0.855863921217547, 0.7721575649059982]\n", - "2014-12-31 18:00:00\n", - "43 : predicted = [0.87 0.82 0.77] expected = [0.855863921217547, 0.7721575649059982, 0.7023276633840643]\n", - "2014-12-31 19:00:00\n", - "44 : predicted = [0.79 0.73 0.63] expected = [0.7721575649059982, 0.7023276633840643, 0.6195165622202325]\n", - "2014-12-31 20:00:00\n", - "45 : predicted = [0.7 0.59 0.46] expected = [0.7023276633840643, 0.6195165622202325, 0.5425246195165621]\n", - "2014-12-31 21:00:00\n", - "46 : predicted = [0.6 0.47 0.36] expected = [0.6195165622202325, 0.5425246195165621, 0.4735899731423454]\n", - "CPU times: user 12min 15s, sys: 2min 39s, total: 14min 54s\n", - "Wall time: 2min 36s\n" - ] - } - ], - "metadata": { - "scrolled": true - } - }, - { - "cell_type": "markdown", - "source": [ - "Compare as previsões com a carga real\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 30, - "source": [ - "eval_df = pd.DataFrame(predictions, columns=['t+'+str(t) for t in range(1, HORIZON+1)])\n", - "eval_df['timestamp'] = test.index[0:len(test.index)-HORIZON+1]\n", - "eval_df = pd.melt(eval_df, id_vars='timestamp', value_name='prediction', var_name='h')\n", - "eval_df['actual'] = np.array(np.transpose(test_ts)).ravel()\n", - "eval_df[['prediction', 'actual']] = scaler.inverse_transform(eval_df[['prediction', 'actual']])\n", - "eval_df.head()" - ], - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
timestamphpredictionactual
02014-12-30 00:00:00t+13,008.743,023.00
12014-12-30 01:00:00t+12,955.532,935.00
22014-12-30 02:00:00t+12,900.172,899.00
32014-12-30 03:00:00t+12,917.692,886.00
42014-12-30 04:00:00t+12,946.992,963.00
\n", - "
" - ], - "text/plain": [ - " timestamp h prediction actual\n", - "0 2014-12-30 00:00:00 t+1 3,008.74 3,023.00\n", - "1 2014-12-30 01:00:00 t+1 2,955.53 2,935.00\n", - "2 2014-12-30 02:00:00 t+1 2,900.17 2,899.00\n", - "3 2014-12-30 03:00:00 t+1 2,917.69 2,886.00\n", - "4 2014-12-30 04:00:00 t+1 2,946.99 2,963.00" - ] - }, - "metadata": {}, - "execution_count": 30 - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Calcular o **erro percentual absoluto médio (MAPE)** para todas as previsões\n", - "\n", - "$$MAPE = \\frac{1}{n} \\sum_{t=1}^{n}|\\frac{actual_t - predicted_t}{actual_t}|$$\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 31, - "source": [ - "if(HORIZON > 1):\n", - " eval_df['APE'] = (eval_df['prediction'] - eval_df['actual']).abs() / eval_df['actual']\n", - " print(eval_df.groupby('h')['APE'].mean())" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "h\n", - "t+1 0.01\n", - "t+2 0.01\n", - "t+3 0.02\n", - "Name: APE, dtype: float64\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 32, - "source": [ - "print('One step forecast MAPE: ', (mape(eval_df[eval_df['h'] == 't+1']['prediction'], eval_df[eval_df['h'] == 't+1']['actual']))*100, '%')" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "One step forecast MAPE: 0.5570581332313952 %\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 33, - "source": [ - "print('Multi-step forecast MAPE: ', mape(eval_df['prediction'], eval_df['actual'])*100, '%')" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Multi-step forecast MAPE: 1.1460048657704118 %\n" - ] - } - ], - "metadata": {} - }, - { - "cell_type": "markdown", - "source": [ - "Trace as previsões vs os valores reais para a primeira semana do conjunto de teste\n" - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 34, - "source": [ - "if(HORIZON == 1):\n", - " ## Plotting single step forecast\n", - " eval_df.plot(x='timestamp', y=['actual', 'prediction'], style=['r', 'b'], figsize=(15, 8))\n", - "\n", - "else:\n", - " ## Plotting multi step forecast\n", - " plot_df = eval_df[(eval_df.h=='t+1')][['timestamp', 'actual']]\n", - " for t in range(1, HORIZON+1):\n", - " plot_df['t+'+str(t)] = eval_df[(eval_df.h=='t+'+str(t))]['prediction'].values\n", - "\n", - " fig = plt.figure(figsize=(15, 8))\n", - " ax = plt.plot(plot_df['timestamp'], plot_df['actual'], color='red', linewidth=4.0)\n", - " ax = fig.add_subplot(111)\n", - " for t in range(1, HORIZON+1):\n", - " x = plot_df['timestamp'][(t-1):]\n", - " y = plot_df['t+'+str(t)][0:len(x)]\n", - " ax.plot(x, y, color='blue', linewidth=4*math.pow(.9,t), alpha=math.pow(0.8,t))\n", - " \n", - " ax.legend(loc='best')\n", - " \n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ], - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "No handles with labels found to put in legend.\n" - ] - }, - { - "output_type": "display_data", - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - } - } - ], - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "source": [], - "outputs": [], - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "kernel_info": { - "name": "python3" - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "nteract": { - "version": "nteract-front-end@1.0.0" - }, - "metadata": { - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - } - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "c193140200b9684da27e3890211391b6", - "translation_date": "2025-09-03T19:53:51+00:00", - "source_file": "7-TimeSeries/2-ARIMA/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/2-ARIMA/working/notebook.ipynb b/translations/pt/7-TimeSeries/2-ARIMA/working/notebook.ipynb deleted file mode 100644 index e2ff6d9d7..000000000 --- a/translations/pt/7-TimeSeries/2-ARIMA/working/notebook.ipynb +++ /dev/null @@ -1,50 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": 3 - }, - "orig_nbformat": 2, - "coopTranslator": { - "original_hash": "523ec472196307b3c4235337353c9ceb", - "translation_date": "2025-09-03T19:55:35+00:00", - "source_file": "7-TimeSeries/2-ARIMA/working/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "Tao Hong, Pierre Pinson, Shu Fan, Hamidreza Zareipour, Alberto Troccoli e Rob J. Hyndman, \"Previsão probabilística de energia: Competição Global de Previsão de Energia 2014 e além\", International Journal of Forecasting, vol.32, no.3, pp 896-913, julho-setembro, 2016.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "pip install statsmodels" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/3-SVR/README.md b/translations/pt/7-TimeSeries/3-SVR/README.md deleted file mode 100644 index 3e2a1cf54..000000000 --- a/translations/pt/7-TimeSeries/3-SVR/README.md +++ /dev/null @@ -1,393 +0,0 @@ - -# Previsão de Séries Temporais com Support Vector Regressor - -Na lição anterior, aprendeste a usar o modelo ARIMA para fazer previsões de séries temporais. Agora vais explorar o modelo Support Vector Regressor, que é um modelo de regressão utilizado para prever dados contínuos. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -Nesta lição, vais descobrir uma forma específica de construir modelos com [**SVM**: **S**upport **V**ector **M**achine](https://en.wikipedia.org/wiki/Support-vector_machine) para regressão, ou **SVR: Support Vector Regressor**. - -### SVR no contexto de séries temporais [^1] - -Antes de compreender a importância do SVR na previsão de séries temporais, aqui estão alguns conceitos importantes que precisas de saber: - -- **Regressão:** Técnica de aprendizagem supervisionada para prever valores contínuos a partir de um conjunto de entradas. A ideia é ajustar uma curva (ou linha) no espaço de características que tenha o maior número de pontos de dados. [Clica aqui](https://en.wikipedia.org/wiki/Regression_analysis) para mais informações. -- **Support Vector Machine (SVM):** Um tipo de modelo de aprendizagem supervisionada usado para classificação, regressão e deteção de outliers. O modelo é um hiperplano no espaço de características, que no caso de classificação atua como uma fronteira, e no caso de regressão atua como a linha de melhor ajuste. No SVM, uma função Kernel é geralmente usada para transformar o conjunto de dados para um espaço com maior número de dimensões, de forma a torná-los mais facilmente separáveis. [Clica aqui](https://en.wikipedia.org/wiki/Support-vector_machine) para mais informações sobre SVMs. -- **Support Vector Regressor (SVR):** Um tipo de SVM, que encontra a linha de melhor ajuste (que no caso de SVM é um hiperplano) com o maior número de pontos de dados. - -### Porquê SVR? [^1] - -Na última lição aprendeste sobre o ARIMA, que é um método estatístico linear muito bem-sucedido para prever dados de séries temporais. No entanto, em muitos casos, os dados de séries temporais apresentam *não-linearidade*, que não pode ser mapeada por modelos lineares. Nestes casos, a capacidade do SVM de considerar a não-linearidade nos dados para tarefas de regressão torna o SVR bem-sucedido na previsão de séries temporais. - -## Exercício - construir um modelo SVR - -Os primeiros passos para a preparação dos dados são os mesmos da lição anterior sobre [ARIMA](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA). - -Abre a pasta [_/working_](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/3-SVR/working) nesta lição e encontra o ficheiro [_notebook.ipynb_](https://github.com/microsoft/ML-For-Beginners/blob/main/7-TimeSeries/3-SVR/working/notebook.ipynb). [^2] - -1. Executa o notebook e importa as bibliotecas necessárias: [^2] - - ```python - import sys - sys.path.append('../../') - ``` - - ```python - import os - import warnings - import matplotlib.pyplot as plt - import numpy as np - import pandas as pd - import datetime as dt - import math - - from sklearn.svm import SVR - from sklearn.preprocessing import MinMaxScaler - from common.utils import load_data, mape - ``` - -2. Carrega os dados do ficheiro `/data/energy.csv` para um dataframe do Pandas e analisa-os: [^2] - - ```python - energy = load_data('../../data')[['load']] - ``` - -3. Faz o gráfico de todos os dados de energia disponíveis de janeiro de 2012 a dezembro de 2014: [^2] - - ```python - energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![dados completos](../../../../7-TimeSeries/3-SVR/images/full-data.png) - - Agora, vamos construir o nosso modelo SVR. - -### Criar conjuntos de treino e teste - -Agora que os dados estão carregados, podes separá-los em conjuntos de treino e teste. Depois vais remodelar os dados para criar um conjunto de dados baseado em passos temporais, que será necessário para o SVR. Vais treinar o teu modelo no conjunto de treino. Após o modelo terminar o treino, vais avaliar a sua precisão no conjunto de treino, no conjunto de teste e depois no conjunto de dados completo para ver o desempenho geral. É importante garantir que o conjunto de teste cobre um período posterior ao conjunto de treino para assegurar que o modelo não obtém informações de períodos futuros [^2] (uma situação conhecida como *Overfitting*). - -1. Aloca um período de dois meses de 1 de setembro a 31 de outubro de 2014 para o conjunto de treino. O conjunto de teste incluirá o período de dois meses de 1 de novembro a 31 de dezembro de 2014: [^2] - - ```python - train_start_dt = '2014-11-01 00:00:00' - test_start_dt = '2014-12-30 00:00:00' - ``` - -2. Visualiza as diferenças: [^2] - - ```python - energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \ - .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \ - .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12) - plt.xlabel('timestamp', fontsize=12) - plt.ylabel('load', fontsize=12) - plt.show() - ``` - - ![dados de treino e teste](../../../../7-TimeSeries/3-SVR/images/train-test.png) - -### Preparar os dados para treino - -Agora, precisas de preparar os dados para treino, realizando filtragem e escalonamento dos dados. Filtra o conjunto de dados para incluir apenas os períodos de tempo e colunas necessários, e faz o escalonamento para garantir que os dados são projetados no intervalo 0,1. - -1. Filtra o conjunto de dados original para incluir apenas os períodos de tempo mencionados por conjunto e apenas a coluna necessária 'load' mais a data: [^2] - - ```python - train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']] - test = energy.copy()[energy.index >= test_start_dt][['load']] - - print('Training data shape: ', train.shape) - print('Test data shape: ', test.shape) - ``` - - ```output - Training data shape: (1416, 1) - Test data shape: (48, 1) - ``` - -2. Escalona os dados de treino para estarem no intervalo (0, 1): [^2] - - ```python - scaler = MinMaxScaler() - train['load'] = scaler.fit_transform(train) - ``` - -4. Agora, escalona os dados de teste: [^2] - - ```python - test['load'] = scaler.transform(test) - ``` - -### Criar dados com passos temporais [^1] - -Para o SVR, transformas os dados de entrada para a forma `[batch, timesteps]`. Assim, remodelas os `train_data` e `test_data` existentes de forma a que haja uma nova dimensão que se refere aos passos temporais. - -```python -# Converting to numpy arrays -train_data = train.values -test_data = test.values -``` - -Para este exemplo, usamos `timesteps = 5`. Assim, as entradas para o modelo são os dados dos primeiros 4 passos temporais, e a saída será os dados do 5º passo temporal. - -```python -timesteps=5 -``` - -Converter os dados de treino para tensor 2D usando list comprehension aninhada: - -```python -train_data_timesteps=np.array([[j for j in train_data[i:i+timesteps]] for i in range(0,len(train_data)-timesteps+1)])[:,:,0] -train_data_timesteps.shape -``` - -```output -(1412, 5) -``` - -Converter os dados de teste para tensor 2D: - -```python -test_data_timesteps=np.array([[j for j in test_data[i:i+timesteps]] for i in range(0,len(test_data)-timesteps+1)])[:,:,0] -test_data_timesteps.shape -``` - -```output -(44, 5) -``` - -Selecionar entradas e saídas dos dados de treino e teste: - -```python -x_train, y_train = train_data_timesteps[:,:timesteps-1],train_data_timesteps[:,[timesteps-1]] -x_test, y_test = test_data_timesteps[:,:timesteps-1],test_data_timesteps[:,[timesteps-1]] - -print(x_train.shape, y_train.shape) -print(x_test.shape, y_test.shape) -``` - -```output -(1412, 4) (1412, 1) -(44, 4) (44, 1) -``` - -### Implementar SVR [^1] - -Agora, é hora de implementar o SVR. Para saber mais sobre esta implementação, podes consultar [esta documentação](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html). Para a nossa implementação, seguimos estes passos: - - 1. Define o modelo chamando `SVR()` e passando os hiperparâmetros do modelo: kernel, gamma, c e epsilon - 2. Prepara o modelo para os dados de treino chamando a função `fit()` - 3. Faz previsões chamando a função `predict()` - -Agora criamos um modelo SVR. Aqui usamos o [kernel RBF](https://scikit-learn.org/stable/modules/svm.html#parameters-of-the-rbf-kernel), e definimos os hiperparâmetros gamma, C e epsilon como 0.5, 10 e 0.05 respetivamente. - -```python -model = SVR(kernel='rbf',gamma=0.5, C=10, epsilon = 0.05) -``` - -#### Ajustar o modelo aos dados de treino [^1] - -```python -model.fit(x_train, y_train[:,0]) -``` - -```output -SVR(C=10, cache_size=200, coef0=0.0, degree=3, epsilon=0.05, gamma=0.5, - kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False) -``` - -#### Fazer previsões com o modelo [^1] - -```python -y_train_pred = model.predict(x_train).reshape(-1,1) -y_test_pred = model.predict(x_test).reshape(-1,1) - -print(y_train_pred.shape, y_test_pred.shape) -``` - -```output -(1412, 1) (44, 1) -``` - -Construíste o teu SVR! Agora precisamos de avaliá-lo. - -### Avaliar o modelo [^1] - -Para avaliação, primeiro vamos escalonar os dados de volta para a escala original. Depois, para verificar o desempenho, vamos fazer o gráfico da série temporal original e prevista, e também imprimir o resultado do MAPE. - -Escalona os dados previstos e originais: - -```python -# Scaling the predictions -y_train_pred = scaler.inverse_transform(y_train_pred) -y_test_pred = scaler.inverse_transform(y_test_pred) - -print(len(y_train_pred), len(y_test_pred)) -``` - -```python -# Scaling the original values -y_train = scaler.inverse_transform(y_train) -y_test = scaler.inverse_transform(y_test) - -print(len(y_train), len(y_test)) -``` - -#### Verificar o desempenho do modelo nos dados de treino e teste [^1] - -Extraímos os timestamps do conjunto de dados para mostrar no eixo x do nosso gráfico. Nota que estamos a usar os primeiros ```timesteps-1``` valores como entrada para a primeira saída, então os timestamps para a saída começarão depois disso. - -```python -train_timestamps = energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)].index[timesteps-1:] -test_timestamps = energy[test_start_dt:].index[timesteps-1:] - -print(len(train_timestamps), len(test_timestamps)) -``` - -```output -1412 44 -``` - -Faz o gráfico das previsões para os dados de treino: - -```python -plt.figure(figsize=(25,6)) -plt.plot(train_timestamps, y_train, color = 'red', linewidth=2.0, alpha = 0.6) -plt.plot(train_timestamps, y_train_pred, color = 'blue', linewidth=0.8) -plt.legend(['Actual','Predicted']) -plt.xlabel('Timestamp') -plt.title("Training data prediction") -plt.show() -``` - -![previsão dos dados de treino](../../../../7-TimeSeries/3-SVR/images/train-data-predict.png) - -Imprime o MAPE para os dados de treino - -```python -print('MAPE for training data: ', mape(y_train_pred, y_train)*100, '%') -``` - -```output -MAPE for training data: 1.7195710200875551 % -``` - -Faz o gráfico das previsões para os dados de teste - -```python -plt.figure(figsize=(10,3)) -plt.plot(test_timestamps, y_test, color = 'red', linewidth=2.0, alpha = 0.6) -plt.plot(test_timestamps, y_test_pred, color = 'blue', linewidth=0.8) -plt.legend(['Actual','Predicted']) -plt.xlabel('Timestamp') -plt.show() -``` - -![previsão dos dados de teste](../../../../7-TimeSeries/3-SVR/images/test-data-predict.png) - -Imprime o MAPE para os dados de teste - -```python -print('MAPE for testing data: ', mape(y_test_pred, y_test)*100, '%') -``` - -```output -MAPE for testing data: 1.2623790187854018 % -``` - -🏆 Obtiveste um resultado muito bom no conjunto de dados de teste! - -### Verificar o desempenho do modelo no conjunto de dados completo [^1] - -```python -# Extracting load values as numpy array -data = energy.copy().values - -# Scaling -data = scaler.transform(data) - -# Transforming to 2D tensor as per model input requirement -data_timesteps=np.array([[j for j in data[i:i+timesteps]] for i in range(0,len(data)-timesteps+1)])[:,:,0] -print("Tensor shape: ", data_timesteps.shape) - -# Selecting inputs and outputs from data -X, Y = data_timesteps[:,:timesteps-1],data_timesteps[:,[timesteps-1]] -print("X shape: ", X.shape,"\nY shape: ", Y.shape) -``` - -```output -Tensor shape: (26300, 5) -X shape: (26300, 4) -Y shape: (26300, 1) -``` - -```python -# Make model predictions -Y_pred = model.predict(X).reshape(-1,1) - -# Inverse scale and reshape -Y_pred = scaler.inverse_transform(Y_pred) -Y = scaler.inverse_transform(Y) -``` - -```python -plt.figure(figsize=(30,8)) -plt.plot(Y, color = 'red', linewidth=2.0, alpha = 0.6) -plt.plot(Y_pred, color = 'blue', linewidth=0.8) -plt.legend(['Actual','Predicted']) -plt.xlabel('Timestamp') -plt.show() -``` - -![previsão dos dados completos](../../../../7-TimeSeries/3-SVR/images/full-data-predict.png) - -```python -print('MAPE: ', mape(Y_pred, Y)*100, '%') -``` - -```output -MAPE: 2.0572089029888656 % -``` - -🏆 Gráficos muito bons, mostrando um modelo com boa precisão. Excelente trabalho! - ---- - -## 🚀Desafio - -- Tenta ajustar os hiperparâmetros (gamma, C, epsilon) ao criar o modelo e avalia os dados para ver qual conjunto de hiperparâmetros dá os melhores resultados nos dados de teste. Para saber mais sobre estes hiperparâmetros, podes consultar o documento [aqui](https://scikit-learn.org/stable/modules/svm.html#parameters-of-the-rbf-kernel). -- Experimenta usar diferentes funções kernel para o modelo e analisa os seus desempenhos no conjunto de dados. Um documento útil pode ser encontrado [aqui](https://scikit-learn.org/stable/modules/svm.html#kernel-functions). -- Tenta usar diferentes valores para `timesteps` para o modelo olhar para trás e fazer previsões. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão & Estudo Individual - -Esta lição foi para introduzir a aplicação de SVR na previsão de séries temporais. Para saber mais sobre SVR, podes consultar [este blog](https://www.analyticsvidhya.com/blog/2020/03/support-vector-regression-tutorial-for-machine-learning/). Esta [documentação sobre scikit-learn](https://scikit-learn.org/stable/modules/svm.html) fornece uma explicação mais abrangente sobre SVMs em geral, [SVRs](https://scikit-learn.org/stable/modules/svm.html#regression) e também outros detalhes de implementação, como as diferentes [funções kernel](https://scikit-learn.org/stable/modules/svm.html#kernel-functions) que podem ser usadas e os seus parâmetros. - -## Tarefa - -[Um novo modelo SVR](assignment.md) - -## Créditos - -[^1]: O texto, código e saída nesta seção foram contribuídos por [@AnirbanMukherjeeXD](https://github.com/AnirbanMukherjeeXD) -[^2]: O texto, código e saída nesta seção foram retirados de [ARIMA](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/3-SVR/assignment.md b/translations/pt/7-TimeSeries/3-SVR/assignment.md deleted file mode 100644 index cee2a7f18..000000000 --- a/translations/pt/7-TimeSeries/3-SVR/assignment.md +++ /dev/null @@ -1,27 +0,0 @@ - -# Um novo modelo SVR - -## Instruções [^1] - -Agora que já construiu um modelo SVR, crie um novo com dados frescos (experimente um destes [conjuntos de dados da Duke](http://www2.stat.duke.edu/~mw/ts_data_sets.html)). Documente o seu trabalho num notebook, visualize os dados e o seu modelo, e teste a sua precisão utilizando gráficos apropriados e MAPE. Experimente também ajustar os diferentes hiperparâmetros e usar valores diferentes para os timesteps. - -## Rubrica [^1] - -| Critérios | Exemplar | Adequado | Necessita Melhorias | -| --------- | ------------------------------------------------------------ | --------------------------------------------------------- | ----------------------------------- | -| | Um notebook é apresentado com um modelo SVR construído, testado e explicado com visualizações e precisão declarada. | O notebook apresentado não está documentado ou contém erros. | Um notebook incompleto é apresentado | - -[^1]: O texto nesta seção foi baseado na [tarefa de ARIMA](https://github.com/microsoft/ML-For-Beginners/tree/main/7-TimeSeries/2-ARIMA/assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/3-SVR/solution/notebook.ipynb b/translations/pt/7-TimeSeries/3-SVR/solution/notebook.ipynb deleted file mode 100644 index 9affad2d7..000000000 --- a/translations/pt/7-TimeSeries/3-SVR/solution/notebook.ipynb +++ /dev/null @@ -1,1019 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "fv9OoQsMFk5A" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Neste caderno, demonstramos como:\n", - "\n", - "- preparar dados de séries temporais 2D para treinar um modelo de regressão SVM\n", - "- implementar SVR utilizando o kernel RBF\n", - "- avaliar o modelo utilizando gráficos e MAPE\n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Importar módulos\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import sys\n", - "sys.path.append('../../')" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": { - "id": "M687KNlQFp0-" - }, - "outputs": [], - "source": [ - "import os\n", - "import warnings\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import pandas as pd\n", - "import datetime as dt\n", - "import math\n", - "\n", - "from sklearn.svm import SVR\n", - "from sklearn.preprocessing import MinMaxScaler\n", - "from common.utils import load_data, mape" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Cj-kfVdMGjWP" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8fywSjC6GsRz" - }, - "source": [ - "### Carregar dados\n" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "aBDkEB11Fumg", - "outputId": "99cf7987-0509-4b73-8cc2-75d7da0d2740" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2012-01-01 00:00:002698.0
2012-01-01 01:00:002558.0
2012-01-01 02:00:002444.0
2012-01-01 03:00:002402.0
2012-01-01 04:00:002403.0
\n", - "
" - ], - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2698.0\n", - "2012-01-01 01:00:00 2558.0\n", - "2012-01-01 02:00:00 2444.0\n", - "2012-01-01 03:00:00 2402.0\n", - "2012-01-01 04:00:00 2403.0" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "energy = load_data('../../data')[['load']]\n", - "energy.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "O0BWP13rGnh4" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 486 - }, - "id": "hGaNPKu_Gidk", - "outputId": "7f89b326-9057-4f49-efbe-cb100ebdf76d" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "IPuNor4eGwYY" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "id": "ysvsNyONGt0Q" - }, - "outputs": [], - "source": [ - "train_start_dt = '2014-11-01 00:00:00'\n", - "test_start_dt = '2014-12-30 00:00:00'" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 548 - }, - "id": "SsfdLoPyGy9w", - "outputId": "d6d6c25b-b1f4-47e5-91d1-707e043237d7" - }, - "outputs": [ - { - "data": { - "image/png": "iVBORw0KGgoAAAANSUhEUgAAA4kAAAITCAYAAACqpFnEAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjQuMywgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/MnkTPAAAACXBIWXMAAAsTAAALEwEAmpwYAAEAAElEQVR4nOz9d7gkyVUmjL+RmVV1bdvpHitpRiOLJCQhCdCHkxAsEny4FQiz2mXNhzD74yfWsAgjFrMLfBghBAtIeCuMkLBCFllkRjNyYzTe9vS073v7+qrKjO+PyBMZmRURGSdv3+rb3fE+Tz/3dt2Kyqw0kXHO+573CCklIiIiIiIiIiIiIiIiIiIAILnQOxARERERERERERERERGxexCDxIiIiIiIiIiIiIiIiAiNGCRGREREREREREREREREaMQgMSIiIiIiIiIiIiIiIkIjBokRERERERERERERERERGjFIjIiIiIiIiIiIiIiIiNDILvQOXAhcccUV8vrrr7/QuxEREREREREREREREXFBcMstt5ySUh6y/e2yDBKvv/563HzzzRd6NyIiIiIiIiIiIiIiIi4IhBAPuf4W5aYRERERERERERERERERGjFIjIiIiIiIiIiIiIiIiNCIQWJERERERERERERERESExmVZkxgRERERERERERERcXljNBrhyJEj2NzcvNC7sqOYmZnBddddh16vFzwmBokREREREREREREREZcdjhw5gsXFRVx//fUQQlzo3dkRSClx+vRpHDlyBDfccEPwuCg3jYiIiIiIiIiIiIi47LC5uYmDBw9esgEiAAghcPDgQTZbGoPEiIiIiIiIiIiIiIjLEpdygEjo8h1jkBgRERERERERERERETFlLC0t4Td+4zfY4772a78WS0tL53+HDMQgMSIiIiIiIiIiIiIiYspwBYnj8dg77u1vfzv27du3Q3ulEI1rIiIiIiIiIiIiIiIipozXvOY1uO+++/Cc5zwHvV4PMzMz2L9/P+68807cfffd+KZv+iY88sgj2NzcxKtf/Wq86lWvAgBcf/31uPnmm7G6uoqXvexl+NIv/VJ85CMfwbXXXou//du/xezs7Lb3LQaJERERERERERERERGXNX7q72/HHUfPndfP/Lxr9uB/fv0znH//+Z//edx222349Kc/jfe///34uq/7Otx2223ahfT3fu/3cODAAWxsbOAFL3gBXv7yl+PgwYO1z7jnnnvw5je/Gb/927+NV7ziFfjrv/5rvPKVr9z2vscgMSIiIiIiIiIiIiIi4gLjC7/wC2ttKt7whjfgbW97GwDgkUcewT333DMRJN5www14znOeAwB43vOehwcffPC87EsMEiMiIiIiIiIiIiIiLmv4GL9pYX5+Xv/+/ve/H+95z3vw0Y9+FHNzc3jRi15kbWMxGAz072maYmNj47zsSzSuiYiIiIiIiIiIiIiImDIWFxexsrJi/dvy8jL279+Pubk53HnnnfjYxz421X2LTGJERERERERERERERMSUcfDgQXzJl3wJnvnMZ2J2dhZXXnml/ttLX/pS/NZv/Rae/vSn46lPfSq++Iu/eKr7JqSUU93gbsDzn/98efPNN1/o3YiIiIiIiIiIiIiIuED43Oc+h6c//ekXejemAtt3FULcIqV8vu39UW4aERERERERERERERERoRGDxIiIiIiIiIjLFv/pDz6BZ/3kOy/0bkRERETsKkw9SBRCPFkIsSmE+JPy/y8SQhRCiFXj33cZ7z8ghHibEGJNCPGQEOI7G5/3neXra0KIvxFCHJj2d4qIiIiIiIi4OPHeO09gZXN8oXcjIiIiYlfhQjCJ/wfAJxqvHZVSLhj//rDx/iGAKwH8GwC/KYR4BgCUP98I4N+Wf18H8Bs7/QUiIiIiIiIiLi1cjh4NERERES5MNUgUQnw7gCUA7w18/zyAlwN4rZRyVUr5YQB/BxUUAipo/Hsp5QellKsAXgvgXwshFs/7zkdERERERERcstgcFRd6FyIiIiJ2DaYWJAoh9gD4aQD/1fLnw0KI40KIB4QQv1IGhwDwFABjKeXdxns/A4C6XT6j/D8AQEp5HxTr+BTL9l8lhLhZCHHzyZMnz8M3ioiIiIiIiLhUsLQxvNC7EBEREbFrME0m8WcA/K6U8kjj9TsBPAfA1QC+EsDzALyu/NsCgHON9y8DWDT+vuz5u4aU8k1SyudLKZ9/6NChrt8hIiIiIiIi4hLE2bXRhd6FiIiIywxLS0v4jd/oVin3+te/Huvr6+d5jypMJUgUQjwHwFcB+JXm36SUx6SUd0gpCynlAwD+B5TEFABWAexpDNkDYCXw7xERERERERERrYhMYkRExLSxm4PEbMc+uY4XAbgewMNCCEAxgKkQ4vOklF/QeK9EFbzeDSATQjxZSnlP+dqzAdxe/n57+X8AgBDiiQAG5biIiIiIiIiICC8SARQSWF6PTGJERMR08ZrXvAb33XcfnvOc5+Crv/qrcfjwYfzlX/4ltra28M3f/M34qZ/6KaytreEVr3gFjhw5gjzP8drXvhbHjx/H0aNH8eIXvxhXXHEF3ve+9533fZtWkPgmAH9u/P+/QwWN3yeEeDGA+wE8DOA6AD8P4G8BQEq5JoR4K4CfFkL8P1Cy1G8E8H+Vn/OnAD4qhPgyAJ+Eqnl8q5QyMokRERERERERrZjvZ1jZGmNpIwaJERGXNf7pNcCxW8/vZ171LOBlP+/888///M/jtttuw6c//Wm8613vwlve8hbcdNNNkFLiG77hG/DBD34QJ0+exDXXXIN//Md/BAAsLy9j7969eN3rXof3ve99uOKKK87vPpeYitxUSrleykqPSSmPQclEN6WUJwE8F8BHAKyVP28F8P83hn8/gFkAJwC8GcD3SSlvLz/3dgDfCxUsnoCqRfz+aXyniIiIiIiIiIsfWSoAAJuj/ALvSURExOWMd73rXXjXu96F5z73ufiCL/gC3HnnnbjnnnvwrGc9C+9+97vxwz/8w/jQhz6EvXv3TmV/psUk1iCl/Enj99ehMqqxvfcMgG/y/P3PAPzZedy9iIiIiIiIiMsEZRkMhuPYAiMi4rKGh/GbBqSU+JEf+RF8z/d8z8TfPvnJT+Ltb387fvzHfxwveclL8BM/8RM7vj9T7ZMYEREREREREbGbkKgYEVsxSIyIiJgyFhcXsbKiquS+5mu+Br/3e7+H1dVVAMCjjz6KEydO4OjRo5ibm8MrX/lK/NAP/RA++clPTozdCVwQJjEiIiIiIiIiYjegkOpnZBIjIiKmjYMHD+JLvuRL8MxnPhMve9nL8J3f+Z144QtfCABYWFjAn/zJn+Dee+/FD/3QDyFJEvR6Pfzmb/4mAOBVr3oVXvrSl+Kaa665qI1rIiIiIiIiIiJ2HUa5Cg6HeQwSIyIipo8/+7N61dyrX/3q2v9vvPFGfM3XfM3EuB/4gR/AD/zAD+zYfkW5aURERERERMRlCx0kRiYxIiIiQiMGiRERERERERGXLca50pvGmsSIiIiICjFIjIiIiIiIiLgsIaXEuCxKjExiRERERIUYJEZERERERERclhiVLCIAbI1jn8SIiMsRUsr2N13k6PIdY5AYERERERERcVliZJjVRCYxIuLyw8zMDE6fPn1JB4pSSpw+fRozMzOscdHdNCIiIiIiIuKyxNhgEqO7aUTE5YfrrrsOR44cwcmTJy/0rvCweQ4YrQGLVwe9fWZmBtdddx1rEzFIjIiIiIiIiLgsMSoikxgRcTmj1+vhhhtuuNC7wcdP7lU//+cSIMSObCLKTSMiIiIiIiIuS0S5aURExEWNrZUd++gYJEZERERERERclohy04iIiIsaazsnk41BYkRERERERMRliWFkEiMiIi5GzOxTP9dP79gmYpAYERERERERcVmCmMQsEdiKQWJERMTFgtl96ufaqR3bRAwSIyIiIiIiIi5LUE3iXD+NTGJERMTFg9n96ud6DBIjIiIiIiIiIs4rKEhcGGSRSYyIiLh4QEFiZBIjIiIiIiIiIs4vxoWSm84NMgzHOWvs0aUNrG2Nd2K3IiIiIvxI++rnaGPHNhGDxIiIiIiIiIjLElSTONdP2e6m/9fP/zO+47c/thO7FREREeFHUSa1xps7tokYJEZERERERERcliikChJnsm41iZ89sny+dykiIiKiHZKCxK0d20QMEiMiIiIiIiIuS+Sl3HTQS1BIoChky4j6uIiIiIgLgqKUukcmMSIiIiIiIiLi/CIvmcRBlgIARkUYmxidUCMiIi4oaK6KTGJERERERERExPlFYTCJQFWj2IbNEc/kJiIiIsKGzVGOt9xyBFIy1QlTYBKzHfvkiIiIiIiIiIhdDC03zZhBItMJNSIiIsKG33j/fXjDe+/BXD/F1z7r6vCBsSYxIiIiIiIiImJnUHSUm26Notw0IiJi+9gqVQkPnFrjDYw1iRERERERERE2vOO2Yzi7NrzQu3FRg7peRCYxIiLiQuCKhQEA4NQqkxEsOjKJSw8D62eC3hqDxIiIiIiIiIsM5zZH+N4/uQX//vdvutC7clFDG9eUNYmjwF6Jm5FJjIiIOA/YN9cDAJxaZSb8uvZJfP2zgNd/ftBbY5AYERERERFxkYEYr1sfjX36tgNtXFPKTceBrS22onFNRETEecSpFSYjSDWJeQc1yXAl6G0xSIyIiIiIiLjIMC4Zr9iur8IoL3D38bDFD2HSuCaQSYwtMCIiIs4DqC6aLzeNNYkRERERERERDQwDg5nLCa979934V7/yQZYBRDNIHMUWGBEREVMETeUb3Dmla00iAzFIjIiIiIiIuMgQarByOeGOo+cAAA+cWg0eQzWJMz2Smwa6m0YmMSIi4jyA5qCcKwvpWpPIQAwSIyIiIiIiLjKEBjOXEw7M9wEAZ9ZGwWMikxgREXEhQXXRofXQGrFPYkREREREREQTw3G1oGBnoC9R7J9TQeLSeriRg+6TSExioIzXNK4p4vGPiIjoCJq/+UxirEmMiIiIiIiIaMBkErdizz4AwP7SSv4Mo3fkhHFN4ELNbIER60MjIiK6otiu3DQfAjukLIlBYkRERERExEUGs5/fVuzZBwDolYHeWQaTSAszqkkM7ZNoBubx+EdERHRFZyZRGsnBPFByygwmY5AYERERERFxkcGsnYtMlgItsjhMopab6hYYYQu14TgyuREREdsHGdew68wLY94JlZwW4fXaQAwSIyIiIiIiLjqYjNcwOm0CqGoDNxnMHh3GSm4aNtaUpXK2FxEREWGi6FyTmAPZrPo9Dwz+Qt9XIgaJERERERERFxlMxisyWQoUuIVKRgGTSSS5adhCzVzQjaLTbEREREfQdNXJuKZHQWKgeoLMbgIRg8SIiIiIiIiLDKbENPbsU6CAj8OsauOaXncmMfasjIiI6AqSmxaS6ZQsc6A3p34PbYMRg8SIiIiIiIhLG2ZgMg256TgvsDHc3YwlBXybDGaVxvRTXp/EGpMYa0IjIiI6wgwMWfXlNSYxUEZqBomyfa6LQWJERERERMRFhtGUmcRX//mn8fSfeMeOb2c7oIw8p0awkBJCAH2mcY0ZJLKbYEdERESUGHcJEknxwJWbmsFkAKsYg8SIiIiIiIiLDNM2rvnHWx8DAJxeDZQ1XQBQRp5To5kXEqkQyBIBoKvcNDKJERER3VDIDqoQCvDYNYlGkBggUY1BYkRERERExEWG0ZTlpocXBwCAu4+v7vi2umLcxd1USiSJQMaWm1bbCB0TYccjZ9bxvjtPXOjdiIi4IDBVCcFzOfVIZAeJZm/F9jExSIyIiLgosTHM8fr33B2dHSMuS5iM1zTkpk88NA8AuOfEyo5vqyuqFhjhc0JRMom9tGQSA1nBGpMY3U23hX//+zfhP/zBJ1jnbdo4szbE/3nfvXwHyoiIFnQKEjWTWBrXdJGbRiYxIiLiUsUffORBvP499+APP/Lghd6ViIipw1xMDPOdX1wfnFdM4qnV8Eb10wbVJHKC5nEhkSYCWZLo/4egiO6m5w3E/N7x2LkLvCdu/NK77sIvvvMuvPuO4xd6VyIuMZhy02ATrKLBJI47yE3zGCRGRERcoiCjiaNLmxd4TyIipo9xl+zztrantrGb2R5aXw3HRbCVfFEGicQkhi7SxtHd9Lzh6VfvAQDcemT5Au+JGzNlH82HTq9d4D2JuNRgMonBCa5mkNilT2JAYBmDxIiIiIsSVyz0AQAnmUYa/3LvKfzMP9yxE7sUETE1jKfsbkps2W5ug1F0WGzlUgWJQgikiYjuphcAh8p616NLG6xx77r9GG564MxO7NIErtk3AwB4lLmPERFtqBnXhCacdE0iyU0D10G5ESRGJjEiIuJSBfU1O7nCCxL/ze98HL/74Qd2NSMSEdGG4bT7JJaB0MYuvm/GtSAxbD/zAkiEYhGzRLCYRC77GGFH5UrLO46v+uNb8Io3fnQndmkC5H776NkYJEacX2yvJpHbJ9GsSYxMYkRExCUKqj86xQwS9872AABHpvCwH44LfOdvfwyffPjsjm8r4vLC1JnEi0BuambkQx1OldxU/d5LE1ZNIkkQo5nJ9tCllnTaoOvi9BqvJvevbzmCH33brTuxSxGXCMwcE78mkWlcY8pNi/bAMgaJERERFyVoYXaKKTe9eq+SDT1ydv2871MTD5xaw0fuO40ffstnd3xbEZcXRnmBmZ56hE9jcU1tHnZzkJh3YRKlcjcFACHqgaYP40Ji0FNBYjSu2R5yzSTu3muLrn8ZeH0Q/ttffQZ/9vGHd2KXIi4RdOqT2GyBEeBUCqAhN41BYkRExCUKWlhwe5TpIPHMzgeJxFDkzIVFREQbRrlEP03QT5OpyE3zi0BumndkEpNSSpgmItjwJi+kDtJHsQXGtjDuKDedJoi570oa7+bkSsSFRTe5aZNJDJWbju2/OxCDxIiIiIsSNLFypV7755ThzWPLO++KSrsWuvCMiAjFKC/QSxP0s+kEibRI5hrX3PLQGdx/cnUndmkC5n0Wuign4xoASIUIDgLGRYGZyCSeF+iaxI6BFJfd64JRx+cNgat4mSbe+skjuP41/4i1rfagIeL8w0xujUKvLwoSs5nyQwKvL1NiGoPEiIiISxUk0eA2sqas9TQeiLR4j0xixPnGOJfopQkGWTIVmV4lN+Xdby//zY/iK3/5AzuxSxMYdwkSC1NuKoLv1aIABmUbnmhcsz3QHN6VSZwGu01JkmD3yRKUgDjBrJ2fJt70wfsBAA/G9h4XBEUhq7lkp41rzPdFuWlERMSlCloQchO7uQ4Sd35hQYv3qEaLON8YFUXZ3y+ZSpBC981uls2ZTGKoDL2Qptw0nJWqMYnMSWh5PXBBd5mALt8tZgKCsDSF40nnmMva759TRmlcF+4uWN4Y4cW/9H7cfpTXb5LM3OJ1eWGQG0FicNKbahKzASAShnGNMX9HJjEiIuJSRVcJJy2o14c7zyRSZjy6H0acb1AT+CwN7+23HVDd3cVSkxgaOJtMYiJE8L1q1iSOGUH6Zx5ZwrN/+l34x88+FjzmUkeumcTwa8sM5pc3dj64oeuJGyTuK8sbpsEkfuKBM3jg1Bp+6Z13scZRCcbSFI5jxCQKKXXCaRg6l1OAl2RA2g83rqnJTSOTGBERcYmia+Cl5aZTaAq+FeWmETuEXKJiEqeQhKBAlBMkTrsWNy+k7p8aKgvMC2gmMWHVJEoMyhYYHPOsO4+dAwC8764TwWMuddDh48hNzfl/GkEiXf9cafd8X10j0yhvWJzJAAArm7xt7SvZzjPM9h4R5wd5ITHoceWm5ftECqSDjnLTyCRGRERcouhKnnStSXz49DpOnOOZ3VDWeRrGChGXFwopkQiglwoWk9UVtA2O3HRzyi0NVEaeVydYyKpPYpKEB7Z5IZElAmkiWHXR/VJWNg2zoYsFeYeaRDMwn2afUO55owREVyktB73y2uIGiXtKueluNte5lJFL6J6rwXOJZhJTIO117JMYg8SIiIhLFLkxmXJYRVrscoPEL//F9+ELf/a9rDFRbhqxUygKiUQIZMl0ahLHuiaxCA6kplH3a2KcV7KtLnJT5W7KCBJTgSzhyX17aTezm1seOoMfePOnLkmnZM3SMRIQJlPc1RWVAwpKucY12rl1CgkTes6sbHZjVmOQeGFQmExi6FxCNYlJquSmwe6mZpAY5aYRERGXKMxnNSe7S4vd9SnITYcxSIzYIeRlTWIvFSy544mVTfz3v/oMu5VFzTk0cMHL3cZ2Ydb2dDGuSYQIViio45+UxkHhxz8rt8VlpL7nj2/B33/m6CW5kKfAnMMImsePG7h1ASUXR7lkBeqjnP/duoISD1wmkcYtb8QWGBcCeU26zmUSMyDNuvVJjO6mERERlyrMjD8rSJyqcU3pbhpjxIjzDCU3FcjShCV3/JV334O33HIEf/PpR1nbMxcvoffb+mi6i85ag/suxjVJOJM4LiRSAWUcxDj+w46MFBmgnL4E68bGBT+Q6nI9Ela3xuwSADNJwjl34w6mPF2hmUSmSoaY3OGU5eERCrmspOvhQWJ5rkSqAsUi8NxFd9OIiIjLAabEaysPf7httwUGpyaL6lAikxhxvlFjEsfh19dsybStMtmGvJCYK004goPEKTOJuUTFJAbu47g8jgCQCF5NYpokpdw3/PjTseMyS/tmp9dKYdroIsnsGiQurQ/xzP/5TrzhvfeG7yAaz5sOypVp1CR2dTnuWm8ZcX5QGHN58DmkYC/JVKAoQ4PEWJMYERFxGSDvyCSODJfGLsHbY8vh5jWUcY7uphHnG7lUzJdyNw2//hfIAbED20BBYugi2ZSbTsO8qSja5abL66NaPXJRCxKZNYl6YceXSbL77c0rJpEbJN70wBl87P7TrDHTBgVSo1wGz8lmkMgJ2lbLc//HH3uIsYd1QxGecmX6clP+uG77eMtDZ/Hhe0512mZEhVyWQWKShLPUuiYx6c4kRrlpRETEpQoz4895aJuLkC6S0+MMh1PKHl+KZhMRFxZSlnJHpnHK4kAFiVwmcVQUmOursaGLUZNJnErdWGH2G5vc3tY4x7N/+l34j3/wCf0aLdAA6pMYvq00LftUMu5vkvR1bcrO7bf3ijd+FN/+po+xxkwb5pwcyiYOx93mf8oBnFnjHUcz6cCSm+bTl5t2HccNEl/+mx/BK3/34522GVGBTMh6WcJgEsv5W6TKvCY0SJRRbhoREXEZoMYkMh7aJuvSxViDM2ZYymDHRXiGPCIiBDktLFKeu2lZfofVrXAHxKKQkBKV3DQ4SKwWIZvDnQ8Si0JiJnPXJL77juMAgI8/cKY2JiF300QEM555USDt4C471AYovONBrqgnVnhteC4G1ILEQFlmTW7Kmf/L93Kn465M4qhjANYFXful0jGJctMLA5K8Z11qEpMMEAlTbiqM3/2IQWJERMRFifw8MIld2A1OM3FzwTONTHLE5YO8kJXclHEd02J1lSE3pcTKLLMm0UyoTKNnYi6rthS2Y3LOcG+kxuF1JjFcGm4u7DgJIC03Zc499H24DPDFgC5zcle5KYf1rW9ve88bbk3i8saIVf8OoCZ75qhXKklsfEZdCFT15Yz6ZrMFBldummTqX5SbRkREXKroGiSOc9nZhh7gGdfUe3nFLG3E+UMhlSsnX+7It8mnReQ8U25qJlSm0Q6jqLGrk8fE7K16x9Fz5WvQTKJyNw3fVpYod9kuxjWhxjqEada2TRtmYB56bZlzK68mvdvxG+fdEn6jjnLTZ//Uu/CKN36UNWb7Dqzdjs006o0vZdBcrtoZdWASkzSIFVTjxuWYXuyTGBERcemic5BYFJoRCV3cmQ/BrkziNJiUiMsHZvaZU5NIi0dO0EaLz1mmcY15j06NSSzNZGxzgnm/3350GYBqxE5tMxIhghkYqknsMVtgbJHclMlo0fu57NLFADNxFzonj2puo4xr2RjHCW7GRbfk4naC+88eWWa9v+bAykhK0v3dVW56KSYuponaXB46l+gWGAnT3TRXQWXaC2IfY5AYERFxUaJWx8IyEqhcGkOzduaCZJPx8DUXL5xxERFtqNxNBYs10ExWB/MNbgsM8x6dBpM4zpUEt5/ZJbi0P4szGe54TDGJm6NctwVJme6mqVC9zbrITbmMFjGPmx0X5Lu53qyQleFQqFOsycRyk4QEXl9GfgsYc3vTOP7178YPnLsGe2tMp+SIOopyLs/SpGbI5B9UHnOSjoYGl7IMEpM0yk0jIiIuXXRtgTEupHZpDF1cmw9fTia/HlxeegxAxIVD5W6asFow0OJxyGAfiWmo3E0DA6mO92hXVLIte5BI3+Pzr9uLOx9bAaCUARSgCBHuEEnMUteaRLbclCSBHeeRLk7O04JypVXL0S41iV1aIAG8OXmcF5gvnYFZSckpGtd07eWoJbEdry1OfXPEJFTCCehzVAm1msTELTddPQl85i8qW98oN42IiLgc0LUFxjgv2A23uy4sanK7GCRGnEeQu2nGacCMbkzWqCOTaN6j01gkk2wrS4W3JvHGQwt45Ow6pJTYHFXyc+Vu2r4d+l5pkiARvJpQOpacOkbz/V2ZxLUpMLldURQSg4yYxLDjUqtJZCpJCBx1h0ou8pl0up6mYQrTmUkkuWnHek1OfXPEJMiELOOYkJlMok9uetObgLe9CvjYb5TjcvX+tBfdTSMiInY/pJT45Xfdhdse5dVfdK1JHJkP+1Am0XgfK/tcdFuQRFxe+KV33oX/9Q93sMbQwqKfMhowo1uQmGsmkSfTHne8R7uikJXjq+2Y0P48/sAc1oc5zqwNFZOYVTWJIe6m9DlZ2SeR4yRpupvyauK2x/bsZknguJAY9NytS2ygoHm2l7Lq70adVSEFFohJDE4udpO2djWC6VoWQdfzKO/Wqmk3X1sXA2rGNcFyU6pJJHdTxzkYrqqfD5cmSJpJTIE8BokRERG7HFvjAr/2z/fiW3+L5+SWFxK9tDQSYC54t7PY5RjXmPVN0bgmwoVff9+9+J0PP4CzZVuGEHR2NyUmq4NEj9sC40IwiVkZONu+n2JfgccdmAMA3H9qDQAwU34v5W7afixpIZ0IwWYSzbmKxUCO+bJFM9jYzQt51d+SZyZGc/f8IOvMJLJaZ+RGmULgOPP8cgLZrj11u7Z3GneU7hKi3HR7qLXA4BrXUH2hy4RmVfWGxcZSNS5Jo9w0IiLi4gBlc7lSl9wwOwh9sEmpMqWzehxvQQLwM7SDkqXoygBEXD745MNng9+rpZVJUsraAmV6mskKX4jS4pNaYITWZNVqEvNpyO3MFhh2JjFLEly3fxYAcO8JlWWnACURYf3liNWjmsRQsxugPlexJL8dmEQzSFnb2r3zz7iQhuM0zxRprp+yyw0IPFVIgfkB73lD25rvp9ga58H3aNdejrU2HZznVEenWEIMErcHUwERPCc0+yRKx7jVE+rn+plqHLmbRuOaiIiI3Q4OM2eiHuzxMrvcBYn5EGUxiYXUZgdRbhrhQtmmj3WNkCNePyOZXtjCcmsbclMyFwllIacuN9UZeTu7N84LpInA1XtVkPggMYk1d9OQ7aifaaLcTTk1oSZ7FSwtQzUHcWoSzWO+mxfyuWFcE2rc0TVINFuPcE3IZjWTGDZOGz4NMhQyPPir9dfl9GQsugV7JnvFSbgSYr399kBOyT1OfXmtJtFnXENM4tlqnHZEjS0wIiIidjnIGp9bh1HILrWF3WqrarUlHbPP8UEa4QL1X+Ms7Artbkr95cKu5S41icSUaeY+cOzU5aaykm3ZFrvjQiJLBfbN9pAI4NGlDQDAbF8thYQIcyqlRXWWdm+BAfDUE10cKEcdWbOukFLirmMr7HG5rOSmoeqOKnGRMts9GMeEcU0WhcQc8/qn5w23ltEMFDgMcN7xfusiwR1uU6IaUaEy3GLUl9dqEj1y0xVLkKjrGCOTGBERscvRlUkc55XcNHThRFnq2R6vtqSrIUBRGBK9+CCNcCBLSkky4xqp3E1LBobpCtmFSeQy93lRsaTTMa5R2/P1ScwSgSQR2D/Xx9EySKQAJU0QJB2lxNZML1VyX47c1NivLg6zXZnErvMsB2/71KP4mtd/EO+780TwGCoB0H0SA5lEOk+zvbRTuweAb0JGCpRQKWdVN8l8Thn7uMpwDu1qlJMXUisSQgNu89qKz7btoZCqvrmfJgwmkeSmJStoczctcmBrGchmgPEGMNooaxKzKDeNiIi4OEAPakGryUAUUi2S+1kSXCPVlUk0Fy6cxZZiEkluGpnECDuIDeRcI0VBdSwlkxi4uK6YxPA6RgqCelmCRITfN4WsJOHTWEjKWp9Ei9y0kEjLgPzAfB9HlzYBGMY1Iqy+kBbSM70UCZNJNN/LCRJJqpgXMrgvpnnMN6bQAuOessbzjsfOBY+hw8F1NzUl0Lxgu2M7I6nqy4Xg9Ndt1PKGJiXNWlJGf8saI7jjzq3dTHIiJqGYRPUc6FSTKFK73DQvjdAWr1I/N5YaxjXR3TQiImKXY2OoJkWu3JQkGgOHtMyGZk1iqHkHPRB7qWAuLKqANNYkKjx0ei0GzA2kKclNGdl/IyAC+HJTNSbs+td9AYVbymnDuCgq46YpuZsmQjgXW3kudUC+f76PY+fKIJGMawIDPpqzZnspMmaQaC7kWUGiGdx0kAROg0mkhADXEAaopMyh12RuSKA5Ri9dzV2o3rXPuP6pLydfbtqNpRt3lZsajt/BclNTNh2ZxG0hl2afREZNokiUdCJJq0Lp2geXQeLClernxpnKuCZxBJYNxCAxIiLigqKz3JQe2hlv0QpUi5lw4xqSDWW8ILEo0EsT9NMktsCAWmh9xS++H9/zx7dc6F3ZVdA1iSybfBXU0NhQmVLNOIXJ2tD9FrqQzAsgSxPWPbodkJmPq06Q5gwAODjf16/PGkxiSK5qUzOJieqtyGQSKwluN5lq6Bw07ZpEMp/hsJa0tq1aYPDqXQcZQ6KHZiDFYxK51z8t+Od0kBh63roxguO8wDwz2FPbK3SQGCxbj0HieUNRGteEyt3VoFwxiIA74CM5qQ4Sz1bGNbtVbiqEeLIQYlMI8SfGa98phHhICLEmhPgbIcQB428HhBBvK//2kBDiOxuf5xwbERGx+9E1SCxkhyCx0e+N69I43+f15MoLtbAe9JLInqFa6H7g7pMXeE92F2hdwDauScBmEs33BQeJsuoL2HfYtC+tD3VLCb2P5eJnkCadrPU5kHofS0bQstjKiwJZydoeMIJECm5SgaD6QgqCOjGJRcFOUgEqAOCyssMpy001k8gxktFMIq+2lg7dIEuZBkD8+nIpJWRZNzbIws1FKuMargt3N3OjcSHZASlQdwoPViRE45rzBkpApJyEkyxrCwEVLNpqEieYxLOGcc3ulZv+HwCfoP8IIZ4B4I0A/i2AKwGsA/iNxvuH5d/+DYDfLMeEjI2IiNjl2CR3U+Y4so3uMx7alKXrp7zaEtOAgPNAzIsCqRCY6aVRbopocOACJSE4x6co5aYU9IRK7rrUEpktH1xJmVf90S34qtd9oPY3WvwMejvPJNLXT4RabNn6HZpM4g1XzOvXqz6JYTWJlNiimkSW3LHDghxQAccCs7552sY1g/J7kRw3BKZLKcBht4tym0lwjSbQrU+iyaQPsjSY8c+1uU53d1NWv0NDNsptr8I9/l1deiPqMBMQSWKft6yg2kLA3c7CGiQWRguMXRYkCiG+HcASgPcaL/8bAH8vpfyglHIVwGsB/GshxKIQYh7AywG8Vkq5KqX8MIC/gwoKvWOn9JUiIiK2ic5MYsnS8WpEqod9j2E3XRneZMwgUSJNBWZ6CUs2dKniYsk4P3JmHc/6yXdOMGM7BboueVJmCVEGROZntKEoDTiA8PovYjaUTbs9KLr/lDpWn3r4bG0fk0QlZXY6QVAYTGLqYBLHuUSvNK751uc9DouDDE8+vIDr9qu+iWqR1r6tTSNIzJKwwNLcB24rEXrvwkwZbAQGDtMOEula5DCJEz04GTWJNI8H13GhMoXJEhG8n3Qt6SQJU6Y919EVFeC2sijQT3nmUoAyvarM3EKTTZFJPB8w1ySpsM9bVtSCREcLDC03Pax+arlpCqTZ7pKbCiH2APhpAP+18adnAPgM/UdKeR8Uc/iU8t9YSnm38f7PlGPaxkZERFwE6F6TWLDlpnohWRrehGZbuzOJpdwuS2NNIrrb/08b77z9GFY2x/jTjz80le3pHnjMvm1p2c4BCA8Sx3nBllsXsrGQsWzr+U9QlR6fePCMfk21nEgw6PHumy6gfRRCKEbQsjmTSdw718P7f+hFePurv0y3EUmEvybo6NIGfuYf7tCN6Wf7KdJEsJis3GR7mLV0s8w2EV3qGLcDWuBuMqSt3ZlEaCadK9vNEp66gw43ya2HocFlwygtVALatW5ylEtkaaIMUEJbiRSKydItSKLcdKowExCpIwFnBclGAbfcdLylfs7uU/LSddO4prfr+iT+DIDflVIeaby+AGC58doygMXyb00vZfpb29gahBCvEkLcLIS4+eTJWA8TEbFbQLUyUvIcTvPSpIKX2VU/UyHQc/RSs4Gyz+yaRCnLBUkS5aaoLyZWGP2/po3FkrGZ1j7SYpLtbppUTGIom5UXkm0SYt43rno/WgifWh3W9jERYLH9XUG7lJQGELZA1qxJBICDCwNd0wnAaXhD+P4//SR+98MP4JaHFFs6kyWtY5ow++2FBunUS5DbuoeOuRDTqUnUjDjTEAaoSgBCg5RCKpa6lyRsuW+WqtYxoduqFvJgJSVz/dzgmcmY1wW3vCFLBHqJCK7t1I7fTHa71idxFyf8djvMBIRLJq/x6CeBT79Z/W7WJDqZxHIuTgfA3IG6cc1ukpsKIZ4D4KsA/Irlz6sA9jRe2wNgpeVvbWNrkFK+SUr5fCnl8w8dOsTa/4iIiJ2DmeFmMymCJ2WrpB2qnUUXd9NRLoPrBvJcWVvPZOmOG3dcDKi3X9i9C4uFQQ8AsLLZnmndLqSUVU0iq08iBURMJtEIUriyuSSBt94PAM6uG0FibjpC8q7/kytbrKRRkNzUYBJtEELAdxg//cgSAMUoAiowzhzbciEvCjZrRozjPLOVAp23xUE2FbkpbY8TkFIwkyQCvSQJbktEKo1emiAvwufkUV6glyi2jbMtALovL7cGfq7PdDfdRiuLLOUlQGkfB0y5b00SGxOgnWEmIFzzlsZvvxj4m+9Vv5NsFGh3N017wOz+hrtpBuS7JEgE8CIA1wN4WAhxDMB/B/ByIcQnAdwO4Nn0RiHEEwEMANxd/suEEE82PuvZ5Ri0jI2IiABw65Fldg/CacJcvPD6a6nG2F0yu2mS8Pq9NVxRgxfXmkmMxjXAxWObTnHENJhEc20b2v8OICYRup1CsEpJSnZPuprc1NVeorwnzq5XgbViEnmOkICqCX3B/34P3vTB+4PHmMY1iSOQVfJXd5CYeoxrzDn0odPrAJThTWhvRYIpGw1vyq7eN8s8bxS4Lwwy9vzz7juO48TKJmtMVVvLM2ACqAcng90rqLecOp+h8spxrgIpl0uvdR9rxjX8580ssyax3ieRF3BniUCWhNdp0j4OMp7c1Kyli8Y13ZFTkqSct6REe8JDvaldbqqZxL4RJBaqv+Iuk5u+CcCNAJ5T/vstAP8I4GsA/CmArxdCfFlpVPPTAN4qpVyRUq4BeCuAnxZCzAshvgTANwL44/JznWOn9L0iInY1PnLvKXz9r38Yf/iRBy/0rjhRt+RnMAeFWiSzHtqmbChNgmUyVQsMPgOTaLlpZBKHeW78vnsXFpTJn0aQaNaXcZhEYlKIGQuVm6oghdc2Qy8IKQBzsHSAaoVBKEpmg9sn8ZGzKgh7310ngsdUNYndmURfTeKSEfw+tryJfpboPpWsIDGXnYO9rrWkCzO8/q6jvMB3/9HN+I43fSx4DNDNgIkOXaqbiYd/N2VcUwaJDBOmLE06yk2ZfUK1uylTbmo6EDMTRwk32JbdakLpmpzrpcE1mhGTMK8tSmC1KhNG6w0mMQNkgYkmr9Yg0eiTuFvkplLKdSnlMfoHJRPdlFKelFLeDuB7oQK+E1D1hN9vDP9+ALPl394M4PvKMQgYGxFxWePossoEf/ZIs3R398BsKB1qyADUmxuzZXOl4UEenG2tZ/I5meQsERj00hgkolsj9wsBWoRPQ25qBhihi0ipAyKeu2nTpIIbbHgb1Zfn88xavSaR2tSw3E07CB8K4972M4nuZY+PFTyxslX7P80FSSlRDVVr5GZNIpPJ4rbOGBsyVY7clD7/vpNrwWOA6hrk1AjSGCFUz89R4NhxObdSTWloUDTKJXo6IA1k0k25KUOBQuPm2MY1JpMYft9Iw/E19BzQM5DtLmskLnazKmS3g45j1mZCZtYcbq1UBjRA9bNZl1iTm5Y1iVTLmITJTTPWtzlPkFL+ZOP/fwbgzxzvPQPgmzyf5RwbEXG5o89svnwhUGMSGb2dilJumorwoM2UzYX2RAPMB6KaMsObIqvM7kwW5abAxSM3pUXauakwifwg0ZR60cIipCarq0lFjUlMBGzryIpJHNXGJUyJXldUctMqcJvYx7xAOnAve0juZUNTerm8ob5nZizsTFMcF8ZFwQ4S6dhyW2cQI7EwyPDo2Y2gMQBvHrZtj8OsmnNyLxXhiYtybiVn2mAmMScmkZFcbLbA2HG5abeaxLyQGGQqAcr9bp2ZxH66q1Uhux3NBJz5Wg0rx6rfN89VjCCg5KNAKTk15rcak7hPuZsuXlm6m2a7Sm4aERGxTbzkl9+PN7z3HtaYgQ4Sdy+LZWZNQ+tK1LjSuKZLTaJHNufaFlBlhDmZZHI33c3nYFq4WIxryNAidMG6HZhsdqjctGabHipRQrX4mGG2YKj38rIHpLSwXd0a6/NMkth+lvIYkeB3VqjXTdoDlXEhtTzRBp9T6Ylzikl8w3c8FwB0Y3sK0kOYm6KQKCS0uyyXkSJzEe58N9NLWfdb10U/bY/lUm3MySwGrJQO9xKSmwYyiSSBZtY/mvsY3F6CTGGyFIngyE07StBlZQAU7BJL10jGlaCr981Mob3NpQzz2vKqQlaPV79vrSjWUBhyU2BSPmoGiXMHgPEGsLW6++SmERER28d9J9fwunfzPJn66e5nEmtyU0ZNIrEULLc57dLols25tgXwGRiqgYrGNQrmcdvN1yQFhxzXyq7owiSatukJQ27aZBK5Doi++8Z8bWljqF/jmn0A3YKUWp9ER00i7Y8LwlOTSHLTlzztMD7ymq/EW77vhQDqTGIbKtamlEiGzj+yed5485YKEsOv5a4JHNoe574xry0uA5YIU24aLq/M2HJT6H109eC0bqt8n7oHwh2uzeuCcy9IqRKnvSy8BYZuQZIx62Rzg0ncxXP5bkfeWJMAsF9fG2er37eWVZBotsAA2uWmALB+qjSuKVtgtNyrMUiMiLiEQQ/gXb0g79hgvZCVBXoo42MyMC7ZnG/cLJdJlNG4hnBiZRMPn1nX/+csWqcNYrc5srmuyDssCE0DJop5Qtblk/VHoayB+kkMvC0IMNmVs2tqcULmItyaRJLlCbTLNwm1PomeNh2+mkSfu+mp1S3M9lLMDzJcs28WT7tqjxrDYHKbjeND2R7trsxuOF+xRJxgY9tBIkduaiQ8siS8TrwoA36S+PKDS74kU7UpCP9+5rhBL/weoOtitpey2kvkJMFN+HX6WWmcwr225vpZDBK3AdPdN9WqBMvxrAWJVJNYzmUULDYdTpvGNYQkU+6mQCubeEFqEiMiIqYDWohPK0j8i088jFEu8covfkLwmJrclNOovpQNpY5Fq2sMQAvJsDouoFpczzGbIpvmCuNC6nqYyxFf8ysfrLVH2M0LC7pvQuXI24HZ3oC7QOP2SWwyUlxX4KTs5WUblxdSS7+pV+K4kJjpibKXaXiShN4rwmPEoD6JbUyiq5YRAM6uDXFgvj/xuj7+AcENMURUBhDKJGqZcMcgcbafBgekQPd7k7bHSQDVEx6MOnFZ1ggSkxgqAS0qc5e1rbCa4+b9Fvq8MQ1vegzmsuqLyZNpFyQ3TcOZRJMl7THcZc3EaaxJ7A5bfbn1+jKDxImaRBeT2JCbEqhPIlCxjQ5cnquViIiLDF37HNKDc1oL8h/+61vx439zG2uMaZLAWlyUWVOX/E1KiZseOFM7diH93qzb6rC4JifJRAjN3HD64F1qMANEYJfXJBo1dTuNKiOfBjPiUlaLTy03DZgjuvbb033iPIvkcS5xaGEAoGqDQeYigx5PbtolqVUZ11T9xprz5rgovH0Sfe6mZ9aHOLgwGSQG29ajYoh6aYJEMCSSHeXuZnBZyPDruXNNoqQgkZfsAwxXWkYAlgjopBtHXpkmvKBtwvCMWaZA7Q3y0F6O5fvmBxkruULHRCUl+SxpLxVsKfNcnxfIRtRRk/KLULlpsyaxDOW8clOTSUzddYwNxCAxIuIigPlMCn1AAdVEvptNU4Z5UWXWOYuL8mGfJPaFxVs/+She8caP4u8+c7QaEyCbs26rfPhq44iA/aTPzsqaRIBnQnApwSa13c1BIi2wCrnz+2k6V7LdRmt1LAy5Y0d3zSxJnIvkcVHgikUVJFJCIJdlC5hUSe1Ck12dgsRyn6hPIjAZFOV5e59EwJ6UO7M2xP65ySDRa1vfgD6OaVkTF7qQ72hc02Qug81dOkrBKyaRV0cHVNdy6ONNBfwJX25aVHLTLn1COUxibiRz0kQEM8eaSexnPHdTSRLcRJtvtY4pr8E0SVhMoimB5ngJRNRhrkm8Caf1M0BvDoAANpeA8RaQqfk2TG7aYBID5aYxSIyIuAhgZgXPMXq3abnpLjZNGReFlnGG9sgCKulY5nj4nlxVRhO3Gj0iqyJxtSgJXbSSAU0/DWcSzYJ0cjO8XJnEI2fXJ17bzdlnc5G80/tpSgJHuQy6JnMz+8xissogMWMa1zTuG1ejemISSW6aF9DmUmp7gUFih2RKrSbRcUzGhb9Nhc9d8MzaEActclOWcY0RbPcSvrlIL02Qdqgb48pUt1uTGHodm2MUk8io96Nri8kkFgaTyO6vSwoULgOvmUTeOC5LV1C9ZcJxblU/tbtsJ1Ok3TuX73ZUCT8j4WQ7BxtngbkrgJm9KmAcrgL9BfU3LTdtupsSk9iUm6ZRbhoRcSnBnLibsj3/ODV57+oF+Vhiruw/yGk5QPb6LmnZ/jmVKTvb6NsGVIwI56GdGotdTpCYJQK9rCxIv0wfpncdW514bTcvLMzzu9OGQ6ZLIBAWSBXGwo7jbkqMuzZg6tAnTt03k+8Z5xILgxQzvQRn1yhILJAK5ezI2V43uWkVyCYO2RYle1zQPScth/LM2hD7LUFiF3fZrKO7MtXgdXE3BcKD9K6tX7ZjwpQItyrEBhXsVUE6p50FNyCqmYtwFCgNozS2my03SCwqx1dusJcmiuHu0rtzXEiWwimiQlFjm9VrzprEuf0q2Ns4AwzXgP68+pvT3XQIQKi/92aBbEa9LqLcNCLikoL5cOEsWomZG+5iuekor5pLh9ZRABWT6JKWUeBJ9VFAwySB4W5Krog6SMwnj+ev//M9+JG3fhY3PXCmsS2BNGEaVRQS956YDKwuVrz/rhPYM1P3SdvNxjXmdchZpH3onpN49Z9/irWt5kKeI2VOk0paGbJurRZ2JbMX2DTdZHtctVXKSCrB/rl+JTdtJFdCGUI65hzjoJDF1jgvvO6mOrhsjNsc5Vgf5lbjGmImQ+5tYgiqmji+3LGX2o2DfOO4clPzGuzS81BtK3SuUz/TsiYr2LimDPaoJpHDCqZJR7kpM7gvmvdNcFCqfs70UharXkhox1d2exuhEhDhx7Eo97G8thjP7ogKNeMaX8JpuAr0F5VsdL0ZJJLctHEO8qFiEckBjCSnNblpZBIjIi56mJMGZ9FK2dXd3G5gmBcsFoVA7SXc0jL13c8YQaL50Ga5m5Y1iT4m8ZfedTfefNMjeMUbP4pRXtQWhBxJGgD8n/fdi6963Qdw57FzQe/f7fjEg2fwwhsP1l7bzUyiGTxxkjL/9ndvwt9++iiLMabrVN8DgaZIQCXRA3hyR65ssQhYJI9yZQqzZ6aHlU1qgYE6Ax/KJJbHnJNIqPVJdAR7eSG9xjUUXDbHkXzW7m6a6M9uA51rVZPIkJuaTGLGCy7NeatLTSLreWMGiYw2QUDlbhocgJXzP1duqssUGEG6aS7CYTvrwWXCShImQgX3HBOhvJAQpXENt96VEhehx9FkEgFej+OICrbSAev1Nd4Esj4wd9BgEkluShOXRW6aGnNWb1b9zPrKzAYA8sgkRkRc9DAXnZzMIj0ApmHl3xXjXLL7fwHVgs8lLaOF/pJFbsp2Ny1Zkl7JGrQFsx+7/3SDSSRJVNj2bn7oLADgseXNoPfvdqxu5Ti4MMA3Puca/dpuZhJHtfuNv5/rHe5RjnOlmf1nuZvmhgSaw6QYcrvEYS5CLWkWZjKslq0FxkVRNhInJpEnN+UskGmfEmHKTRtBYhlYuODK5J9eVUGizbjGV8fYxNiYfzJO0CDrC3lO65IsSXQgFd6Cofr8jSHPXdP2GW37CJTBfeJwdrSN00wizcmh26tqGcNlu+qnlpsGy0arcRknuDT7izLmn6p3ML/eNWEykLkRyAK7O+m3m2E6R2e+dcJ4qOSicweAtdMls9hgEm1y09RQ8KydUj8PPinKTSMiLiWYiwlOZpcegrs4RsTIYBJDH2xSStUTyuMIRpnU5Q0jSGwsrkMf2uOy1iN1MBQAcP3BOXz5Uw4BAD57ZHnC/hwIZxI1pnTeVLuOndvY5ijHbC/F67/tOXjg574WAILd97aLI2fXWQtdoG6gxHEGJlXP+lb4mHEzSGTUu3LdTatgI2EZd1TGNYqBdzOJCRYGGVY3x+W4UsbGZRLLY85dIAP1ptTN/Sykv/dixUDWXycm0dYCg9On0gzSs1QEy+vH25CpJgnYgZT5Pk6gbj6nuNcWnTcOS0c9AYFw07OikEgFOslNk7JMoZBhMtym4RMnKZCUtbxc4xo2S1qTMifBx5FKMLhy34g6bHJT6z2Qb1UupeeOAJDAoGQSE4dxjdlLEQC2ShO/w59nBIlRbhoRcdFju3LT0EJ7wj989ihe+HPv7Wy0wmrcnBe6frBLCwCXIxjJnUzmNUQ2Z99eoc0mzO3XtpdLXLHQx+HFAR44tTZhmw7wai6niSf+6Nvx3X90y458tpQSG2WQKISAoNqXKTGJX/r/vg///vdvYo0Z1YxrwveTkgjrw7Am3UDd3RQIW8gXFolSWJ/EKkjpMxtn03ZcvQSJ2V+YybBSMolK2ofKuCbwnFNwyDPtUD+FcDelluXi2wUiGZsB95k1D5PYwd00TRLlysxlewTJTRkKiDIhADBqEo3j3kXyq7bFl2Ry2hJVrBmvfdJ25KZpLVEYsC2DAeb0SdT9RbOE5SeQF+r67yX8foe6TpNR76qMlMLUNZcDRnmBL/7Z9+Lttz4WPKbZJgVwzCXU8mLO6HdITCK5mzZbYDSDxF75/gNPNOSmMUiMOE/43GPn2E5/m6Mcf3nzIzvKUlwOMB9mXYxrciZT9BN/ezseW95kOamaYGWfc1kZ13RwWyRHe5vdPVBvO9F0mwvvk1hnbWyT+Lgo0EsSXH9wHg+dXkOdSQyvW7pQeM/nju/I545yibyozjHAy+JvB3TNf7w0EwpFTW7KWKRRcLLOYC4nmMQQ4xqLu2lYn8RC72cvTRjGNVUA7DIXGRUSaSqwaDCJKrisDJ9CjyUFh6xG4nqxVe1rc00uZRUI2uCqCaIg0dsCIyhIr2oSOYwgfQ8ax+sJiA5y045JyQ5y00omzGtUT+1MMmYArNtElHLToJYzteRi/TUTR86u41t+8yO47+Rq7T26TyJD3pomAoNewjr+khxf04QVNAN8lnqcy1K2zu9xfKni3MYIx85t4kffdmvwGNO4yZXcAqCCxLQP7H189Vq/wSQ2jWtkUQWQAPDd7wW+5fdUgBj7JF482BrneN2772ZLoqaJ1a0xXvarH8IP/vmnWeN+9b334H+85bN45+07swC9XNCVSTQzl5xMHy1YOQGp+bDlyMRGeYF57W7Kz366AjdaSJkBct24RgTLcPOytsobJOZq0fKEg3N48PR6g+0E6/vpz9zFQWUoaF4jgwMALPON7aDr8RsVUgc23ZhETva/aVwzuc9SStxzfEVfx6ZtfRXYtG+rVpOY8RwQ6Rp2MfB5IdEjuWmDSaQgJXTu0nJT1gJZ/fS5mxZSQsAdJQpHfefZtSESAeyd7U2M0Qu7AJbIbIvDUTJQcKkcKHkyySxNtic3ZbZg4I4zW5ekjnpX17bMcgPOs8NkwIJcaWvMvTvh93P/dCdufugs/vAjD+p9BCrHUZYpjwAGqQoSg3tONgLg0DHVPobLTfOiQJoKNkt9OYCzbjKdqr1lKfmWqkk8+KTqNc0kknFN4xwUeRVAAsDhpwPPfLn63SVRbSAGibsAb7nlCN7w3nvwa/98z4XeFScoS/S+u06wxlG/LMrERnRDvSaRwVIYDwoOu0e21iub4bK5LvUoUkqMC4nZrnJTQ1rWzP6PLdnwurTJPhk/cGoNf/vpR+uf1TDJsWX6RnmBXprg6n2zOLmypR+a22ESpyHJ3GmWf6N8YM72TCZxOnLTrguX0bjA4kBdk5z7jQK2NYbcVDe4170LJ7f3mr++FV/9Kx/E++86CaBpXKPeEyR3bBqgMHvLAbC6O0op9eJ7caaH9WGOvJB63KAX3l8UqOaSLjWJ9T6Jjf1EGJPYvCVOrw2xf65vNb2pFnbt+1gzrmEsyLdjXJMI/kK+a01ipz6J5lzumJOt40oJNIdJp3FJwmMgtVN1Sy+7zx5ZAqCMywDjfAumu2n53QYMdQFAzHEpG2W6m7Idv6XUBlgAMAxUJVzKoGPJSSw2E9fm59QwHiq56cEnVq81g0Sr3DSFFVFuevGAFk9HlzYu8J64QVkpbpNjrvV2hB21gIfF0vEzu0BVH0WMQNi2DIle4D7S/s0ybbTp+aeMNOwTq7k/mtko30LBpW0yfuXvfByv/vNP17KB9ND2mYToRXIZXJwr2wDU3E2ZQSInQOmKrmzb2tYYr3jjR/G5x/xtOnSQ2K8eN/1sSkFix4XLKC+wUPZ15NxvFENwVCET7qaWff5Mufi8pXS9pWtzppc6kyS+bbFrEovKFdTm7kjXUK90NwXUPVcU9TYFoc8P+nxODa/ZAsPG+EspIWXFFtrgCriXN0ZWFhGAcW9zmMQEvUQwJIEoxwmWAUrekASGskvDjkzidlpgJAnPTCwvAuq4bNsr6rWMIcekVqbgeN5sjXM8elat4Y6VrtTmd8tYNfBVTSIQfg6krJKSUoYdEzMBwXX8To1ra7fW208TXZ6lNn8Fa6CujWvMmsQ2uWlel5uaiH0SLx7sL+scTu9itq3rBEATyG62u78Y0LW5tzmOFSSWC1bqdxYCc0EeGtzQInWml0AIfk2iz0zGfPhXbouGtMmxIKHj+9Dpdf3aOJe62TNgfxiMiqoFAFC5qmaJ6W4a9v1oHcvJSHYFN/FDuP3oOdz0wBm85q8/630fBUwmk5gxFrrbQVfHvVEhsbAdJpGRXKHjMOcxrqHPve2ocqcjOetcP+3UgkHXJAY3966Ma2wLycp9M9FJktWtsWYbuItd+vzQmjG1j+pnLXAwxtKvYe6m9W3mhdTPsiY4QUpNXZAygj1Dbpom4XV7xLZpB9DA42/O5TttXGOawnCCxKKUMuvrP3A6IVVInyHBrbE9joX8I2fWUUjghivmcW5zjHFeaDMnoIO7qXHfcJIriQB6mf+7PXJmXc9rzfrmYMfvvBlsxzVel16RVuOa5jkocsUKZgP1/2/7U+CpX6vko4AhN20yiXnduMaEq21G821B3yJiR0HPrFOruzhI7OhcpYPEOIFsC+YChGVc05FJpPoxDpNonuO2h9r6cIybHjijHyy9NEEvSYLbIowNAw7XIm1sZRLbs6aPP6AazpL5AFAtkpNEQDgkOeO80DVZQBUkmpM/9z6aBpPI6btpgoKazx1b8b5vYzRZk8gxDdoOzIULx1hhNC70eWTVJJbneaNDn8QZTwsMum5ue3QZUkodJM72U5a7aW7WJDJq28bGYlctJJt/p/vYYBI3x6p1TGK0wGAGiUB4sCH1YssuN6Xf/O6mdsMb+h6+MUG1bQaTmyUccxH1U89bjDYRJtsT7G5qSJ5t8mcXuhjX0NtonmTLTXU5VnhwyZabUlIydS/kHzilkorPfdw+AMDSxqjWl5PnbqqCtj4zSKTgspe4v9vmKMeX/cL78MNvUck9s70Hm0lMqz6VUW7ajUxpOq4DloTTeEv9pCDx6f838B1vBgaL6v/CwSQ2axJNUP/EKDfd/aDMzanVrQu8J250zRJxFwcXCnccPber3bm6us3lNQYy/GFPrM85Rk3iiBEkfs8f34JXvPGjeLSUWPcyZa4Qeg60I5gn+2buD9VWNqUdtqzp4w7MAQDuN4JEc5GcWmzai0L1bTSZxKXSGTYzHqTcmsSuLF/XbYQutIBq3mq7tzctNYlZIiZaluwEzGuA49Sbd2QSKWBY20afRNtcS4uPU6tDHD+3hY2Rup7n+hnP3bRjbRuZhKixtoRM9bkLmkkcaWkfJ5AF6p8fuvBqYxJN91MXXPtpMkKuMSGMp25BkjKZxIbcMZhJbAaJgeO6JheLQrJcemkMUPUgDM0d0TXpcqR1IS9bZ3gblzfHGEyi635b3VLzy/VXqDqxpfWhvv4BHpOYk3FN2TomNJFHzq2VbHHyPZT8/JtPH9VjaP84yTvqk9iPTKJGF/dys07ZqQrJy9ggHdg/xFWTKPPqb01EuenFA7q3Tu/iILGrNIwkHbuZSXzw1Bq+9g0fws//050XelecqLubdjOu4QQcxBKtdgwSfQuLopD40D2nAACfLGusegmzSbThCOZ6aJsLItNtEaj6XdkmdXroHTu3WW3PrMmyPOxHmkmp5HYmk8ixyQcqaRynHq4rzOuCZbgSOCdsGKwXgdMPbTswr6dzDOl0IZW7aSK6SX45fRLpup3xLK7HhcR1+xXDfdujy3W5qV4kt2/LrInjOMxSsAHYWeAq+El0kmRlc6zZHq5xk/n54W061PuEwSSa2zNrFl2gP02YYBnfvwlXuw3fPmZJgizh9DusZKrdmESe3NScv7nlDTNMk6J6ABw+R4aYiVm3V/gVKDY06/Zs26Nn7cEFVT50dn2kW1kAYNUkEtupZdpMgylXWygAuPfEau3/Zu/UdBsJiFiT2G2dbJqQuZnEUmWYTbbgUYNdTOLYLTcl45ooN939oAtiCiU6ndE1S0RzVOjD6UKAFlwUuOxGdK1JNAMlTqBOUhxOTWJ9YeGeeNaNrCgZcfTSpHRkC3xAGTVQTibR2B/6Hs3WGfZ+h+o105G3WVvSfJCanztfBonk7NtPE69tuvX7le+bitzU2AZHXhy6mLC5m3LqqrYDUwJFQXsISCY2yFLWOaB7jNUCo7xuKYh2yU2fec1eAIoJMANvl9mKDVXWGmybfM0kWhaSuv9fImpJEinVdrjGTUWHeUsaiy06JuaUEFKT6Ko3KzxMoiuwtKGqSeTJD+t1Y2EBqRrXrW6say17UfgZcesYoybRlbizgRJ3XHfTouwlyGEgzePvYnvoc65YUGzPmbWhbmUBqGdVcJ/EMrmi5aaBiapCtgfAZpA4zouJesvwIL2omSJFuWnHmkRT3eSoiQ5mEttaYJig16PcdPcjVCbRxPvvOoHv/qObz/Pe2FFnpDg1ceqi3ZzCYrcraCLmMA2Ayui/4o0fZdUIdoV5/DnbGweye03QxMVpgRFak7huBCI3lU3OZ3opepwGwBYm0ea4uH9OZctOl/W+hZQQQrEJQkxa3QPVNWsGiSaToBYyzTFVNpbkdo8uKSZyz2yPJW0CuvWJ6wpzAdK15YlPamerScwuQE3iOUaQSDKxmV7CYhLp3uxyr81ktLiePC6jvMC+uR56qcDSxqiqSeyl+loOeY5U9S8JqyaxKBrGNQ4WJUsqufXR8vpfGGQVk86ogSRwm7K7antol4NqEpuJ/LJPqn9M+/EnGfL8ICvl9bygOU2Z5iId5abmIeckF8dFoVu5cK4tQM3JLLmpbEiZmYGzYJy3muGZqwa+qAeJS+vDGgPPYhKles5ouWnAfFIFe1XvTtt3O7lSKdZOrw1rQYpoSUB87rFz+NTDKrE7wVLvYrXYtNCFTa3VKaeOa1nXJM7YP8QnN3Ua14TJTR2jI6aJrlLO//AHn4CUamFiLsB2AuYEMMolBoFXDhmRrDNqdKYNmkg5i0gA+Mm/ux03P3QWtz66jBdcfyB43CNn1rGyOcbnXbMneEy9TyLnoW1k5DuM2wmTHGKrskTgaGkVfnjPAFkqGPKrKvtJC9Dm/DzMC+yf72NrXOCxcjtmvzdbbSFQLXibTGKvlFElFgaAgttemmBRL5JVveXe2R7bpp3O8XSYxOq7sJoA1xbyEv3Mvoimz5zrN4xrpsAkmvMWl0lMmUyilFIfS86CieYfahEytGxvXCjn3L2zPf09ekYj6zYG5uzaULkHGwsSVp9EWS2OE6EW8lJKvdA2a+0oSULX/+JMhpTRuBxoXls8RspcJNtqEj1EojPhlBdSJxOb4Mh96dztne0pJjdwUVnvt8dryq4ax5dBIqMGdZCpRu6shIc0Wrkw53Jf71rXOBqjth0ecNdbJwVsyyY3tbDNAHCwdKtfLo1rTJk2h0kXArq/aMgcZDKyvqbs5hx/cmWr7q7ZkoB42a9+CADw4M9/nZb7RnfTCnljveWaM0w0W8AAlmBTB4kOuakOEi1MoqsFRuyTePGgq+yKHsZLDEOGrjAX7yyXwPK9nFqnaYNu7DWGRAyomBFOTzQA+LJfeB++9g0fYo0xs02cOrWuTCKNY0lbQ5nE8nh98RMP6teuXJxBLwmvkaKJNUtMKdtk4NZPE1y1dwbHy/pC022OKzclyaiNBTMXyfOaSVSL5D0zBpMYGiSW53gaNYnmoqELAwb4FzG2mkSOrGw7MIMgjglTUahFE4dJHOaFZkG6NCAn1sB2jYzzAlmSYM9sD8vrI2wM85p812c4sTHM8dyfeTe+/U0fq1opJLw+icokRP1uWySbSZv5vrr+KTGzONNjtelovo87JwhDEsh3N61/FmFcSOc4jtx3eWOEXiow20tZ5k16IZ/wnIFJkpkx2Z5cSq/82b29Qj8XQwNSs3ctR+5ITp5CS3AZUk4hQB1NOP1Fqb+ubRzdt8Skrw/zmuETT15MSarw+s7cEmzYrknTefn02nDCXTPkOs4LWTGJ5T52dcC/lBCqgHhseQM//JbP4vTqVl3K7GKA2+SmJB21tsBwGdfEFhgXDboulnSQuLHzrTNqNQpdgsRdzCR2Pf70MJyK3LQ8/nN9Xo3UuJCY74dLVsxxagyDSRyHBaTUQ+6FN1ZB4uE9g1JuGiij0jWJbmnNKFfsy9V7Z/DYsgrYTLc5l7spHeuz6yP9AFUMJPS4SblpySQmCXppgpleguWNEYRQTIpmNgIXCV3lpjc/eAZ/dfMjrDFbtVrSrkGie5yWm2b1msTpMInVNlhyU8NdMPQeMI9BKCMOVMeRMvKuxEWWVEzi+nCMuX4l5/AZTrzrjmMAgDuPrUwyiYyWFKbcFGgyN1WQmJSSa7rn9sxk7JrEXEotYwutdTLlpLZAtgoi3Z/hWqT53E190j7CfSdX8XP/9Dn81gfuw97ZHoRQgVuo/LPQ5y1hm4tkHYLEmkspa07g1yRKMwAWwild3xrntb/VVCHMwDlNKrkpx7jGx0DS5/SzBIMswcYwn7hvWH0SjVrSMLmp+uk1QAGwMSp0GcYpg0n0OX6rz69eP7q0gXGu3E17u9yc8AN3n8T3/+ktU9mWuX7xXf/vv+sk/uLmR/D9f/rJWgLIyW63Gde4WmB45aYUJEYmcdeja23ONJnEcY1JDN9fulE4fcOmja5yX3Jxm8Z3o2M+20/Zx3+uvE5Y/a7K88ZZINRrEj3GNSWz9Lwn7EeaCOyf62Gml5ZyU660zP3QHuUFemmCK/fM4Pi5Lf2eem2hW26aF1LXqY4NJlGNq2/MlEwBwFOuVP2LFgcqQGQziR3lpt/yWx/FD73F39x+clvbZxJ9iZKNUY5BltT6zE0tSDS+DydIpMUdi0k0g8QODchpseWSQGdpgn06SMxr8t00mexdCAD/fOdxvPrPPz2xX9ruPrSOyzCusfUSpG3T31SQWNYkzmRe+Zt1e4XUSbjwFhiG3NTieEnrJ5+7qbMmMa/uf9cY32P8u//wZrzxA/erzzICvlBVzoTclBMQiapvHud897MEQnBZ8crdlOOcC1TtJWzXyIOn1vCF//u9+K7f/4RuTVRz3GXUadI4zTYzmURiIG2SZHrPXD/F2nBcu2+yJDy4r4LE8OdG5cDqbuUCAJvDHNftV22eTq9t1Y1rPAqP04ay5oFTayVLDW9Pxt2A7/q9m/D2W49NNZkP+O8bUiktGYloxVKrv09cJ+PSaZ1bk1iMo9z0UoB5QXCknPNTlZtW+8UJUigLvJv7JG6XSewqCeTIjGkfZ3spqzh6nFdMYpeaRJ7cNIxZoprEg/N9PPnwAq7coya+LE0Yxgpm9rP+WrU/qrn94cUZnFjZhJSy5jaXlAvrZubavNbp3jLdDVMrk1gu/MqH+vOesB8ANNvTVpP4X//i0/jTjz+k/0/Hr0v7BS7M65fLUlfj3Pu5OcxrUlOAl/nfDrrWJJKUjcMkmvczZ8FEbyXZlm1eGBUFemVN4pGz6/iHzz6mWQZAsWO2a+tX33tv7f/HymRJlqjFbujCum5cU+63rd6vvLcWZjK9EFqc4dfkmkEi17im1jvPGCo12+n+jMSxn14mMUBuah4rSlZ0Ma4hto3lblomBNQ1wmCOhZIkcxNHJJvu0gLDlTz6i5sfwfLGCB+8+yRe9qsfwpm14WSQyJGbJqa0L2CMPv5uB0rze8z1My031fcNpy9m0Wwdw5CbCr/j6+Y4x8GFPgZZglOrw3oLDE/yjpQBgGISc1kyibtcbkpkCtdzoguadfounCjLX8ZFUVvL0PmeuE7yMkBvk5s253Ovuykxif4yjBgk7gKYDxBO1o4MMpaZctPbHl3GncfOscbUDFA6yE13a5YJ6B4kkqymK5O4zjGFKR8SM7002BAAUOdttgxUurBEXeoY28ZRD7n5QYYf/dqn44e+5qkAVE/N8DoWY2HheGiPS7np/rkeRrnEWlP+42ANzOuhYhILY5E8mbWmwJ0W7l90gzIyol6Lzsm/xFs/9Sh+7G236f9P8745L3JTTzC7MarXzwFTbIFRHr9EcPskqjEDBpPYdR6na6mf2tmeopCQUh2zvbM9nC0TF3cdX9HvsV2TAPDs6/bW/v/ImXUAlWwuOGiTZpBY7qcxD1VST/VzwXA2W5zJVJ0gx3ClJncMZ18AFajaA1n1029co342E0e5lNp8Z3JMOyM1yBI87sBsbT96aRIcNJjsY5owgm3jvGVcuWOiWjBw5wSqdw19TplMlstxmuaXL37iAWyNC3zmkaXGNRnGikup7iXaFu1z6z4GGNdUbZkEZvupkpvKbn0Sc1lvZREiX2+2slCfMzluo1QhXLEwwKnVrYkA2LWLJ85VrqjLGyPDOXd3y00XGn2LdxK1mkTPfXOidJhd3RrXjWss85Z6gYLEnv0DdQsMW01im7tpDBJ3PWo9oRgTMhkEcC/+//vXPoyXvp5nnFJjEhlMFo3bzUyi+X18Vv5NkKymq4xhjdGTTtvk91IW21xIqWVprJrEnM8kmhObj33RNvD9DF/+lEN4ydOvBFDKrxiZbqDMvqX2hzbJTffPlc2N14aNhQXs44qKfT23MdbvqS9IJgNS9R3Ue77kSVfU/h7KpBwzXFjpO3QBZ5x5rnbifK8PLUGiCF+wbge0uNoz22Mx/sSkKCaRd02q7fKD7cyxsBsZCYi9c1VNyg9+1ZP1766Aj+bdP3/VFwMAHjy9pt+feAJ1KSU2RzlOrZJM2+yTiIn9bDaq3zNbLWYomcmpyRoXki1brPdJtBjXGIsxF1wGO2b9WxMhNYmnV4d4/hPqDtjqeDCltAmPhR+3zFsuVNd/uAOu2k91HfczjgkZ9P65HKcLKbF3todf/JZnA1CunFvjAjMli5UIpmw08ZiEWMeV+2gY17jMy0huWhnX0PdTSYGQNYaUqgZeN6oPCRKNRI2uAbaM2xjlmMlSVd+8PmoEwO5n1MpWtc5c2hghpz6Ju1xuOj9Qz56pBImBNYk6SNwc16XMLgaYgj8XK+hyN5V59bcmkkT9LcpNdz+atrmhIHvd3V2TyA82pg3zOc1ZuJKspiuTyGlcrmsSeylrMh7nVZDI7XcFdK9RCzGumRvUJ7xexmjuber4HQu7Ua7ML/aVRfpL6yPkebVocvXJGucFDixUNuYASmmNe7GljWvKh/riTA//+rnX4odf+jQAVQBgu3fMoN9clAPhNvJNcJq5d2cSw8bZWvRMuwXGwiBj9Wolm/yZXoKtwPvbnEe6GNeQnf9Eo3ojAXH13qom5Qe/6in6d5fhxOrWGE+8Yh7Pedw+JAK4/eg5CKHmEdeC/LZHl3HDj7wdT3vtO/D8//UevQ/EGPh6EFIY9eKnHtJ/o3mS4+5YyEq2uB25ad24ptxHT01iNSfUX6fG4Ta4FAmEvJA4uz7EdfsVk/htz38cAKCXqJY/IUGDOd8Jj7lLE6bcMUvCmcu8qBxwOc8A6kPL6cFZ1SS6GXE6/gfLefnhM+uQsnISbQuA/+rmR1TfQpsChcEkJgmc9bX03ZNEBYlN4xrdqingFFBSpkqABshNC8t3s9UkjnLM9FNtgtUMgF0JCEqYCqGepeO8kjInYhfLTWfU8386TGJYTSL1qlwb5vr+8rHUmu1zsYLOmkQPkwgoNjEyibsf5r3VRe7FCTZMcORX5sXPCVI0k7hLs0xA9+9Gaw3OgtwEh0kca7lpuAMoUK/t4TIpAK9GzXwg+a7jtWGOfpbUaqoAWjQFLggNiYy7uXHJJJZ9q86WiwTTEa+534B62B0oGRu6R/LcaJ1hYW2axjUA8Lpvew6+70U36v101QSZ9wY1s9dMYsfkCqctS9c2KeapajOumahJZBhNbAdmkMi5/qlRN4tJNL4Pt0+iEKgkmZbrEVA1u084OGf9DBeTuLY1xvwgw0wvxfVXzAOozJRcC/Lbjy7X/r85yrE5rgJ9G3NmOosCwMufdx2e87h9+LInV4w6l0nkumSawYbVuIbYTs9nON1NjeRSE/Sy63peWh+ikKoG+4Gf+1r8v9/y+QDU+TT324dxIwAITbB0ZRJVf0WViGYFiUXlyskxIaPrXzjqLUnGOtfPMNdP8UDJiC+WAYCPXb33xCp+6C2fxX/7y8/UHECF5Rpxwcb2TD5vqkTiXD/D+qhuXONq1QQoI5MP3H1y4vvS54UknUym3Kdc2RwVmO1VQWKNpfbUdq6Uz8LH7Z/D8oaqCc2MxNE0asy7YKFMRk+DTAmtSVwx1t7HVzbRSxVr72S3teuWq77Q1QJj7GYfARVAxiBx96MmN+0QgHWVOz54ao2xrbCLf3Lc7pebmjdkF3OXrkE6py0IbWu2nwY3YAZKl7pU2VTzrq2SyeoYNLQxifP9yYmLY+RgFtvbFoT0niQR2u777PpQM0SAW1o2LgocXFAF4ucsTKIt29o0rrHBVRNkBi/08KDP7yrh4bDbdcOh8HGhTGKzpx/AM3HYDug6XJzJ2FJaYhJD59euihBTymgz4KjqXQWuPzhv/QyXu+naVq7lVk8tHXf3lveDa0HeZH2PLW9iY1gFibb7xlxoAqo36N/85y/BH/+nL9LvYdVkFVI3Eg+ubbMsks9nn0TXva3ZR8d3I1fIgwuDGovJMU4h2WKX2k46XxlT3poKwQ8Spbo+VHuV8HNdJe7sQZtpHHRwoa/XLlRv5jOuOXJW1eHeeWzFYBKN4x/w9epGafbzbfZEnO2nWN/KG0yuO3D7/j+9Bd/1ezdptkuWx5ESCSHnrWZc4wg2pJS6RnzvbK+UjRoBsCfYW9kcY5AlOLw4wNk1qklM9HGZRo15F1ywmkTPs3tzVGBPyYI/trSJPTM9fW83PweAITd1hGy+FhiuwBIA0izKTS8G5B2DFLq5uzogHjcKkdtgsg2cmriLwbjGDEy4WVOAxwiaYNUklvs400sxCnz4Ag0jgQ7XVhf5YZqIVndTkgmZ6KVJcACctywIgepBu69kBZfWR7WaxMSxSBgXEoulbb9mEot6LaMtsKTv4IJrcWceq5XNsTYqAbrfN2QOFIKuwU2ou+nGqJgIPDi93rYDCoAXBhmPFS/UYovDJJoSQFZNojQSF7Z6V2OBetUeuwW6sMhUgfJeKxdJJHdcHBD7Yl+QNxM1R5c3sDUudKBvcwDVNYkeni5lyR0NJjH4+KuftZpEY3NmiwwXfO6mLiaxLdg7vVoGifP1HmfCEZDaUJu3POYiTYyLQhvucGsSK+MaRuJIqrYIfUct46NLG/iW3/wIbnu0YqsLiVrizi43rQKwKxYGuP2oMt4z5aau4/jQaRUkrg+r+q/EaGURcvw3x3nZEsRtClNjEnuqJrFprkPva+LIWeUcSjJEOo6c1kl2trP+nlEuS3VRgn1zJDc1AmAhIKXdm+Hc5giLMz3sm1PBpZpbqsTRNJJ+XdDVu6MLajWJjnmLAvUrFlUi+ujypq7bdpXOdJebFlFueimg6yKN2gV0ZRK7LghD2xQAVRZ4NzOJeeBitwk6Jp3lpoyFPG1rhtkCgzKw3IwwBWu8IFH9nOv52wasbI70QtUES6LUyH4Ckw9tkjHtm62YxFrW2mLAAUA3Cd4z29N1GHXZVtJqXGODqybIPC+rW+OGbLHbg5clNy1kKf/1B/dNmEGJr25v0yY3nZI8SctNZ3psJjFNlLtp6CKZvs+AUVsL1NkeW52grndNVK/JX3j55+Nv//OX1N7jOp5rw7FulXR4cUa/V2/Lcj3S/PJn361YwKNLmzU22FbvRB/jIekUk8ioOd5On0Svu6kvSCz/OGEuKKV2KJ4cU99+E6fX1MKf1AkEl5LBhrYklQvE7AElk8hgZXULDEbCQ8qqv59tkXzXsXO4+aGz+IZf/3BtW3QMhSNIKQwm9+B8dRz3GItr126SWdPK5lgnuNOEJzfdMPqSuhby5jmaH2Q6KDX7JAKw3gNUN39ipTIuS4Tw1rI3IY3r2yU3JYXJTC/FntkehuMC68NxTe5uGwcA5zbH2DOTYe9sH8vrQ/UcL+W+06ox7wLaKyrl2EnkATWJ9By6opwPji5taKMvOv4TQToFf21y0+a4YuxmH4FSbhqZxF2PrnJTuiA3OwZgnObqo4AMiXVc+d5xIXetHKFrLdF2HSg5MtW8lBt1YQTTDkFilxYYdBxn+6l33MqmnUnkLGJsLnXNh5SUKIv/EyzOZKpxbYO1sY1TrqgCe2ayyrjGXKSJyQVh07jGBjeTWN2HK5ujetKoM5PIq0nMkpI1Y6gSgpnEYY7ZXv24pIyAYTsY5QUSUSYuOtQk9hh1dKYDMVembbLbTuOacpH8ihc8Ds9+3L7ae9pqEgHgUJm5puvNJZujuf5xZcPt4+c2a3Wl9vumYmhc4NQkFtJogREc2EDvg8/d1Gdc43Q3zaXzu7nYRwIxiQcaTCLPXdOQJHsSLFvjHG/71BHcXbZHMWWaacpkEjvKTX01ibTbhazmzLrc1F3vR+/5yW/4PP36woCCFPdxJCZxXEgsUY/KhGdcs7aVa0bKWbdqPCNm+yk2RnlZ20nH390GaW8ZJFCbCRrnYx+bCHkmEqEwWxrXAMCZtVHNlA2wB84rm2MszvZwxUIfJ1e3sDkqsDhoZ3IvNKqez92S+V22BbgTvPQcovl4eWNkYRIbg7TctIVJbNYktspNe0AemcRdj65yU7oIuUwiZe04ssWa3LRDCwxg95rXdF2UbzdIZBnJlJlsTq8roJQb0cOe6YoKqOMRGtzT++b6foneSpmRbKLHsE23Obm53OYAYP9cf4JJdNVtUEH+wYVBJf8p6u6mzWDWZlzThKsmqyk3rfUk7Wpcw5gTSCalrhFOTWJgkGjrk+hw1jzfGOYFsjRhMYLUS01l1hNIGeiAWB6CmV74dQzUmRSrcU35wZknAeFzN12YCBJLNsVVy1vuuzK8SbC8McLGKNc1grb7xgzQXMjScHfTWguMwHug3idxck5omuvY4JKA+moSXewj4fTaEEJA10ZX2+LVxNUkmY7r8e8+fRT/5S8+g+/6vZsgpayN47ibFgVK2Sg34VEmMx3PG3P7955YnfxuDumuGWxdt78yb9JyU4+ZDzGJAHCqnM9rZQqOQ/LXtxzBj//NrdgY5tgYjaskiWMhr9QH5G6dYZRLrG6Oa0wufd8mdJBYMomUpBIlmxhS4tNsZUH7ZEIHiT0zSNzS13DiuSbPbYywZybDjYcW9NqTghtOvfG0QXPONNRsdeMa+/bo2XzlYlU6sIcYWZcqoWsLjGLcIjeNTOJFgZpsi2Uc0S1IJNnMFqe2MCBDYh13EQSJXWsSaQLmTj60EOEGpEnCC6TUOJVB7qe82pJQK+fmPgKKSfEGiVuVTMUEWcIHbav2QPQziYBaoJ1dV3bfTeMaGyuYJQmu3TeLR5c2IKXEcFzoRbptIU/3R89jXJM4AnzzvJzbNOtm+AkIaovTJjf9uX/6HN55+zEAFBQnGGRJJwdcoN3ddKYhN1XypOBNdcY4l+glyjmO2+/Q7MEZlMmXBpPIvLfNerPmUNOkyQXbInmcF9gcFZoBoSCRzpWLAdPbSwUWZ1QvtaFRk2hbJNMzzCflDGUSqSZ3wHQ3tfVJtPZy9HxGCEvUBL3sSnqcXt3C/rn+RJDvkrvb0ExSucZ89P7TAIDHljdx66PL2Cpr6Wg/g5nEMihTzw1mwiNxM4nm9v/l3lMAyp6A5XdzBukOd1nNwDiOSV5IPHJmXZs2kYmQCsAm94nw7juO47/91WfwJx97GL//kQdKJpFqcu3jlAOu+v3afar+96Ez6/r9PndTWpMdW6akZJVEyDwmX2fXhnjJL78fv/bee2q9Sm1MOlCtVXppoueDx5Y3a1JmwMUkKsbrxsML+jUtN21x3H3RL74Pv/3B+51/30loVdQUHjh1g0f79mj+veFQZUJG17Eor8tJd1OSm7qMa3w1idHd9KJHVyaRsktsJjHpvi2A2wJj+6zITqOz3FSzbbwMGk3gXRwQOb211LhCW/l37XkYukigia2NSVzdrNgNE700CTZFMg0IXIxgIaVeEO6b62Npfajq44gRabEyv2bfLB5b3sDmqMC4kHqfbU5utN+uuiX1NzuTUmcSK7kptycmoOTIgF9uuro1xhs/cD++549vUfteFJUkmdVLs/2+yQsVYM/16uc7m5I8iViKmV6KzVEe1pMuIAHh2hYAzGS881Y3t5hc2IXUuyomsf4aXVfEyFENzP7SyMkVENE10EuUTPtk2btTB4mWRTL91lqTyAy2ge31SazLTcu/+0p0LIY3gL9PYuJINhHOrA0npKZqPxhy04Zxjctc5JaHzuJpV6mA6N4TqzUmWTGJ4fOrMm7izQnk8NlP7XW5NGccWhzgdz70gP5uuk1EQL2fCS0BdbCrR5c2MMolnvv4fQCqPrR1JnFy3MfuP43ZXoqnXbWID99zqqxJrI6jbZxZt/q4A4rtXFof6dd8TCIlCqm8QbmiQm/PVYZx/6lV3HdyDb/87rt10qZWp+9KACUCjy/38YFTazV3Zdc+qtYZGZ5UCxLb+1SO8gIPnl7H/37756x/32l0KZ3pvi0jue7YHvXrPTjf1+qCPUbS3MqKt8lNXS0wZEufxLSH6G56EcCcgzlZu0puyrv4adJiNWU3LlpOn75xwE1zPvFXNz+Cj9x3ijWmq3FNFyZRSqkfLmwZT5mhpf+HgAxX+gwmxRzH2U8d3PRTp5GJlFLVNthqEh0LC9+2zNqS5uU8ySQOsWrUaDndTXPFrF27fxajXOL+U0oWZdYNNDO7pgOlCy4mxTwvq1vj2nHkJASAisn0uZt+9shSfd9Nto1TtxcQJFY1MJM1iRyX5K4gmdogS1DIMEbQlCVW7oLt+yp1cMM3rjEXyU7jGp/cVFiCy8Y1eWC+j5/95mfhd77r+XoMYAmI8ooV3zPT0xK42YZxR11uKmt/syHU3ZSu/0HWsQWGKTdl72N9HwCas933dqvcdHU44WxqjguTMk/222sOk1Li6NIGnvv4/Xq7JpPM75NYBoncFhhJaVxjZRLVay952mEcO7eJta2xUndMfDdbAFYd/5/+xmfgaVct1pxDbd+NXEM//7p9ACq5aVpzwJ0cd3ZtiIMLfVy7bxbLGyOsDcfauIaukea1TGofoKrnBeqBlG0cUD0DyPHclNcqJtF+Dszef2dKltR1/dM+AurZd9WeGc0UT8h9Hfs46CXYO9vD4ZKFrDGJjhtg3Wj1xXmWnS/Q8Z7G+jOkJpFUPrO9VJtZmcoqW8KvcjftIDd1sY9AZBIvFnTt09dVbspd/AP1RSCrT18h9eQ6jZv0h97yWXznb3+cNaaru2yXmsS8qNobsDK05UODJEuhi9Ci6OZuOs6r88Z1d5ztZc7vRqycVW6aivAWGMYCOHFIZJT0Sf2+b66PpbUR1odjY9FkHzculHHNdaVkiEwgzMWWrf8U/c0FZ01iGZjtn+thxZCbDjJiUsIfrLR935jbH1X28ZRJzguJNC3Z5g6JI5+b54ZRA2OCY+O/HRADT8cyJFFiyn27MImDXoq8kCyTEK9xjSH/dMEmQaTPMRfX3/lFj9c1XU4m3XCAXJzJtJnGTOY2rtHOip7vGerKSfdWlhAjxWMSXXK7kNMhLIFDbjmOJrTc1LGBU2tbmsU14TMJacJsr+Da3tn1EUa5xI2H5iGEajcBQPfJ9MkWm6D7hm14VtaB9xwGa5SAoHYsjy1v1lgzV52mWbcIAP/uhdfjHT/45fr/rvlkeUMFTk8spX0nSxMhavdAn93EmXXF/lLD+Y1hjrlB3VykeZ8qSTCx9n095+1tOFf6ngHkeK6OY3stqRkkPlL2gzRZUludPlAGyYnAdQfUeahUAu5rcmuc68TNk69UbKIZALuSHatGwvJUefynCToGnCT5drcF+BKn6vVBL8HZMrB/4Y0H9d8Tr9zUFSSm9fcRitwvN01jC4yLAl2NU2hBPZUWGMYikMckmi514du798Qq3n3H8eD3bwf1G5v33dSYnZffarlpuVAMDaaIEeTKhsZFlYEO3c+acY2DkaJm8a4+iVLyFpJJIvSDOW98P/UxxCT2sbI1xvLGqGISLYuEoqhYg2vKIPGuY6u1fbYFe6bUzQU3k6ju3ysWBkpuSsF2nye3U6Ag0T3m+DnFDNGujsrFDbcnGhmu9D11spQ1bfZJzBhOi9sB1UiR6YqvVQfBlJuy+pR1lEnW5HaWYI/mW18CwlYT1MZuu1iDUSHRS5VphmISyyBR12RNLiQrKef2mURzv12tFGyoahK34cBqCRJpf1zfrc2l1Ck3dTC5Nph1vS6ZKjG+V+2dwd7Zng4STZk8y920gwRdloYrPcc42j7JMY8tb2qTFqCq07SaiXnl1vbjT/LNa/fNIkuEVW5qO21n14bYP9fH3jlVk7s2HGOuGUjZmMRyF4UQuHKPSgzsLSWFvpYnJEHUTGIha4Y3LtXFktH775Ez63o7Ptmu+R2I8dxfXp8+dntrXOj61icdUkEiySR9hnrrhov76tYYtzx0Br/6nnus790JTFNuGlSTOK6eib/ybc/Bf/vqp+ALbzig/26Xm5af1SY3tQWXbcY1UW66+2FeEJwATDOJzIufJgBu0KDd5ph1e7MdmMSvet0H8N1/dHPw+7eDrm6SRYfJxwzueD0IZblo4jv+kQEBNyitmMTwgBTw1ySulA8Mm7spMSUh1xe9pSY3nbh1qof2wQX1EDx+bktn1m2LOzo/vTTBNfuU+xgxiQtGcOnK0HrWMciSxNr2gc7LwYW+YhJzCjb49xsthH1STpIlURY6L+ut1IKclyTJksTL9piW6ybajA7OFyomsQwSA65luq+T0t2UPqd9nPo5k/HOW2EwiVYDGuOadMHGblduh/ZxzqbgpXETAOyZre7TiT6JNZYu5PoPczc1j38vC3fkNOuUbXNCxTS6P8Pm7tjGJFbs4+TfRnmBpfWRnn/s22r/futb41r9nblfBGJ8Dy/OYN9sT0st5wfu5JYLtT6JHVpgDBxzAp1LYhKPLm/UWDNbAoLGtQX3tu9GQeK+uR6u3T+LB0+t6ff7GODTZWC/b1YlF1c2x5gbNPokWhQoZk06JRWJSfS1StFMYinNNGtQs9TdGmp5vWLmKEhMEr9zN1Dd+yQbJTm0a04g8zZSZLzghgNYHGS4YrGvv5srSWK2+lofjvHy3/wofuU9d3d2hedCt8CYwvbysr4fcK+vNw256Zc/5RB+4CVPrv1dseLNIDFQbmrWJEqp5Ke+FhhJZBIvCpj6c1adoNGontODsItGe5RLXbjNYdty2Y1JnCbqfSr5DqAsJtE45l36HXLcFul9JDcNDfaklOp8D3hBIh3HfpY4F4PU0NZWk9hj1MrS5yvjmvr29f7I6oH+zGv36tdp0WRbbJkmIYszPeyZyXDXsXqQaMvI6/96FqBtNYlXLAywujnW11WX+0ZLoD3XBzn8nStNcsg5sJcmbCl5kqjgxRVcuuSmaRIms9suqAchR25ascLYJpMYGNzIRp9EB5PIdjfVC0L7GFeQMsqrdg+mLHxCkmYJEn03QAiTNc6Lmrw2S8KZLH3eEvucYNaaumCTrlfHsSVIt3w3kpMd9MhNQ4xr1oxm7q6FPDG+hxcH2DvXx6Ol/NCct8L7VKIys+rQAsM1J9D5v3afYrAeW9qsJUlc12RRuFuQAO4gZXljhDQRWBhkeOIV87inbLuRJu5gDzCYxDJJsm45/pNy0zrbTCZi+2bLAMxTA0kKjlXNJFb710s9ctOyx54QlZSzliRpYRLJ4bSN7aR5k5JtX/esq3Hza79Krwl9LUhME7X1Ya7nMWovtdPokswHgKX1oU4yhGJcyCpJ6HgmmkyiDbaSAyUjFe4MlxDq72ZNYpvZDQCksSbxokBuXlgdTWE6Ga6wAtLKAp1jODEutleTOI1C565MIh0Glmy3o7SYJGnEJoRsk6zkk4RnQEC7OMeUm1L209ZHkKDlpgN7TSIQdg+YkjTXosnsP/eMa/bo9803ZXNmkKgXqOo4X7t/rpJtmU5uE7KOisVwIXUwKbUgcVj1SeQGG0AVUPiYZmISpVS9r8aFRC8te3AylQxZkqCX2U0qgHqRvok0Scr63J29v6kutWISA+Smtmsr4LgU+rzxmMS8KKo+iZbFVohxjRCTSqNCfw8mk1gUeluLhgvxTNMV2JSblj/bmUT7cZRS4tvf9FH8q9d/sMYk9rcrN7Ua17g/ozKhqca1MYn0mbbFPyVkfMY1IezehhGkuAKp06WU8uBCH/tmezhXJuRoXFbecyEoDLnpuJBBSWh9/BPhnBNobpvtp9g/18PJ1c1aksRlyqPKJjxBuiNIWVofYe9sD0II3HiocuVMk8SQm9bHbY5yrA1zHJjvYd9cdd7mjJp0wGYKU3fApWfIvrn2mkSqUyPDsWbvVJ9xzYH5Phb6Gc6Vz1bT3XciSGw8p4hJpL12mbnRWoXmUWHUedM413RXZxJzLW09VpY97DQqUoRXlvWcn343nv1T72KNyQuJfqaurbaaRJpPm1CqkMaLRYtsFFBsolmTqNnHFuOaKDedLv7gXx7A5x47xxpTSKl7QrECMGPhwqlL7CaTlLquh2vU0kVuSphGsXHNOIi1SC7KMeH7OKwxibxzRjU6AI/Z4BrX0Pmd5xrXFCjrJt2M1KqHSaSHasg9QBPtbC91LraKopIx9dJES5yaTKL5rK9aWVDNxqz+m68FRsU+tQSJltO2ZVhiU+AGGEFihySE7/o4vbqlFxFn14e6bjVjmIQAdQm06x5YL+elZp/EKqsevLlO0HLTcu4KcYKu1bvq+y18HJ03jiuwySRONOk2mDUXbBKlNibRxRqM86r+6/Ou2aNfJ/OV1LKQlIFJEtd1+dDpdXzs/jO4/+SalqRniWD1hTXdS30OrG1sJ4DaOaBz76sJFQ53x9OrniCRxSSOtXGKKwAY6YV8qgMTwJjvGExiLiVSUfVdDXnGmXJfFwNMz8wsETi4MMCplWEtINISUItM0nP5l/eNnUkkuafZl67GJDZ2k+oCF2d6mmEDlBkNfT/AwiTK+jVCTCIlyHznu3I3zavvS3JTT/Juqfx+CzOZZr3M5NaEBL2Afg9Q1SJWdc/0XRpMojZbsbNfvpZGptP2+tYYB8rA+/jydIJEXZM4pT6JaZI43X0Bo04/czCJwsJuF2O/AQ2g/m4yiW1mN0ApN41B4lTxk39/B172qx9ijRnnUk8oPpnYxLgyawFUFHYI6ALkSVsL9OjiD9xHKZXD3yzTyMFEW1Pw8wFzAuY5uamfXcxuumzLrEkMCaRMu2uOAQGN4zKJxNr4Hmo+uSnnHiAZ4yBLjEVrfZxEXZ1B5hFVCwz1uk1aRgvyL35i5Tq2YASXzcVWCEvhYhKrmkS1CD9b1gpuR27qGiOlxOm1IW64Qi2YlJtqVZMYuoikbaWJQC/x1CQ6mcT6/u4UcjKuIblpQDLNdADs5G7KrEmstwCYXNjpYK8lAGvuYsWI2h/ztGhtrkdGudTzzIufehhfdMMB/KcvvQHXl9eMbSGpfRU8++hjEk224dGylq5qyh7IfhmJGttCvpKbuj+Ddt/mbuptbyOE1QDl9FrF7tnGmPvtw8Yw18Ypvro9QB3nq/dOJrdCa0IBw7gmZdTylrtDQYqNfTQVIFcs9HFqdavW3sPnHNrGJLrkpnvKIPHgfCX5NcsUXG0islTg2tK87KuefiW+6bnXqtcdEnSzHg2oXGXN+US9b3L/KVE4zAtVPiSr8+xzpd0sGeaFQaaTiyaTOLGPsn4t6/WEEeCbx6C5fzS3NZF4EhCrRguMtWGO/fPqfByfEpM4TeOavHRG9yVOW+WmwiY3baktBBSTaNYkhspNc7/ctIW/jOCAUxdogmR6PhcrG8Z5gYVBhjPjYXB/MymNFgxMd1OqEQndRzoc22ESN0Y59rNH8RDSANU3juzufYsIgrlw5C3+i/IaCc/smouGfpqyZKNAdd5C2VxibbKyhkIahgQEksQsWuSm2rgmYHtboxwzvUQ9SMu3Nx9SUtYXrZTNp8nZ9kDUC8Lyby95+mH89D/cAaCSbdlqBui/ze9rwiWJoppAyngvlWYEJEfpYozkukc3RwW2xgUef2AO955YxbnNka5B49zbQOWcq6Rl9rnP2QKDwaJsB+QSyKotrDEi4RJo+i6UuAuv//Ib15jMpgvCIndsXstNaNamySQWhb4Xk0Tgz1/1xbXrurpvqmuFtu0zhUk9TcHNuiUyXMlaWOomzH2wMYIhNYm2urGQIDER9ud/xSRO1iS6jr8Na0Z/18o4qP6evFDtJ5JE4DmP26tfrzGJjNZJpuFTUHlD4/jbmFWSbWeJwBULA9z26DIOzPctclNbkOjedpoI2PLJ5zZG2FsyVzS/Aio4qpQk7qTMU65cxMd/9CU4vDiYMNexJWXMa+SnvuGZOLgwwJc++YpyXPW+JrZGhepTOy6wPhzX2NXMk4QbFQUWehkWZjLcd1LVWybCF2zXWfFnlbX6L/+Ca2uvN49/syaxidRx/QMVMwsAG8OxLjU5uTqdmsRptsAggyWfmRvVKvZdAbfVuCZEbtpgEtvMbgCE9EmMQeJ5BMf0wUQlJeTJvUaFxD6SqTL7ywF8uWmWEo0e9qCpDDhKRqoDk9i1vcc4L7R8sQ3U20lKvpSWMMoLpG1yADTlpkxpnxDoZ+ViN+AcmEwCR25qtrLg7CdlnzO9QJs0GyDGwNYCQ8tNA67ljVFek/HYFsmFlDVh2f5ysUB1kbYHYnNB/oSD8/jFb/l8fOqRJaNv1eQCSAYtku21JRRs0TEh2RCXgacaVMB9fdDxv3qvcm6lvoz9XoqMcW8DZeJC+OetDYe7KSdo2w4qw6dwdk+zYgnP3ZQ+mljL0AW5ae9vM+AIMlwRPibRPs7tblpvN9BMfOiWM2YApt/r3EUvk7hmSNKOlIYrypXZLdtqwjxONtliSCDrSxz5WzA45KZrW7UEUHNMc1su1I1Tyv2yBDe0j899fJVaJYdaTtsZqoHnyE2bcl/bNF5nEgc4tTrEjYcmmURbLV3mYRKFcARf40L7PZjnYP9c372txn1z5Z6Z2t/pMvD1SQRUK5Kf/eZn6f+7jGuKQmKYF7hm7wyOLm9idWusn/eAqtV3nTe6VxcG2QSTa/9u9X153IE5PPjzXzexjxNM4qglSPTc22YLjLVhru/naTB7QLWe6Lq9UV5468FNmGt51/aGeV47R02klpIDJTdt2YcJuWn5e5Sb7h5wFlgmSErIX6RJwyQhfPIncI1resxAtpIt8hgpExsdg8R1xjgy7kgTwQ7cCKHHsm5cwznXqPUEDHMApYwotNw0hO2mcbPMmkRiRHwOrCubY8z3U+sE2WcY12wM8xo7ZZMbkWkP4SVPvxJA1ePJ9kCkjzD37luf/7jaw95W/xLEUjgepCT3JAkutaaY0X0SQ5My7dcjybdp4bOyOaoYwSQJTjap/UZrcsvVJ5Fj2rEdFNrwiSEb1ZIsM5gNuN/KcYMsPNmh9zGASfTpFGxMVluQ6HY39S+KbIxIUE1i6jbg2LAwiQmpEhjslxqnAtvmMaHf/O6mkyxRW79J+kwbKX6mdMm0scC2mugmTpzbxPL6qGYAJxznzWSyrtwzg9965RfgXf/ly3XSImUY19Dzps9iEqvv5XIvpn0UQuDQ4gCrW2OcXhtW7YU8TKK/B6ddbmoek32N+kJXkN41uWJLilrHNbZHc/WBUpK8Psy1cRCNc90DozIZbpZvCOFuC1WVoNj30XVMKrmpPeBwMceACgxneymEUAEjPSu6rpe5oK/SNUjkOJwW5Vrep65Rcn7fHGQxbJR5gNxUOOSmnnFpr1VuGoPE8wiOVMuE0uST1XG4bNQ0heFkrQmd5Kaenj2ubXWRm1ItRIjRhA2cWsa8zMb5io2t4zocS/r8mR63/5SS22SeQOoTD57Bc376XdpaWj/s0kQHYBzDm9kuBhxCeFtZrGyOrCwigKAAmCzlzebSAMq+e/X3FiVDTHjpM6/CTT/2EnxRWWdYOblNBoncnlzBNYmWw09BGi0Cie3jMonm3OG6R4mxuWpPxSSOc1VHkTIb3OelLLHvqRvbdLbAsC90zzdokVi1GGrfnsmIcGoS6bsMmE7VJmtgSySEJiAmFtaGcZVrjPk+wjhwsVtn4NXPzkyiwTZQHR/NyewWGOaxZDOJ5XutTKIncHYwWadWh9rwZGKMgxEkHD+3iS/82ffiP//ZJwGg1m4AsNSu5nUm66XPvBpPuXJR/9/X8LwJet700/BnAH1/ITzSeiNooz60dxw9p4McV52mybbb4NqeGSTWmERD4to8/M26vSZspki0rZAERPN80/xOrTJWt8a6TyUArxHcKC/QTxMdZNN+p6l9fi2k/1p2XVvDNrmp594e5QUGvQRzvRTrw1x/FichuR3QdkJdeptYMnpRtoFUaT6Z/HBc6PWtDYnNBOsCyk1jkHge0dU9SUuiGDUD2iY/45lbdGG/ACWl7aVJJyZxpoNxDWVauspN1zlBojTlvjwmlxC8kC8/f76fsdxNtdzUI5u7/dFlLK2PcNujy7X9y5iyOZq7uQxwc0Fu29bq1rjWe81E24L8de++G8/9mXfjnuMr2BzlNXcwW/atWZMIqEbTE9uzyk3t35HGTQaJ5X60MomTx5IWQBRIkbnPDNO4ZhxwPdJ9cWjPAEIA50q5qWISmUoGSW62Hie3UQ7TlZcwNbmprAxQ1PZC5KZVkMjpS1rVJPKcqk2WxBbshQQ3wio3Vdt3MTAuNneUF96AyMfAd3U3peuynyU4uzbS+8153jSPU9MAopKE8wLgyvmRz2SdWRtaTWto/wD3fPdXNz8CAPjwvacAYLJPoiUAaNtH30L+6a99B/6y3GZV3hDOJEojuLIl4NTnVm0iPu/qveqz80InDrVM2MOS2uByNzWb0s8ZScVemnidVOl7WLflYnJleyBrHVf+n2TB61u5Ntyi/XDKTcuEjvlMTQ0msXm/tToeO5nEMkh0tG1IHEE6UCkTZvtZTW7Kabe0HZjti7qs0clILgRUy9tPE6e3wigvnPWIgCPhUeTt7qbNFhgywLgmyaLcdJroLjeteuAFLwjzOksXbCZjvI3NJNJDO3BhRxNSlz6JPXJt7dDaA6hnptugF8ncFgCmdDfwu9EidW6QsiYsWgD4Ainqf3fPiZXatkzjjpAG5k0mkRsk+vodrmyOa1lPEz4zEykl3vDeewAA955YVTWJE0zi5KLJL9GbPJYmi+SCPUgMYSnsvaSoBxgd79WtRk1i6PE3jrfrHiU78oVBhoV+hpXNkZYsKWkfh0kvdL2f6/rfGBal1Kh+YKZlXKPqJquglCc3FUb9XcC4BpPIYm0CmMQ2BszW3BtoZxKbcfO4VQ5lYxLpvnHvo49JpCDxqj0zOnOvDLd4QaIQVRDYPJZVIOv+DFsPyBDjGluQDqh2MwcspjXm57l6hR5ttAiYa5Fkjht9+ppQTKL9WN5zXM2pv/COu9Rnl4kLrVwJkVsbyZXUchzVPlZB242H5vW90pSb2syUvO6+NrMP1Fn6iTmopSax9b5pbG6ct0tifdvbUwZ6q1tjFEW1f8q4xhEkluxxk0mkHI+t/hFwP99c11ZlXOOWm7rm8lHp3j8/SLE+HOvP2ukEIcG8BruUPJ1jyE1D1pLDsV/OT/4YNYTITZs1icQQ+sZFuel0welnZsLsgRfOJJJskYxrwsaZNwzLJIcWkkm4A2uzJpEVJJY3EacmsT4Z8Fi6LnJT81yFSwLLY9LL2EF6W5B4qgwS7z2hXM7Mnkh6HKMp+IAbJJbJDp8BjS+L5rMIf/jMuv792LlNR01ifYxEm9lH+T5jXMhtZKu/0CyFJyzNErstPMmdST5LvbIquWnYvT2qyU39TOJsL8XiTKaNa7JyQchqwVNek76F/OY4t0qUXAYJ5xtkJlFJmcODPZ+VvA1Nd1OO4oK2o6RG9b9LtCcu7H0SC+84twEKn0kM60GYeJjEMYQADi0OdOZeM4nj8GDb/K6paMpN1c+24wjU54Q22S5ty3ZvL22MsM9iWmNuy3UPnDi3iaddtYgXXL8fi4MMT7myWUtdf38b2+ZjpEh9cuUeFdBS4qLHUaDQ8TWYRFtARMcxSxM8sawPr5hEhwS0gJZQcr5b4TkmriDdvP9tcLGdRQuT6JOpAtCtOtZIblregsq4xs1K9VKhxwLAFYt95/zazpLSd6m/Tusp37PbzyQK/bypmMTpyE27llh1GWPWwLtrEluYRNu1HNIncaIFRrnfrXJTfxAc3U3PI7r0AQQqSUTGqEnUTCJTytm5JrFQ2eWMIck0M+tC8Kj+LjWJ9e8WvvikWgJfxs41jm7o0O3ReZsbpDixwmMtzf5f9sbNqpaHgkSzCTSnKbiZSe1nSbhxjSGbBuxykryQziyazyL8I/ed1r8fO7eJjVGBA/PV5CeE3d3UxxrYA+7ABXnjMIawFG3uplpuWrLggx4/2CC45abqs+cHGRZnepPGNR3Ybd8Dcex4IHJq/baDolDXlb7+A74fnUvzWg7pL1e5m4YvrIFKEkvbdLVXaat3ci0+XfWFrkXrMJeY6fEZEfWZzmEtNYk55vsZ9s72dGIwFQK9jMMkosY2NVvVhBoAAfXv1ibbpXFWJit313f65nIAOLGyhSv3zOB3v+v5KGS1QHf1GG260jbhq0m847FzAKqELq1JUs9c3kRlXuRupUCqCcKBsmcesWiuxEXewiQmid04yGQuAeBHXvY0bWCTeIJtwH3fCGF30x4XfibRJV2n/+8pA+X14Vg/7wG/cQ3JTa8yHFgPzg/cst0WpcxOuJsSwbB/ro+z60O9DuQkJLeDcaEMHjdHRSe5KU/xVZm5ucaZfWhtcLfAaAsSm+6m5bpN+GpnekAeg8SpYTs1idSTi8sakLtpsANcjUnksAYqu8yxJK+yVgn6HkmaDfRA5DCJ5ndjObeW2c0+Y0ECqAl3tpdidWvMqAkt5ab98L6FgArA+p7G8UDVk+ueE6va2AjwW2Jb99GQ2w0YrTNMl17Azr6oCdv/gJp0KZX4hXfciWdeuwdn10Y4tryJrYbc1CZ3kRJejZ5tkRayILc594WNs0vSyACmV7aYWd2sy02Dpcx5+71NTOJcP8We2QznNsZKXpgkyFK1f0XLYkdvr6gk6K7gy/VAnFaQmMvquwFhC5OKSQBrkazdTZkMsKpjQbnNyYV8qJR5kn1pY0Tsc8k4bzFW8MpN/de/6zrZGI0x209rLo1845q6UVWT8a9ku+0BsM2UxxekuOSmvjo1l3EK4XjJJDZbOfkYKT/bljiVJFSeQaZnKrlSzeWc50ZNbtoMUhqBLJnxaLmp77u1BOm2YNt0DgaA7/mKG2tjzP0mNBvL22CTt7aZ67TJW8lYZ2VrXKunbzOuyZIEV++brLW3BbKtiSPH+iJEbuq6RoZj9QzYO9vDkbMblXHNFJnEuX6GzdEQWx08LkJ7kNO2EqHWr6uOkqetFrmpNUiUAcY1SWJvgeFlEmMLjKmia00iZeT7WXgmn27I2W30SeS4S+mG2xy202SkGPWWQGVcw7mpa0wKMwBLU+Gt2XBtj2vKQ9fIXD9jHY9mZtf2QKSaxJXNMU6ubNVkUhyjELNugRr8hoBcekmqZruWfQ9SV+AwyiXOro/wNZ93Fa7dN4vHljfLPonV9NWsSTSz2i7YAu4gl1LLJB7WTNzPJAJKPk4Plx0xrtmqgsQrFgY4ubqltp9W5i6h/V7JcKWXJc52LsNSatSE7zo+nzBVAgCQh7SO0eZFvEVy092UMyfT8UgTmyOh+tlWk+gy4ODeb2MP+wXY5Y70VdsCWddhVExiqhkloJSbehqJN1EUdblpc3shvUw1S2TOCUXYXGJjEn3skovtAYC//MQjOH5ua6JHH23LNk4lbdxLuix1M4k0x58gZ+xSbqpdgUMMn4xgugo26u9pMnvEXFLCz90EvkVK65A7mjWJTVCblKbctM0BlPazi9zX/HxzHKDWBImojMvo/VkinME9SRep760JG3OvE8dOCbp9Xh62yE1dfUIBNQ/2U6GZRFoDTc24ppBVwrVDYLrFVNe0GW4pR1r/dWI1rmltgdGUmwYyiS2IQaIDeSHx6/98D06VEr4QmItiVzG6a1tkLhLcE6183wwza21KQDlZ/HFRqIw8Yx91JrsMgDvVJDJcSmumPEwmkZqCc2Wquk8lw9wFUA/HUR5uyUwLIB8Dc3Z9iCcemgeg2ES6RthNwWtMYjjjGWJcQ3VsNrgswmmx3csSXLd/FkfOrJdBYloba361UGavub2Qxa4oWRvzHg9xTnQ1mDYD59leitVykTDb50rJzZrENiYxw5V7ZnB8eRPkOOiTCdu3J1vNRUaOrKmPET+fCOndOTHGWEhxkit0b9FCiqPucLVtAKCppi7MBn2mDS6546goJtir2jiLJDCMSXTPP+vDMWb7mXZ4BEomMQuv098aFzX3xaQR7En9up8lbwaXVZDOl5uS26F1jCdR8vbbHgMAvOiph4PHbacmkeb49WGOtbKZOwXpAFi17EJAM+M22aiZgGg6aDvNXdrq/SwybWAyKJ0YZwkuq+emcxiSxMF2ttyj6n3113UyNxWYL83EACNI9NSKk8TYdO3W+2j5bpV7d8ucYElAmPtk+26uuZzcTffP9bC8MdJmhNOUm3bxxSBwe2drx2/HWrKtJrG5lgFQyk1bwjWn3LSlJrEFMUh04AN3n8Avvetu/MI77gweYwYmHBelqm4mPGuqW2B0rEkcZLz6O8oucySZzdo2zs1Gc21Xt1Fuv8M04dW/0Dh9/AMnPPp8PWkxzneWuGU8gDpHT796DwBVl1hlRLstdhNBNYlM45rEzaT4FjIui3CabLNE4AkH53F0eRNL66NGn0Q+I2h7IJJJSIgkrT7Ovy3af+t5K6o6nbl+irVh07iGz9y7Mv/rwzEGpWz5yj0zWNkaY3ljpMxdUl5wo2sZPRJ0V2N2l0X7+YZ+aLcY13zq4bP4b3/5GSxvjGoJBlbrGFnNrWpb3YxrutQkCksCoi1I9LqbtrA2atxkAOZlEj1swzBXcnrTyv/AfJ/l+D0cF7WaqWZQFDInAJOGNyGqBFcLAJq3XdsxP9/E0aUN/KvPuxLPe8L+4HHbcTc1686XSjdHk0nkGDf5yhuaQRsxpfSdKrlp/bODmERXkN4SXLoZeL95k43t9DHw2nHUxe4lAnODVDOJdC/Z5gRAnX9Vk1iVoTzz2j3VPm6DSXQpZVzH0lfvOhqr47Jvrg8pq0TltOSmRYcg0by3uCaIbUxim7upNeEUIjedaIERIDcNYBJjTaID959cA1Bp5kNgLkA2R7kOINpAdTMpwo1axo1gIzj7LynbnWJjGN4mghZ7vF6OVXawn/HkpvRWl4zNPsa8sTsEiR3kplpaxnZ8VdfVMC+CrhOafHxM4riQuGbvDBZnMtx7YhXPum4vADTGBciGyrdUNYk845rUW5Podk50LRAo4OlnCQ4tVnbyVxjW8k0mpZJ/8uQ/lQFNyLjqtaazog2J40FqMonmtcBVCZjqAl+fRJozrtpLToYqW10lEsLlfb1e4k1ukeFVEy73w/ONyfvGvp/f9qaPYTgu8LJnXoV5bcfP6+fYDBI5jtO1nmguKbPnM2yyuTZXTrdJSN1cZHKcJUkSynY6GZECvUTgwFzVU/CKxQGrBcbWuKjVTDWbUleMoP9zmrVcOkhvCTYmvCYMJY11jINZklLiyNkNfOmTDrHGhTCJhbTXHJvPS2pBkhqGT0EKFCO56Gql0Cw3+N6vuBGDLMW3PO+6ciys41oZwcTeXsjsk2gdJyxOqjogcg6buLaAStrugkvKSfN2lgjMDzIsle6+lNiyqgtQzS+U0Pnka796wvHb2QPSEcy62M4qUWX/bi4mF1BrnMVehv3z9YBkGi0wKJCeZQaJ5q5xyA0p1XPDV141ygv9jLHB2s6lGHdogUGyKJ/c1N7Dtfaxre+4TPFIablv03q7YEoOWa0bioqBCQ02JphExsIOUAsZzk1KGVEO22kyiewehOX34Yypm/Iw5aZJwrJbV/so2Qt5Yhy5mS2yJPf1l6PF3ZMOL+CeEyu1489iEo2HJIdJ1EYmiZuR8i1kXO6mdC57aYInHJzXr7/i+Y/Tv4uJ7D+97t5fa21VAGsgLAuZQrbL2FKLRAmoL4BMMx6SMnPkvjTOlcgxk1dmvRO1wKD9CUHtvsmllRFxZU0zz3V8PqGt/D0SaKBK8pxZG1ZZc8FLrlTupu1tiT732Dncd5Ja1Rh9Ei2MVEjiwrVoBdqDlEnmUvoXyJZzFxKAWQ0ZSpBS5br9s/q1xUGmr60QbDXarTSdYkMk4bZxYaoEe2ADuIN013x3dn2E9WGOa41jETLOx1qa+2ELOIa1ILFqQVIxieE1iYlH8dJ0N53ppfi+F91oOLdOjisKCSndLJYa55L7ticuJtk2Sm63SAIt903bttTnu1g61e/w9JoqcaL53yUT1sFlebMemO/Xewdb9rGNSXRdW20mWC4mF6CaxAT75uoByTSYRPoauudz8Pq6eh9Lbmr4iziZxFI14YJVlRDkbtqoSaSAMcpNdwZHzm4AaM86mjAvCk5RbmUl7zaAaKLZAoPLJLKDxFzJGjiZ3VpNItPdlMbymntX34fb26bqE8ebENgmFZoBzlj7ScGVr5cgyY2edGgB955Yq8lYWC6NxgNhkCXB7l5UtO1rNxDi9jex2DIyrU+/ehHf8YWPw9/+5y/B3rlebaw5LGRh7Qr2zL9Z99PysG86K9qQJfY64NyQic0ZD/ksSVi9Oysmy80kmkH6YYOVNYN7zvZSAV2Eb5tPXPUXSeIecz5B31eUAZ/rPqV59NTaVk1atS0m0XMcf/Rtt+In/+52tY8G2+FafAL+hLCtjqWrcU0hpbffp+36Dwpky320JRNGhUomXLd/Tr8myjrxvJDW+6aJrVG9JlExMNXfQ/aR/t5UCdD++MZw678qd9P6uGPLmwDcCWqXC3Q7k+iWTm+NCxyYV4t4ChJrNbnMFhghfRJtsCUgdNKSWZMLtEtw7a1jqs90bs9yvxUtgawrwVvV+6n5n1zKKZnnMuWhtYpNqQGU5Q0OdUGrBL2pZij841xMLqDkpr00qT1vgOkwiRPKLWbCFeCr0hIhvMmtUat79GQJAGQRIDd11ST6FjPRuKYziAnkBBsmvcyuiSuz3eFMonpf115q/dK4JtRgRz3EhdchzbWtqt8eJ3BTP7vKTblMIgWyrPOWV0wip44L6MIkomxSXG7bMonTQ+rJVy7g1OqWftjUGZHwxa5aJIcbHJnXMWCv08w9xjWuTCvdV/0swSBL8XP/+vPx7Mftq70nEZNBG+CX6NnMU0INaMxtqHHtCSVn3ZJxTGpyISYDbwYprgeUGZAcMOW6RpuI4Gs5r5hEwH4tjxy921z1p+cbdN8A/roZOt+nV4f6HAnmfVPVe7fPCadXhzoRabIdtoy8ZsU927bJTdus/F3tBkgy5YLV8EnfN55xDjk5UBlwXNUIjHoZMcDt98DWuL74SoS9Trkt79ucS0KZ3Ob3amUSXcZB5Xed6dlPgteV1isTru+Xia1xjisWyiBxY6j3j1gqjuGZ2QKDLRu1jGuTSAKlkmSCgZe1+9+1vUm2rW6iYx9neQa3rKXaG9yXTGIzSHQwiaRcczPVlsRFACNo3ceWQD2zBNt6P/MCvSzB1XtnG69PL0icbRgktcG8R7iEg35uO8YpdU1bAqKZgRj7s4SAmny7tMBoQQwSHaCTxAlSzIuekyWhDKBqL8ELNqoWGGHjKEMxYIzLS7lHliSlJNY95tzmCL/23nswyouaIxbXuIZu7u5yU87xLypJLEduajCJXHMRvnFNUTOumXiwGfVHTzq8AAC46/iKei3lGRCYkhSVFAhPQNSdVCfHUfNfG5yZVs0ktjmCGQs7ep1ZI6IlUy2MCFDP9smAmsQsddu00zGZsQaJgfd2+Taf1MV04KO+XLRv2riGcb6zxH9tOY1rGMHXdqC+r/rdVU8tpcR6WZ9dk5smhgkTg4En5tSnSji3OcLRpQ3dz5QOkS0jT2ZK3CCF5oi2Zu6TJhWBSRJbcsXHQDqkbEAlQ2yyzhx2e9ioSWwuroOZxETUAu4guWliqQkNDNJtkky1/+52A4CrlrT9vNmO/3Bc4IoFlTQy5aa81knVdpwupS3Mnk0p0yaRBCYlwkA1H7aNmzyO1d9csJrJyLDnhs9MxmyNNWsEia4yBUC5fttgl9Kqn77AEnAziT5W3EVwDMt64/1zjZrEKchN6VnG7Tlsuvl2cjfN3P1dW91NbdLdELlpkmInWmBE4xoHaGHGYqQ6Mom0kOol4dIyep+2yWc4UAKVJCovJNp8U2hbyt3Uv4//55/vxRs/eD+u3T+Lq8qapyxJMPA0F7XuZ4cgcbvGNVy56biQfJOKjvIHYhvcD98q2/qkQ4sAgLuOnVOvlcE9EFYDZj4QfLbpE+OkLBMJlP23B0RcJrGqSWxbJPOYDd9i17cgpN3g1iT6HBDnyvNjNhOnIDHYXZaYrF7qDGrM5tLmeZjppdoAIbjFjaz37rSxgsMyi9zENINEzSSm9prvYV7oBeWp1a2a3CxlGHfQtdNrYWSllDhXuqgurY9q7K6ttioocSE8wYaLNUgmF+S0fyEMvDmuSsq4x/nqqcdGP80/+o9fiIMlq9VWS2pia5xj/3xV9zRpXNM+JwCTbC4d1jYJrk3dAfiYRPWzeThaZcKOROG4KDDoeQwxPPfpVi1IJAWKea5DahKrudOX8PMFX7YSgDaJJP3N6VLa+tyovzYOYhLtvXK9zw3HMTHLQkxDE5NJdCXggCqRYtvepLmResEZ7HmYxPbjYf8brW/NxJPrO51v0GU7N2AGicY54ribUoLN2xbKkTglWI9lkLtpU24aaxJ3FHQxcbIIo1qQyGGyFJPQS/0sXXMMAHYLBpokOAyYzlilKrPuG0P79ejZjZrWnm9cww8SuxrXUPaHLTctpCEt4wX3zf5QQfuYtNc1ZInAtftnkSYCD51W5ks1K/MQRqRRk8Xpi0mBjWtbvobPrsDBNK5xQTknVv/XSosQJrEmSVM/fQtCWyY/pCYxTSaz/7R9WhCazcTTRKDfqSYxwagorFLysUP++fgDc+wWGLpO1sFs0GfZ6i98Y84nyLgGUPOXbWGyOayO7+nViknkups2g2bXmNWtsb7Oji5v1JrA27L/QQkPC9vQZlvvcjeVaA9Im+PaZGyAewEKkMJA7dCXP+UQnnHNXgAwrskwuanPuEbf2y33qWgs0mTA8W+OAVBT0tjgbhNRLuRbg/vJYKMtkALs99zWuMCe2Qy9VGB5o+rT50v4NVFrgeGonTdVE759NM9brpUkbcze5Lbob+5xduMmc19c+2lzAPVJW33HBFDB7MKgWtDP9hO9/1Ja5OR5Nc4GK7vdEuzZnLvp/35G1p1IG+dSy8YJL3naYZaTfFdMMolhAV/N34KzBi3Xab00QSHtx2QrpAXGxAkIcDedaIFxfpjEGCQ6QAszTtBgSlM5VPooN5isUPmhMXFmHqq/icqBL7zWgD47K+uWfItI+rhHzq7XtPZs4xqS+7LcRqvfOdsiCWTbdzNBMrEZXRMavrBORHX8OZmt+sPXlY1UPZMOLw7waFnzRNeWbZxrHwFox93gmsTyIVm5ZFqMazwLGVcATMfWN7EK0b1Gqm5uUWXDXbAzkO1MYprY64DNOp09pgQ04fXuLIx7WzoeUC4HvusPzunzFsqmkwTa5ZIJUNZ0cns+6dv5hHm9pQ65qelEfW5zVAt4uO6mqVAmOb45+dxmpag4tryp2Nby2rYZ1+iaxJZrsrn2p+/qvN8c560t4SGEsNT7te+jL0gZlZK0JnyOnE00W2BMskvtQYMaZ/9ubQknd7DR1vKHx4C5xrW5m3oZ//LY7Znp4azF3ZT73HBJi5vups59NIa1Bdvqbxb5rT7+7n22KWXGIUGpJQArWhh43Sdx4rxVSQGz5Rpdy5njHNC4zPEF7Y7H/mBPM7nNa7nwzwlpknh6oFbz2+//+xfgl7712dg722OZO3YF7VOXvtSEUOM+2p6ZKLc9u9vkplb1VlGEyU1tLTBiTeLOgBbvXNlo9Xv4DTAuCvS0lTzvItaBG1PuSBNQyH5Wi/SSbfMsmE6sKGe2+0+u1ditadQkdjWuoUw+zyRE/axqO0OZRMWk0SQROmnRProWWk2J0tV7VaN0AA12I1w2lCZKbsfpm5cKg32xMonumhRXplUnKVoy0OZDm37z14hU+62/g17s8rKtQUyiw7jDrNPZ05CbctjtkD59riD9cQfmWE6GQPncamESXdKaabbAqIxr7HMX1SPum+thZXNcY9LpnIW6m9I15ZuTz5VMDQA8dHodK5tj7SxpN64JZETYTKJ98RmS8MiSev08/catZSS4rsuEcU1ujfLa4qsp7w4J9ujvdVOq8vh7++a51R2uIMXXS1CNczNEalz99VYm0XMtU/uQxZkMy4a7qVaFBF3/6qcQ/gDYzwiW77Mk/LzBpbX+LuS+sbmU0vn2j7Mx8N7nhiMxRtvLEoEFi9zU5QSt12We56ntu4UxiZPHsjVId1wj5jPgxU87jG953nVlK7WdDxJput9WTWKntaRwjh051DUEa6sgGdoCgyk3TaPctDPo5HJq28y6QA6VTj2ifO57k2OqhXOvRQJqgi6+PodJNDJWiu10jzmxonr8nFkf1h52XYNEznE0byw2k1hmf9g96bRsNzRIL8razm5Momuh1ayjMJ3EzEbpYRlh9ZMs0EPZHsoS+wxQvEwiZTEbEyTdi206fpu7qY8RtAU3YUwiLOPCGArAlV1XYxdNuamgazLw2tJBojtrSmwv4auefiUAtSDRJi1MJtEnI3T1SeTIn7cD06in5zAOIibx8OIAK5uj2uIySYS13q91W5452QwSb3t0GQB0PZgti6wX355t2+pd2xgYl7tmSMIjadROcu4b26Ec5dLKiLQlE/7+M0fxlB/7J6xujTHM63LTRNTr/UJrEtWxNMdVr7sgbDVqhrrDhlb5YUsyzc4k+s29zM8393NU9m5bnOlV7qYJj0mXsrre3FLaQHdTY1x1P7q3Td+tZjjUchzVOH/phgv2fqZhNYku5jJNhK6dAyq/CVfg1uyT2IQQlnVCS02oa07IDdm+Da42HYC6t5tqkh4j+bwd5MZ6V4jw9Za5bzxX/qpPIjDpFZIXsvQBYQaJwXJTM0gMaIERmcTuqJhE/+Lg5MoWfvfDD0BK2WASeUFKL01YjeprdYIMmWTFJDJqEmvSVn/rjJNlkLi0PqoFiZwekEA1uXGb2xM42Z+qlq4DI8tsgUHSYnaQmDfqv1oWFmaPrUOLg9Y6KdtnJQmvwFzr8ctt2e4dnySqzd3Ua1yT2Hub+SZIW7Y7hEm0LWTaTAuAarFoy3hrJnG2yuwlTLmplPV723ZNEttLeOO/fR7u+l8vBdBuuNJEXjKJNrdXgm2BALiZhvONELnpZhkkXrlnBoUEVko5KJ3PJmvm21ZlkuOek28/ek7/fqsOEhWTaKstpP+2OSc2D2UbI0WvN+dyKf01ucDkorBKyrSzFPaaRLssuW3e+u9/9RkM8wIPn15XfRKD3E2du6j+3pASBiWcLDVx7Uxi/fOb41zHUuh7p/56KJPoSsINshR7ZjMtN00Fj0lvJlcAm+Klxd3U8gwIZfbMfTD3ue2Y2IJm8zOt27Pcb4Vsr1sVLYx/jUks53FXgrdKnrrvb665TuK4tgpjbrOO08+AyWNpC4raXPLPF8xz2U8TbDFbxQFME0RZqdKAyTWQ9lfI/PfAxO0W4m46UZMYIDeN7qbdQTdgm2voD7z5k/jY/WfwFU85VAuCWHLTvNBF4uGsDTFHPJmqmVkBwjLkpnGI6TbXt1zoZ9ZUFnJpfajH0XfjLAhpgmcFex2ZRNNwhX0cU5WhCsm00rZ6aaLlBsM8sJC6zOTZWCxgsv7ouv0Vk7g4yHSGOeR8N5uJ+ybzWx46g0ICL7j+gGY7Xb21ikK1UmnPrDsm1rZi7wazR6+7x0w+2Kp2A+5x9oWMP7BU49RP27mjY2Ia1wBgGdfoeuOe2+yjuZBUiYey9oXdAqNkEh3fiz7LKjfVNbJBm+qMQlbn2XV/rw/VPXiobPZsGnfQT1/N9xveew9eeOPBWhsU1c7IPub177kbADDfT3HPiVUAwBXltjsb11gWnzpIdAysFtb119sYEQATPdhMqaFvjHqv5Tpx9Phrq4mjBdzptS1Vk2j0FnS5m7Z1Spx0N6Xj72ekms98s07cOqZzTWK5XxY1SUgA1jyWVHM1yBIsDnqV3DSpmPSQBb3JuLodWFuCDcszQOf7PNs2VSG0qA0KLi3rkhAm0aYuCGmDZLu/zWB23qhJJCbR2Sql5bloUxe0JRJc11ar4Y3BQCbGmSJ5f3Mfe4zn2nbQVLOF1hd27pNYoBEk1sdqcsfD+NsY4CB30y4tMCKT2B0UHLYFKfefXAOgstHmQoKTJRkVSm7aZEOa2BjmeOi02t7IYPdYvdQaTGLIgnBsPLR8BblSSqxsjjDXT1FI4GxppU291DhmPvSQnkZNIk2cpJN3saS1MXn1AOolSbC77LgoGnKEUNZG7aPNNIL+DlQLixsOLei/mU3BuX0S0xYW5eW/+VF86299FMBk3aRrgmyr0ZkIEg3W3IV0oo6o/MwgZqN6jcMk1hcyftMCtb0QJrFXbkP9jVcnS/e2T27qXshwnAyBSjrmWsQodYVdWkNjdlpylBdVD0JXneDGkOSmin2nIFE7jiaTToaEe0+s4nXvvhuvfvOnagspV3JlbWuMc5tjfN+LbsQLbjigXz9Uyk3pGVCrrw0JUiwSpdDatkm5aUCbiKTD/eaRJY9LGX4ToTJ5MgDyuZsSWgNg0XQ3rV73jXHViTtbkDiOR6vc1BFsk9rEuY+OcWTx3y9rEmneMGt5Q2tyAXV83XOC3zjFto+hxx+oqxnajj+Nc9033JrEkERhkniuk4bcdCary01dwaW7xcrkejLU3XTymmy5tx3GeCOHCoijUNoOzPryQZYGkw70PVSZVHgLDHreuGoSzXWjC5OGW1ABX6vcNLUzid6axBgkdoZmElsuqnObakFxbmNUey+vJlEZ17iyOABw5Ow6XvRL78NX/OL7ta4ZoCbY4fpuujF5xjVlTaJZb2ZbAA1zFFLZ6QOq5xhQMVIcJ0MtN+0cJIZviybOvnblDAikjGJzJS0LPP5lCwIKEkPlD83+dhNsVCNrfcPB+drfq8VWuHFNkoiyjss+xux7eW6z6vfWcxzHtsy6a/FDCZvzXZNoY2XDGmfbFzLtWeRye5aHPT1kyYWNako5Mu3CeLAB9ns0L9wW9BwHXNqe2V7F5Uprc3JzjTnfyGv3jX2xu6HlpipQIzUEXW8qSLTfA++8/RgA4Lr9c7WFlCsgfWxZGXs99cpF/NK3Plu/rmsSLXIvifbAhlowmMFlXihG0LVwdbE9EnxGJLRNB+1XE67WLK7ESvO1R5eUk7PP3TREEkv72ZSSq3GeMbYFeWBSzD2ujYGsvz723NuAuwaS2NhBltTcled6pDBwX/8mTAWKy1yntZeg5buZLWmc4ywJj7YkCW2PG6TTZ1oTOe5d1J+ZOxjnpnFNs59t85lf9a92XCeWesuuiYTWekuXCsjx7M5Sf9nS+YIpNx0wfDFo7p7rp2y5qc/dVAetLcdysiYx998AgGIaC6MXeWyBsXOgDDjQTjVvlvT18saotpgLb5IuUUg1EZuUfRMv/qX34/i50hRmbVhvS9EiCWxuD+C1wCA51vwgreSmlocGGTI84WAZJK6UTXmJSWQEifReTrBnPthZxjV5XSYZ1juyyrZyegnSg3yQut228kLiZ/7hDtxbStHoNbo+VE8o/4PtWkNuCvCMQupMovu83XpkufY77aM780nXbFtmvf56m9U3QA/E6v960ep5bNtY2TDWhrZR317bQt6dpa1kYtfsncV3vfAJ+IP/8AIAYJkp0cf66o3zwh0A+JgeGyi4bZMJ2853lbQI2lRnFMZ903OoGagmkeSmx8+pQI6y+tbMbglKhPUyoWty1bbsDPBjyyqYuXrvDK5YGOCDP/Ri/MK3fL5hUqHe1wzAQoI2oG7Ukku/kYnregxlRGzGNW0N59XnTy5AzT6J9X1UP33NxAHodj9Nd9NasEeJ9VYm0V6n3OYuO9GTrjXYo/1yJPycNYn2ca01iQ7jLFoEE5NIMK9/nrupcJ5rZYrUPrdaExC+3rWWOSgkSLSpt0z2ybc9e71rQHLFU4N6o6EA0mNcz9OWWn1bsNFmQOOTQAcxkM1A1iU3ZSibtgPzXHLME+lYz/VS1lpSlte3i0nX16S3nddkfTNk0c4kJmmdStcX5fZaYMSaRAtMijiUnl4umUQqlg92KTUW98K4sHqN82oGISdXtmrjtlOTGDKOgr89Mz1vo3QyfHhCyWKdNJhEWxG1C+bDj8UkGuwey7ZYVu6mapsBD8Ty42kch8mttcCwTEC3PbqM3/3wA3j3Hcfxwf/xYkipEgmmlM0VgJl1VL/w8s/H06/eU3s9JAAwH64+Bvj02pb+/cjZdV3c7rT6Lr9qu7V7M9jwPwwB9XAzAwBdxxIQuDVdStXnecZYvl/IwpoWi7YaGDomSSLwU9/4TP23fsaoSdRyU/d17LNA99WM2UCN6p0yYU/NTDVmZ6NE89i6zGRoLqU2FMdKto+YFJ/cdLWc85bWR7h6b7UAc22LmERiih9/cA6PL5NqgP0cqGvL/z2rxEVVE6SMdDxjPKxB633jXCR7xrTI5mxW/j4m0XzGPnJ2HQAm5Ka1exu0jy0BcAeW1OZK29anz7WwpnsidS3+Heetzd3UdSzHxkLedFcmVitUBVSxNu5zLVuuZatKo/zZdvzNfQBCgz1LsN3SX5T207y9Q9hmGmczdwHUnDE/mFySu56nVdLV5W5qN+XxSh0dLLWvTAGw1/cD7me3qUhrrnXPJ3SrQAFWr24dJA4ynQgMHUeu8Ob2m5/rdYq1MMAqSGzh9JrGNSE1iQEtMGKQaIG5uPIt0LYMrfJSGSTO9VKsbI3D5YcGS0LXRdsa7cTKpmF/LJzSJhtMrbX5fx8o+Nsz2zPqlixMYim9fcY1KjC5+/iK2kdiO0P3UYYd/4lx5efPMLM/tJCsTHnCmcRUcN1li5rc1LafNz90FgDw8Jl1bI5yfczNQKKtTyIAvOIFj9O/6x54QRnhalHkq0k0j9PJlS1sjgvM9JJ2JtGT+bSN08FGCytiD/baF4Tcxtl2ual/Qa72Uf20yXBd7ConAVS5m7p7d5qM9MT+dWASzRYYzuDeJjd1sMbnE02XwixJsD4eT7yPvi8FiUeXNjDIKmm9CojsO7o2rIJEcwGm6rgmxxwvg8Qr9w6sn2c7BzIgAWG6SdJD3WUG49sWbS+EFee2iWhzL/a1wLBLVKsdePi0ChJNJmyylUV7sEfjzM2F9KkUwiY3pcQd17hG/fTVmgG24DKQSXTV4AlR69NKjd3TJMzzwJSb0rsne34Gss0WdUdIfXktuRLAJNpUApUk0LefTQdc9ZOblAQmmeP3/Ncvx6NLm7UxgC3gqP/dtq3mWrKtJpH23xZc+sZljhITU/FmwlSkzWLnokRTYt7PkmDygObuuX4abHYDVPdg5QHhkJv6kneW4D4oSGwa14TITSOT2A3mwt1nLLK2VZ0QYhJn+ypIDJUfmgY0dEE3J5FmIFFnEpNWcxETZiBlbr/5nj+76WFASvzznSfwFU85BEA9gH3GNZXcdB7X7pvFkVICpG4aFQS3ZbLMfXTtnwt0/GZ64cwebc+8scOypuqnYtvCjYOoBQb9s7mb3l7a4gPAxx84gy9+4gG9Lfrpc0izgVMDlte+m7ve0rw3Tq0OsTHMMdtLnVbfbfKfVlmNJdggNBdpoQvCJsMd5iQ5+dAupGxtG+DucVm5mzbBsQqn40YOj065KfP422A61brG0fb7lqSAi0U5nzCVBYC7TpCO76GFAYRQtdUUMNK+utYWK5pJHNZkoa5tbY0LbaJgg+24hLiN0vUqG/dAF4lY0LXcyHaHOrCq99Zf98nQfQZH5oLvaBl8k/kQUGbkLcFGO+PfnBNQjnOPSYRNblp+nmOgaz7IG6oQ5zjLcfQ7ctrvU1MVY9YkzpdyU8Uktj9PzWCTbvkJ1qzlWq4CYHNM/W82CEvg3CbbpXGTwb1i0luNa6xscwhLPbk9oDrfTzq8iCcdXtR/bw84XNeJXe4YMidMXMvSH2xXbVns65JmYlgnrafQJxfglzzRuNleuNkNAO2m7UqIVSy1r3TGorqTeQCT6DCu2WYLjFiTaIG5uPJdIGuGccfyxgjDsdTGE+G29dVCxjWJU43Mj3/d0wEoGafO0KRqQraZ3dhAN8lMz80kfurhs3jt39yG1/7t7XjfXSd1sLc4k+mb3RYUacZxJsOzrt2rX1f1fuFMVi1IZLWyUD/7qXthvbo1xk/+3e34D79/E+4/uaq3lyUJi0kx5Z0c4yAlJU70ftqYxPVhjscfmEM/S/Av954yJBNlkOgttncHG0BgTaKRSVULJvv1RffG4iDD8XOb2BjlmKXss2Uf29zYKLhsPqCGuXsRSWjeA8EmFY2HdlBtlSUjL9HOvrjuAR+TqBj4rjWJk+eMJKI2cOSmZkbUNc4nN9UByg5SiU2XQlcyx0ycHZhTwSHN47SvrmNCz4C1YY7NUVGx/bZsMLo1Ew8J2mxsLjkpu2ALLIGwa3lCbqo/s50lciWBrO6mqZ1FMceZIPMhoJuUnP5u7dPXwmQ5649akzL119uCm0Sft24BwORCvnqW7Z+rkiPEJIYqlcxgzic39bPN9D5eAqJiIKvXmve/fZy9ttP3rKHPtN3frTWJiX17gPvZ7Qw4ApIJ1trCANlo85pUzuXOYdbjT9uz7WMlN93ZcgO6/8k7grtOnh9kqnyMsZ5PE3cQHMIkppbEBWThD/aASeOaoBYYUW7aCebC3SdbXG0EieOi0BNrcE2i4VAloX5vTv4nygb1Nx5ewMIgw8mVLV07QO0lQiViekFE7qaWpy85xREeOrOOQZZgkKVe+Q/JTRdnerjhUOWu2U8TZwBs3ceOtYUVk5I6j/+H7zmFP/jIgwCAL3vySTzx0ALIzMPnvufaVsW2hR1/qlsFKACYHDfKCyzOZOhnc3jkzPrExGLt7dRSR+GyqLahMB6uJAtp9j+i/QSAawzWeLZkqP1W3y0upY7v5nM3bS7kq0Wrc0i5vaZstHy9RQ4CTNaNhQSkQFNKKL2LO+UsGHZtNVtguJhE5zXCkICa59I1buS5JiuTrvZtdYUpfwPgXCSYLPyhxQFOrw1r/cp8GWjzGXDs3KYO0F2BZVszcZvDbIj808Yu5UWL1M5xPYbKW7lsp7vFTfUMnNhHB4sCVPPC4kymE5SH91RMYhcpOe2nrd7SN0w4FuTmd5jYjmZWHeOcfRIdwXZLcOOsFTfuE5NBp0RJcE2iXpADKOyBjTKucX+Gr0+iN0ixJO7092oJ7m3Hv6u7b1ByxSX3dTxzXCZfIUz1BPvYmqQq32c5byFSZqeUvBkklv8PbR3WFVpyLIhJDAz2yv0mQ7FhXniN8/T2SjWJTxIOtK2BLOs0KQPlpmbGu/z9YmmBIYT4EyHEY0KIc0KIu4UQ/0/5+vVCCCmEWDX+vdYYNxBC/F457pgQ4r82PvclQog7hRDrQoj3CSGesN19JbevhUHmZQRNJnF1c6zlpkA4k2j2gHNN/hSozmQp9s6qZrd5mSUmJ6VQ2VbFJKr9bNoxA9AL/t965RcAAN59x3Fd6+GqowAqJnFxJsPVe2fK96v6Rz3RBexnYewjpyaxWiQnzszPyZVK60/BN/XoctVW2WBKPVjGQYXUgZetiB1QE1IvTXD13hkcXdqoyXiAFibR1d5AL7bCH/bUJ9H8fBNVkDiDh8+omiBaWKRi8ruFNClOLXKcUV7UzBBsaBbph9SxAJMMQMhC0sn2tDGJFuMaWy1pfUy4RGaiB6qDNWszDgq5R2sKCIdroi9Drk2KdnCR0DQJSB2Mf27IHcnh1OxXlljYBsLq5lgf7xPnNiuXUmFxqEM4k1hf7LZfx7ZaotbsvyVoCwmIgMn7u821ksbQe03oJJAvmWCbf8oDTO1DZnpJrYVAk0msXDL9aDIwQTVxNtliixywTZbvrEnUzFL1min/dkGPczC5aSJw0AgSzRYwvD6JJpNYf49EC9tsWSeESDltc3JbsE2faZu32pnEyXtUfZ53mPWZXyXF/bWrzbmrSubat0UqoNoY6Q+AyfHbxlIHyX2dbPpkCwzAvv48n2jKTTn19kBlXhbuMK7KOVwKiBDjGqvctAiRmzaMa85TTeI05aY/B+B6KeUeAN8A4H8JIZ5n/H2flHKh/Pczxus/CeDJAJ4A4MUA/ocQ4qUAIIS4AsBbAbwWwAEANwP4i+3uKC1+5wd+PTJlkef6KVa3xhiNJfqpqtEJZZbMwt7EMkECpvuYwL65nmItjb5SqkA5bHsk79ILSQeTuH+uh2v3Va57p1ardhaA/aG9OcohhPpscu8z6+jU9tv305TEFjKM/TL3qZ+5azRPrGwhEcBVe2ZwopTxFoVfImPdR+PByjEOonYbNNa2IB/n6jq6dt8sji5vGteIMW5CouSXnlTfjVFbkghvcElM0VV7Z3UD8lmPI2SbPEZt0yJbLAoviwioSbdej6V+ti52HQtJ/uI6IPtMxjXGPTBuWcikjJpE2h2qSbTNXT7jAlffPBvGxjXiWvxXD+jJ8Vr+vINBopZp033jkYAC6rxSTZvJJLpMaAD1DKCE2ImVLX39C2EPttsWoDaTikLK1sjGVkvkkxarfZwMUug3bnIlhO10za8+xs03J9Nz+ooFFdjMNmwSJ4K98mdIMFs//tXnudBUJKh9bp/vfLL8NgbSPNeu2q/athzri9wI7vbOTi4aVV10+3PDPE4uk5w2xpmOsTlMBhx/23USsiC3tYkYF+2+CV0SCbSfXCbRaVzTElwKCyOVF/5emoBdKt8WXDoTQI56Y18rtfMJ89ruUpNIbrMcV9TUYBJtTC7gl5vaWpx1M66R1esu7CYmUUp5u5SSvGRl+e/GgKHfBeBnpJRnpZSfA/DbAP59+bd/DeB2KeVfSSk3oQLKZwshnradfaULYn6QeWviyLjmqj0zWN0cKwaoZM1CmSVzcrf1ugLqTVP3zvawtDGqSUtc9S++7Q16ae3/Jh49u4Fr98/iwEJ/4m+uQBZAzbikYhKF/n5qewEPmwbbGXos60yiI0g8t4WDCwNcvW+mziQmTOMaQxKbOXqi2TA2Ah5bETugvm+WCly9dxYnV7Z0c2+SGFub5LY8EFM9aYV/t5qZj+V4EuNO7AtQyTNsi6ZwJrERJI5la5DYzOyGLCzo77ZaRt+q3CbtK4ow18T6NgKYRE69a0NuarsHKCFiA+f6N/fbNa66jjxMYmByqwuajYtdrCyxq0IIXdNW67dnSXgAamG4ujXGNftUQmxcyFqSxCVt9bE9rl65oVJmc5N5ILtnNeDwjppcJBcy3IG1U+2q7ViW1zcxiY87MFf7e9II9qqFvHc3JwL8kMSRvf5L/fSayVjYnra53NcTkBtImf/PUmENjnyS97WtMX7nQ/djlBe1FhguUx51nTh3sZI7Mq9JWwDcJvelv9nYtlYm0SFl5t5v5n66/QRc5EF7cNkkD8YtjKD6PPs1GVbvOjnO/DuB45GwHdQNBjk1iWogrWe2AoJEalVmJtdtcmu1P+FO7erDA4LEpnFNUE1iirbZfqrGNUKI3xBCrAO4E8BjAN5u/PkhIcQRIcTvlwwhhBD7AVwN4DPG+z4D4Bnl788w/yalXANwn/F3c9uvEkLcLIS4+eTJk979pIeWkpu6LyqSm165Z0YxiXmBfirQT8PdLivNdmKdINX+qP/XmcRKI93s2ePdnsHSmds3sbI5wr7ZvjZxAIDv+YonAvCzDRujXC+SriqDxMPloou1AJXdgkRdk5ilzoX1iZVNHF4c4MrFGRw/t1nrQchxXDSZlF5LC4xxXuhrxZSb2YrYAfV9e2mCq/epY3jPCWWwQ85znbLPibBr3UvcdWwFr3/P3WWNHPR2Mk/GT+2nwIG5KhtVWyQ7ZGV+JtH2EPUbcAC2RWvYgtAlQfEvCOvbAACJ9oevrd6sOm/uBUJoAqhqgeFWCVBhvQ0s4xrj+ncrINxZU267DQ7+4bNHcf1r/hFn1+vqB3/gpt7z1KuUqyD1MwTqztMmNkcFCln1PASAmb7BpNuYxNy/ALVJAtscIQHHNSn9tbW0PWtypWWDk0xi+z66ald9LJhfyUA1/Or/L7j+QGMfJ+W3QJi7qb29QUuw51BOcBnIcKfq6jWJ9vnOdc+1BZg+yfuPvPVW/K9//Bw+ct9pe3KxMa5NceGTQIfUiZvnzWSRXLCxbW2ScNrPZk0uEJBcsT0XC/+5c/WUNevtrOMsZUghjL+VFZf+OcEmdwfcieHKAHE6TGKalKqcwOeNdsrPOEGi+kn1j8Dk+tr3TCQ0W/CoDw+QmzaNa3RNYltvLj+bONUgUUr5/QAWAXwZlEx0C8ApAC+AkpM+r/z7n5ZDFsqfy8bHLJfvob+bf2v+3dz2m6SUz5dSPv/QoUPe/dRMYj/DMC+cUk6Sm161dwYrmyO9uOdk/yuW0G2cYhp37J3tYWm9ziRy3E21cY2HSSRJwqzh8PcjL1POqr5gb2OU6889ON/H/3jpU/GH/+ELy30MZ7Lo+85oK3/ed2uTmx5eHODwngGOn9usZbo45jqFMfn55GgA8Nq/vR3P+J/vxMfvP43huNBZNFsROwAMc8WckdPcQ2UPMJICefskeqQkmWeS/Ppf/zBe/557cHptWDMg8Mq9xup6328xO7Cx2yH7aAsuKYj3oQsjqPfTGlzyFjJBTIrlHjifNYlmkgSwS2R8clNfvbFrW7U+iYzFJydpxMUvvvMuAMBtZSsZ7W7qkIWbElDq8frgqTX998RxDqhHoumoqY2bbJIhtC9AtUyvcS23XVvCcg7aJGKAvbYwBLZm4iFtMwBbErQquZjYP0/igs7JN3/Btfier3gi/stXP2VibNOBGAhZJLvqm31jbOoO9dM739mkfQazbQO9bGvT0YVJNFUxrnGu+/Qfb30MgEosm/e7y7ijkG1B26TDNacm0Yw5Oj9vAoLESZaaXvcOczCJhfd8u5IrbUxpcx+BdgMa2t4EA1xI+FSqrvu0Ogf2Pok7WW4AGHWbpQQ6vHRJ/aT1TIjcNDfmibbj0WZcY5WbtrqbNo1rAphEoLUuceruplLKHMCHhRCvBPB9Uso3QNUSAsBxIcT/D8BjQohFAKvl63sAbBq/r5S/r5b/N2H+vRO2dE2iOjyjXKKfTd4hTSZxOKYgkcEkFhQAumt7TF333tk+zlFNYlplyIPlpjktJN0WxOOiqmX5+mdfgy+6ocrQuiZ/ANgaVcY9Qgh8/4uepP/WRco543Fp9I3zyU3XtsZYPLSAfbO9Wj9LM/sZEt+bNuVZKrAxcn+vzzyyBAB4x+3HsD7MsTCoHECtC8m8QD9TrDEAbQqzZ7ZqL+G20fY/EG3HvyikngQfObNekzv1PLVjlBTZZzDOxKT4MqZtcjvbIqYtQ9uUDYU+tJOk0VuO6thaFjK0X9X22pkUm3FNey2p6i/aJvdRn6t+9jP3OVNmJrzFiA2mKUe73HRye2SQsBNBIjU/vvu4egzQ93K2pTDqhG+4QuUlX/TUKpHoSsLRvHRwYTJIdDKJpUmWC7b5NST7b2OXCumvx6Jx9vumbSFZPyZhDMUk2wNU10DPclxcGXmgao+0Z6ank5jN7Vklga3BrL3nalsA5npu+1s+2OfJEHMjW3Dvl3I61hcNhcdHXvOVtfvE16u1V0pRT61saWf3JKmOsK1PYhsmE3fqp++s2ZIrQRJci0zYXP+497EZpJfbagsuE1utfrskVr3PFXC4gkS73DGol6PlHm2rraXPN+FixSu56c4yieYzyJcknxhXvq+Sm072s27CVNfoect1zphzSZjctGFcQ3LTtuCyhUm8kC0wMthrEnXCT0p5VgjxGIBnA3h3+fqzAdxe/n47VM0iAEAIMV9+Jv29EzaH6uDSonyUF7UaFcLqcIx+lmD/XA+FVO6evTRBLwmvSayK2xPrg15tnx6iCfbN9TDMC6xsjfSNZquHILzpg/fhSYcX8JVPuxKAenAJUS0kbRbE5oTwa9/x3NrffIGUYhIdsjlGC4Ym2xleNKx+9jN3jeCoDK73zPYgZdW2Qy12y88JeJAVxuTXS/1M4onSUfXWI8tY2xrr5IOrkHqUK7aRmMNHztSZRFuwF5KhcrXqIFkeADxydqP28PHVJA5ziX6WYJ9hdmC6m7prL3iLJol2lq4pGwpf7LqaInvGWLKEikn0bkozKeY5CKlJBKjnnX+yb7qbWltg+JhERp2gbgpssAbcFgCuQGo7WNsa40x5PX/yoSUA1TyS+QI3UmUkAjf96EtqTcWzJPHWxC3OZPqenK0x6ZP7184k2gKAEJaa3lu/ltuuyYn7JkC2SPvZZNJDTDuAyfnV2yrFp2QoX7MlcPU+2iSBbYn1iQCAXvcnjiZ6y3mSJNW2bAk/f5uUakFevaaVZUFMon8/qcbWHOd6vi0MMmyOhji1OsR1+6t6dGcyOeQ6mTiW7cGevS1R+/G3nrdCeh1R6TOb1z/QLjdNrX4CRWvQoN7XGNfy/VyqnPbEqYVJbAku3e6mduMa3QJjSu6mZFwTrLgrj9ssYw0aIrduMykCqJ2Omq+EotXLP3CNa2hS2F6QOBW5qRDisBDi24UQC0KIVAjxNQC+A8B7hRBfJIR4qhAiEUIcBPAGAO+XUi6Xw/8IwI8LIfaXhjTfDeAPyr+9DcAzhRAvF0LMAPgJAJ+VUt65nf3dLLMGe0qjENcFMhwXmMkSLJTtIc6sD9HPBHqeFgxN6AAwEU5dtylJ3V+yS2+/9VgrkyilxM++/U78xz+4GXcdU1n1cSHRSxIdYNqaWfuyRr5Aioxr7OPC3QyrIJHngFgZd9gXdfTZWSL0uSVTmCzhyU3NDJmvT+LGMNfOsLcdXcbZ9aG2aXfJTUel3JSCwocbQaItKRBiCqOymJPnm1qXACogpcWlMGoSbYsEVYOb1Bow+9xNQzLrttYBofVONokSuyar/OkNEnUmv7mP7Ysfc9+A9jpNX1/SJjST7pFp53m7u2nY9V/NSa7FZ6uZEuOhHYp33n4Mw3GBa/bO4KP3nwZQZYPTJLEmO5pmMof3zOjAElDXkDVINBgwuqdnetVC2VamYEpbbbAZ18gAJt3NbocwiZbFbgArOCHTDmQSJ8sp3MY1+jllk5t6ZKp6HzsmjmzBhp+lmzzfrh5xtW1ZEhdtTJZeJ9Tmrfbg3vXsbquBzFLhXMzT6ydXtmo1gG7jmpB+mk25KfTnumBblIcYB9l8AYKYxMZ9Q8e/m3FN+z4Ck+etjSm1KSfC54T6a21OyS7ywPV80y0wdkBJYqLZloVbumH2SQwdkwrhfJZW0u528zI9NMSABpg0rjlPctNp1SRKAN8H4AiAswB+CcAPSin/DsATAbwDSiJ6G1Sd4ncYY/8nlBnNQwA+AOAXpZTvAAAp5UkALwfwv8vP/SIA377dnd0YkoylYhJtIIaRFghSqpOfJcLbJPSmB87omhf9IElNJtH+EM2SBF/9eVfp132Ny4EqAAKA3/+XBwBUAaCLDjffY4Nr8gfqNYlNcBagXY1rKiYlxbiQ1kWa6omY6L6PprmFr/7FtY80zvW9Hl1SAd7LnnmVNrowmURXn8R+JmpBYpaIRgBmz9j5sqau+jYzSHy07Muoe8t5ghQlrxbYP28Y12i5qa8+wZcRttSxBDqH2nuiBSwIawvJ9qy1bZEWwvbY2PS2Y0LHPyTjOulu6mASPUFbc/9cqD9869vX22pjEkX4QzsUtx89h9leil81FBDUziJNPDXYzIU8UJ+Xib313aNAu7uprS5dSTnbmMTJRZrPyZbQXLSGWvnbHC9DmUROgkuz71bFRfu9Y5Vkevdykl0KCS5tCb8QCaLNpKKNybL1sgsJpFzP7rZgwyp/K0HP5lOrW7V9cEvQA+dy87zp/fOMsbDUIcZBdrYttAVG9f/QBIRNKZMXhXd7NF/Y6gQBfz/N5mkLYfxtz+BWualDheJ6vvkM8c4ntAlfyzqtCfoeWm46CmES1U8h3M/SEOOaiWMZakAzYVxDF2Ubk+gXlE4lSJRSnpRSfoWUcp+Uco+U8llSyt8u//ZmKeUNUsp5KeXVUsp/J6U8ZozdklL+x3LclVLK1zU++z1SyqdJKWellC+SUj7YZR9Pr27h+tf8I/75zuPYHJHctGQSXUHiWCJLqoADUNnQXupmEt9+62N4xRs/ihf/8vtx9/EVfZP4mrnTw7CfJjgw38c3PucaACrjDdhr1ADg+Lkt/fvnHjsHALq/om9BmEv3osk3bnPkYxLdjNTE9jWTyJWblscpc2epyPCHzu3SuiE35QSyRobMFaQDSr4JAN/6/Ov0a2aQaJexqVq/mV6qv8ve2Z4OQmxutkHtJRwPe5LcAkqulxsPSZ8shGoSqTUHAF2X4pObeuVXlsA5xDm0WUdEv7YtSFyyoZCsNd+BcvL6aqvT7DEyrnRqvXJTz8Pe1dybsDXO8TefehSbo7x2vTkXny2LZJuT7XYxygvM9BKtFACAuYHBJDoDN/8izSp3NFyn+zpINB2nOwSktmAvhEm3LNJC5KbNRWvo6ZhYyAey/cAk4+x3N3UrXuj67jtWXG7jmrZgthGABQQpwiobpe/gT4rZmKygFgxMtlMfS8e87DPPct2ntSDROE4VI15/f8hc3gy49aZ9LKllDjIDBBeEJbgPIMWRCkxc/0CATNvyXGw73y7Tv5B+mrbERUiQPlE3LP3JDi03DUwAaa+DnZab6mQ+Jcl5a0ktNw3pE2qcD2eSpOV5D1iku8FBYkobKX9eXEzirscdZRD1Wx+4HxujMLnpKC/QywQWBtVB7mXCK8/48L2nAKiJ6B23HdPBRpYIp67blHYBwKHSKOHwYtVewrYgOV42i7/x0DyOlb/nRYHUCEhdzdydCzvPuM1RXnNENaH7xoSYYugg0b3YtcE0rgEcrEGuAns6tyaTaLOfd+6jySQ6gnRA9ZwEgM+7eq9+bbEMEl21pKNyHwFoltrsRWgz0ggJwNLELotdMYLE9WFeOpkRk+gOUihIBICbfvQl+LXveK7eX58Da5tsheuIB0wutkIZkS6LLVvtcAjbY5dE+RdoXZIrut7Y1iexJUvuajgPAD/2ttvwg3/xafzxRx+y1602r8kWuZ2rtcR2MCpbAy0YiTuqk3XXJPobTDcXhOY4QN0jZF4za9TkdnM3nTzfISy1vSaLzyRSJMWXqQYYYjjcTc26fNt2gMlgAzCfi265aTPYBjowWeWvbfV+zUsrlMmyBW2+a6Tax+r/QQ6gzuPfFmy4y1lojjm1OtTrpH6WVPXNFiaxLQITom4mJgNqEm1zshkgOMdZ7tPwpKTtGvEOsybG2hxHXefNLAuxwWbKEzqX2IIbr7tpC0vdvLd1GctOG9cYLLmtBMaFZpAYZFxjrAnbelsGSXc1k8iQm5rvlwUAEZApj0FiEIhRyguJrVEOIerupjYMy0UyLYwBldX0NVe/9cgyvuRJB/Gsa/fiX+49ZTiXGnLTxtCmrIYWJLRdIezBFwWJz37cPlUzUEiMChWA0D1rW6MVAUxiW5/EiXGe2rYmdJCo3U3DFpKTi2RL9rl0FyT2l857jV21HJRHzqzjx952K37krbdinBcTi2QXk3jk7AZ6qcDhxYFerLYxicMy+QBUkuEf/KrK3t1mpGH223TB5loGAOdKuenhxQE2hjlMtzVfTSIZ1wCK1f76Z1+j/+ZzYPUukm0PqIBAomttVfMcyIBxtPtNeWtr9tlyfbW5m+o+cQH3gGllnyV28yxTSmyDjxX/5MNnAai6P/NcumrN2vqUcWpEQjHKJfqNObmSm6pzbWsw3YlJNJJ3V5eqDkqauOaENlMSW69KiRADGlviQrbW5DYXTl0ZEZUkad+WuQ2Cj3GrEhA2JrE9CWHOWyH3NuCuN/N9P5dEz7d/atyk3DSsJq5RA6mDe/cY1/OtzeDF1TrGfC6fXNnCemn4N9tL3c/SwGQat5ZUlwCYwX0Aa2OtvwuQaTcNh7QpUkBSxuYu6y8TmXTFBtrnctFIkpQ7GnSfNo9Ju9x0cv4BPEyilpue3/m/iYl1WiCTSMea0wLDDEhd7exCjGsmFG3EJLa2wKDMDAWJAb0VgVYm0StGFUL8MSqVhhNSyn/Xvie7G0eXFOOTFxKb4wIzWeoNNuj1fjopN+2nbsvo+06u4ttf8HicWdvCpx5ZqkmWXLpu2j5R9M0bzjbxAGriBoBnXbsXb/3kozi1uqWbOfuklb66GV8gtTF01yR2MeDg1iQ2a7Jc2X9TbkpBWK23k2Xc7/3LA/jTjz8MAPjer3jihNzONfccObuOa/bNIkkE5voZ1oc55gdmLenkmHF5XQHAa172NEgJvPSZVS1qknjqv3x9Ei11REBVk3jV3hmsD8c16ZjvvI3GhV/qZcsioyUAs7FLMsCAxlnH0p4RNs9BCANpk1fuNJMYdN8U1ULFtrCTUip2qSVItyWA8kLiyBk1R372yLK+J2tMYnPxGcBQnG/jmnGukkDzhqJhzmhwD0wyh61uki7jGm06luCqvSpIPL1azSe2OaFtQWiTZIbVJKqfTXav/fqfHAMEsA3JJNsWskAG3EyibV+r+Wfy88z+wdbtJXWXQJ66oPp/CJPoMxPz1iRaardD3DUnFRDV6y64jn+bbDFNEmftPKBULidXtnB8ZVMlydOq1YAt4RcWpNiuSc8YC5MewtoI4WbovPvYSLiGBLKAegZvjieTaSH1frZ2Cm3j7O6m/n1UpIPtvPGCdPV/exJ0Wi0wzEQlz7hG/eSUPFmZREfC25vMb5JFoXJTG5PYFlgC265JvBfKNOY+qCb13wQghTKgSQB8I4Cl9r3Y/aAg8ez6sAx2Eh0kbjnlpnKCSVR9Et3a561xgbl+irlBhrWtvCaZceq6czWx0sVDP0lW6WKktsaqSet1++cAAMeWN3XW3FuTWEinRMNfk1i0GteE3KT08GfLTQsKEu1yO5LHZImYMK7JUveNDdQniaX1UXCT1iNnN3BtaSlOwWHlbmqXZxSyWvh871fciO97Ub1TjM3wJqgm0SEbOreh2NRDCwOsD/Paw8dncDQyGM8mhJjMRoZYmbuYxJCFnSWxHiAt6+6kx63/sl1fbQs0ug5C7ptCVp/TSyfVDPQR7b00J18/fm4Tw7zAM6/dg2Fe4Egpoyajrub3Aqp5rEutU1fQ/W1KEE3m3twvggrc/GyDVZZvLIC+8mmHAQBPunKhfM3OgLdJW23SstBFK723GhcmLauzZvR6+/YmnVT9Y2wOrIC/dszPJJIrqvv6UmNluV31elAPSOZ3U7XU9deKlutfbcseXPoWkYBHbtqyj+Z79di2IFE45v/ymUgtMx45s244CU8m0mjbbWZiwhkAu8fY1iX6Gd0mN20cD4mwJEk9kdB+/AF7Yqwt2PMZDrWN6xqk29jmkAREqCmVXlfscE2ieW1znjdNosIVA9THqJ/mWr2TcQ0F3HQsg2sLyziEzGuKKTCJUsqfot+FEO8E8HVSyg8Zr30pgNe278Xux2PLSpr52NKmlk1qStzDJPZSoRchgHpgZWmCteGkhrkoJPJCBZbz/RRrW+OaTbZL1z0qHTkJ3/aCx+HOx87he79CBQ9W9gWVjIpqF5XkVGXafSYVuech5c4GSwzzotW4JsgUZoJJ5GV/XMY19N80SXTPSUoO+BzZABUAE86uD43JL/HKTU+ubOELbzgAoDJ16XuCe7PdiQv2Zrft7qYu45qVzTHm+ykWZjJsjPJaZtNldkD7atZ+1bdlz2LS/rtgazYckv1syr1M900fnH0SvduavE6k9B9717jcuI6s++dZJDeRGwsAW5DYJm1V+2ifEx46rVx6v+zJh3Dbo+dw30nlzpwk7sVnJa1xMIk7EiQWE8wSJY2cwWzR5m5qZ1LGhgrkhTcewk0/9hIcXlSMoquOa1xIzAXZn9evrfbsfyP7jMAFoeP6b4tKJw2f2hf/Lrmp77r0JRerudJRk2gkuLKUt5CfNOVpn39cC2TuQj6sJrEpSa4+z4VWJtEpC3cZN6njf+2+GXzmEeXCbfbJBSYTMhJdpMzleWt5bjS3F1rLOBEkhiQFGglezSSGyLuZcnen4ZBsLx3oUpOYWhK84XJT+zOgOZaT/NwO6i707tZoE+PK9/lMEJswiQMnk1gEXJNNszo9J4ca1xhMYluPROC81iR+MYCPNV77OIAXMj5j14Ikd8O8wLHlTeUsWZ4sr3FNWjGOgLqoeomw0uhmDcv8QC3IyUl1kCXOIGVc1tkQFgYZfvFbn43986o/nYshIhkVLeTXhmOMTJbIOc79UHTtIxX2msfChM3+3wVa6HSVm7pkws0A7AkH5vBA2YokSxKr+QNhs6xTBYDljVEtS2lKmZo4szbEgfI8/V83HgQA7QZqC/ZIwuOScQL24DK0INqWuVvdGmFhJsNcX7HbhXH+6XzbzsHWeHJBrrflyGICbaYwtuAyrN6vubAGAhaESXNBUr4esCCZkPYFLBCABpMY2CcxJFFiLmatcl8qbWi5Rmz3KNU3v/CJ6hq+/+RquX+JN3EE+Baf7uRKV9iCRNG4lm0ugX4JqH0x0zROoQARcCfu2gNSCyMSwCTSR3KDy4n9NLLh7eOMYTJs8Q9MSkd9NXFJIqzyN6Dep9KGrHGfBsa/E60DwpJUlgV5SJBouU7GLc3VbeMqqbl/DOCrk3IfR1ftPABcvVcxiQ+fWa+15TL3C1DBlwwJUizXFhAWANcdp9vHNdud0LhW5r4xd4UmJZsMMO2zv05Z/bSaybS0k2qetjDG38YA+2XTTtNFh1eCz+vgfCJU8dUEvc9ngugaY9bpuxxpQ/okTtQkBstNi+pnEJN4/lpgfArAzwohZgGg/Pm/AXya8Rm7FuRoCgAPnVnDoBdSkygnFiRZQi0wbJm3MohJE22mcLKsYZkfZEaQUh9HdTYuuBZ2tPghN82Vzf+PvT+NtmTbzsLALyL23qfLzJuZt3vvvr650tN7T3pCEtJTh1os0ckGWbRFQRmQjI1MW1AYYfCQGaYQrqrhYVcVyOAqFwUlMwYYsA1VBgRlG1OgKiMjGdGo19Nr7715sztnNxFRP1bMWE2s5ptxmnsyc88xcpyT++y1Y+1o1ppzft/85g5t24+1jSmRil2XPl4KNSht2DmVzNjxgXl9EuvKziHG4Qes8/Cuu8djmxCfgjv97LNtO4pTvPEoQBITwfbjzQ6n2xbP3zBB4h/8JR/Cf/ndX4P3vXAyHnNCGy3U2QCpAMz8zPdbSquprhY1jlcNTjc7T5I7W5PYpmsSY86P3eyTU4x+tx7lTTss0u+J8yHHi9a/ZFZG65Db1zRIit/La7iPUo6uogWGF9zHEIrRGc/PMbYmvDbU7n70Hc+hrgy1TD6r5HymaWwXjyTuuj6zBg3zbKfzLInJ5GoSo4IrGSSxFDQAmNQ7MegXEKtJzI+bIon+56XHhYEsQ9Eb3ju5T8zPvABN7Pxb0bfoHIOkQN/n1SDHeU6+G9c2oOt96jqVuKumNFVXOCx/PF1yK4X2lGixdeL8iz/z9qEet+/hqZuHawkbpIdBCoMAp5IrQImmGj8fWuEadhlr6un9v8sk5c2Y6Zog40r31pzSjZif0HYFddMSkhgMFh+UZYnNNbueGR801T87NHkP04Lqzcdb/A8//tqkdzYQCbYdcCFlk77DdAuMQLima8vQNnChSOJvBvDVAN6squrTMDWKXwPgiRetAUwQ8MLgzP/s66c4WtbjDVKim7p292RlWmBEMiQ7B8mS3l2ffWAy9EfLJpoNBoyKZEm1MnYPj9TWIUh8tN55TkpKpKLLbFLJbHDBIVwEG3bOLB88j+SGJjRJS88I6HajSqz5+3uePx7/Zh5s+zmhne1avDxshvdOt5MFIbaIiIjF8wOSuGhqfPQdz3nHDI9l62zyhc2T4xGOTKpwW2pgjlcNHm9bnG5bHErbgETAbebaJ5HjPJKYz0jG6T+ljW3qIAMEujEDSYwhZ0wgG0USWXVT6rmxnxOrLRwRgxxKmlgTXn+0RlNXuH20xN2TAye5Uhedz7QgxuXQTVP0w7QseVege6Xp/EA8wE99t6JIThQR4Rw78177mgluyoiUtrbNjnOfG279AabnfxSuSQUpiYB749B9s8cb3tcRwbaMUyOyw99DBBIoITDx85FLCsvxwmstn5ey1FpSosWm7n/Zl1+6dTius8dukBigZvIJlLqpMgCOJdjH3zOHiyHADNo59bnKaysQ3/O7rtCCJ3HdDHtFt5eyqHgs4VcSPAMwSXikahKvqgWGm6hcRNbI5LjBl5Rp5/bf7/hTfw+/7vv/Pj41lKzVlS0dmwAVY0Im788Dzh5wnhYYFN10lf0zHST2ff9Tfd9/FYAPAvg2AB/s+/6r5javv272eNPiPc+fjP8/XDajo54qWt1E6HavvnwjWg8EWHqGK3bzmftrHK8a1HW6Jm4XCUZdS6rvDQHh8apBVQEP1ztvA0qJVOToLnUikCoJp9h6LKYFhvk5pwWGywcPx9l2I+bvIugjr6UKxAGj3HqyWuDm4QL3Hm/H5s5CLYitIaKcevfkYPpHxB1y2XjzfdvmLf4lx/Vo1aDvgXuPNyNtqFSTmMs+TxBBMts9pW2Rvc0iQWLJLQzVTTUCEKHgDVP/CKRqEvOOLrOZtp111FOqie5npo6XSnjcOV6hriu8cGM19l1tqiqZOCqrJl6OcI2slW4SyBwvUdtDOGmp5AoQ3/BTawLbJzFMXDCKhECYKGGSJPraNmC6BvXkGCB2/s1PrcDRblh/Ug59mBRg+t8BEeGUjhH7GN7rBTekkmckaKNqEjvddUvtb0XhmjpRPjO8drioxz3OFa5LKecy6LY2AK4T598cL39O5om7TJ+10rHk79HrraTSAoLuFfbSyHdjUXHX+r7UbmOYUyIBFN5bueTzRdp4z2X865i1nTnvVSWCN/H999F6h3/2aVN68bf+yWfMsarK0uQTfnIO4JuUZtEtMES4RtsC4+Lopua4ff8zAP4BgJ+rqqquKmYW199Ot63nVBw5NYmpIMWoO/pf/z13jw09pkA3FRGTzzxYj7/nqJx5RbxET65B6a+qKtxYLfAwQBLryE0sMvklJJFtmiqmWRTks2TDYXnrQhsTJCG8BiG17+VbNngrLSJGubXGneMV7j3ejIGFIJCxMRIkCt00tBySqK1JnEMtExNZ/uPhfL/2cDNpG5BEIDM1iSlkKTfNON2UVzcVx4ChtprjzXe2QiSFcQjDcUwW331fzvo+X2/sot8pi9XJAoZuKoj4izftc3PjcBF10IBykX4si39e2zk1if/N7/46/Nj3fuv4t5SUPEP3igvX+Eknf0x8TShSWxO0UcaxA6Y1YGrhJvmduJen4i6FOSYpaekWGHKs9PqTu25+UqDry8kmIBakMEG6H5CacWUkN03t043j6r0LyZzM+c/VJK4W9bgmTJHE2BzLCQ9tbWGU3UEmJcMliKV3x79bflwUSez1iSPz/9JaHqtJZOqUI89oYS1J0StT95alm14RkljpgkRXYyC1/gAYe4MCwA/99OvD+83/YzT5rvCsAY5/oaabinDNzo6jWmBcEN20qqpXqqr6y1VVvQZgB2Dr/Hvi7WzT4vbRamxXcLjiahLFmb9zbE70oqmxXNTRwNKlm0ofr88+WNu+eREHQY6/LMDTMZ61GxDeOFzg4ZlRU5XPii3+LLKREk65iH5v8p6jlZJuOlAirGMdCNcEc3SFJlwkMUU3PVw2uHuywmuPNl6GLBWkj0jicTxIjBWx29rOPN00PI3GASJQs5Tj2lRjsuL1R5sxQLc1idNrYBTP4seK3VsUbaieUlao7xbQjRhlu9g8KWdrvE/cOXIOIZBCElPJFb4m0d3IY/ckiyTG6aabMdnxwg0bJD5/Y1UWrkkFwIm+necxl5q/WtQesiFBQyzBVaKAxmvi/KSTa0nFaaLdhpmTfW3O/S+/q4Vrgs9jxzFzLN0nub0jldzKCkAESQHmGQXm1yQCPt3UOOT5cVU17ZXLIYmhuEt5vZOPTK0LWeGayD0iLTBWTT2W6sgeIp8XC9qoQCpIdpTGpcTEgPw1CK81QCYlw/t/FAXLDosm78r3ceq5ydPko3vAzGRy2+Vp0zG6u8y5rqZjBWm77BYYsd6FDOjgJmoWdTWpYxfbOAv1Jx26qfxMtypTXG+2BUYoXHNBLTA0KOCfArAB8E0AHgL4EgB/FcC/rviMa2l93+PxtsXRyjZF/oK33RxpS3l1U/OeH/x9X49/8G9/EwBgWVfRwNKtN5M6wc8+tEhikrYVEchxLS2SYOmAJweLgW7q98BL0UZzsvVAJNNEqjSmnMKf+OzDcTOQOR0o6aaSkUuhljJHeUBfchCRXLExYJIIh8sGL908wGfurz2KVKq2U2jKyd6RkSJ2udey9OLYxtaXFUBTtSVG8bYe62Q/93A90k3lnKSSHqnFLqRxAny2eyKbTny3kO7FKHmauegFIOQr98E4Fkl0j8dQMt335cwNCmL3JCOkEcs+A75KrziEq0WNmweLtBPT+99heiy+uTFru7bDKtG7M1mTVQjc6hSSmEnopFDSYkAapfMzKJ35OQeBnEsJ1NYkJoXZCntOU9fRIKXk8IZJAWHWlCwMAPpC7Zc5lvmpFfOJ9crtiCAxhbblDldV1YSmCkhNej4AiJcbDPf/osaLN6Z001htJ4CiwNdElMd5PTnHSALCnhNlINWxdGv7f0lKUv0VI0mSvJBJPHnd9oWEXwQ8oER5In6C8a0yYxIJiFzPz+UgJHMZNrIHZG1RIoluDWYOSVw7gpeffWDq9MW3j9Hk2d6d3jxHJLFENw1bYPRkTeLF0U2/CsC/1vf9PwLQ933/wwB+C4Dfq/iMa2nb1vQvPFo24/L1pe+5O1JJ88I15j23j1d4aVC/XDR1gsMvTkU1oodt14+oYoq2lVMbNeOmympmnIMkHgjd1H5WLNNRUjpL91rK19LlnN1/+qkH+Mb/4O/i//x3f8LMYXiPugXGkP2RRSnMUm2DOT7vICJHyya5GAPA2c7QTV+6dYDPPDjzKFKxwMbMJy9KcpHCNT041Cx2/sdWKcPi1vWWNpRrXdJlNqmmmt6PTCY5ViPS9/lF1XymP0+a/hM6yR2RtU44JCyS6F6DNqiTDW0MbIhnwK2dyrEEcg5vChV/vNmN98fLwzonNRupnqvM/X/hdNOMU2JVWP1zWQrcUkhKqb9fsk680AMVmAYArHDKtCax7OzGHevssAjaw9HYgEhQVNhzUpl8N+GZGgfY563UV04sTLB0/Tx1WbomUUk/jI1jklsybhpsFERJEvvGpjXO6LKp8YGXbgAwyt9iKUpmMeExI3ERr+UlkpKJQKp0wUMEkj7/Vfz8M0ImsYCjWDowGQPiu+kp0Kl619wzumjita7ntf/wb/1zfODf/q+xbbsxme+CAKx4orx/0aT7KwqSePvYonHye0wVmBKuCe/l0XEqOUGSvdbWJF4cktjC0EwB4F5VVS8CeATgHYrPuJYm7S+OVgv8e7/yo/iOL30nvuy9d2yfREULDACDumks8zZFEgGbeUg9aJs2XfsFOHWCwSFbh8Zw8zCBJKbQhgKyMS1Qthmb7LjIeXntocnA/LUf/nlvDgeLGlWlaIExbHapHjwhtc/9jh99x3OFmsQWR8sGL908xBuPtzjbWuc+rIcTY8R8Ug5TSUksVv9FOSQxx3XIsEv/RsBKmY8BdwGpDi0a7M1sbqxRdxxp/MPramfXmX/pWK3SIYxt9sU+iYpaXndji230o9poISMfu0fcdePzXr4JwG8blKIo5Y53GcI1MTExMctm8F/fdV0+cEs4yWPSLyZck0jcFdVNI2uQribRvkbdk/V0jPt5ueO5p6Sj0P743sHsOdHkViGYCpMCXVdGBGVciBLxQbp9jVm3qpgjTyScUuqmVAAWCTZK92Tfx1gvw/3fVPi2j70CwF+n5iCCcjz/u5mfWropxQqJ7lPEeZTjhUnJ/LCJmjAw1EQTyY5YYj4buAXnEeDrlCclH4U5xlgygPUtYpZqbXNe+wv/4GcAAP/jz9wb15q6StdNxswNis36E/dB14Mf+M47R+Nrd4byohhzyyZq08cO+7taddPSTRkI11xQC4w8zujb/wfALwXwlwH8PwH8AIBTAD+k+IxraadD8enRssGH3nYL3/cdHwMA1JW5SAzd1LVVEkm0zZffdusQ73/xBD/x2UcjqpjcRNsOy+wDan6GWRsXSTxZLfDp+2dY1PXo+MdEKkq00VQge56axPtnJvfwyTdPvc+u6wrLpk4G6aFZJFHQF/9Ycv7d7/Y7vuGDeOX2kck0JTJ2fd+bthDLZizQH/nntU9jcJHUsSYrg65OawaGvxWClJhjwSz+cSSxx8Gyxs1DuxxMahIj16DNbBwxtFP+W6INzXOahjkN55N2dicOSdnZitUfMQ7hIrJJhWJK0zGKmkSHJpVDEks1iSkETOb/4VduTf6eqn/JHc/cjxebSd51aSVom0nWIYnpwDnNnnATd+6fi30SZQ0KnN0ySo3heH5wyTjkbhKO9dlCYR4KScwgIu7fY3OMIc5uX9CYRZFEJkgM9kXN+qNFgGPPAEOvryoEcxzTYtlxMQocq67Z9j1q5/PlvjlY1HjX3WP82d/8ZfjoK8/ZcUECgmV3TFE6GVeeo3otd5I51biu96gLzrU9njknY0Ba8MmjfRmJIB2IC9dkWSHOPTkqciN/PoBEW5YCCp96tttMAi7VBeC89pFXnsMn3zzD3/vxz43Jc1EpBfiEq5yzlBAlYAGkd905xo984j4AiyTGkluukE7K6nCe5xGuuWIk8TcC+LvD778LwA8C+BEAv17xGdfSLJLonw6BqBm6qWuLukbXTx8Yl25aVRV+9Ze9CwBw77HR/kk9aLu2rG4KxOleMu6lWwf4+XtnXtuCGLJk4fBSsOe/XhSpyDi79x4bisobw3kYi42ragi4Oc9F1L5S6FdMIOH3fcvn49d/xbsBRGD+wTZth77HWJMImIDWPY/uvHPHcy0aEHXsxjZ1yLWomZjUJLpB4qhumkGycs51Tt209N2mQWLZaQrpXkxAauY5o45FAtJgHHP+Af9cssg9s5ka52aYY52uCc07FolaOqduT4Rrvvhdt+08I4FUCSW9DCRxm1kr0xn5Mm0xKtyR+X6xGjX5P+MQTvskJocAsPdrKKbBIFL+HPnkylTJMz/HVCa/lGBMIQ4lumnoXLtJlJzVVVhvPE+5lT0nE7QHZUc+pEla1Kw8z5jiYg5JbxIlB2FpxDd+6OWx5EbmGOt3SNXtqRFBTObIJiXdY8g45v4H7J7PKrdGhWsKyY4Unb9UJ9jE1gQycRSj4DKofVSZP/VcN+ng6zwmh/vMg7WXGEq1QIqZJ1yTEVgTJPG9L9j2ea6eQ7oLAJHwCIPEklLppE9ie7U1iX3f3+v7/vXh99O+77+37/s/0Pf9J9nPuK72eGMi76Pl9GQ1EXoAYDaOHN0UmDp2YXuDb/6ClwAAP/rz98djmc/2P2/bpSlUQK5O0D4gH33Hc3i43uFffPbhuOg3EUeyVLcUIjbhuDk1iRIcAua8uo7zskkH6aGJbHGqUWuu+bU7x3ChE2rpwaLGK4P67c+8/tij9gGYUDRKAUCsiJ0JUqJtInpOXTO22AkFzqObTtRNp45F1+sCgPG/uSCxmt7/8nrOQoSbzloH81Q1BZ+Myw+MbfYhBTq0ZcJBi5mrbhoTxCjRP4ECkug8Nz/0Pd+MP//bviIYN50PkL52sfXnvJZK3AGRDO1gpcCtruN0u92Y9IvTTYG400Spm4ZIYnLEcLwkup0fF6J0fHJlWrfHjAGme0dJXdM8oxEmQ8HhDdcuU8OVnaKZZ/AMMEImMbopg65WVWRtJRz5MLhnAikgjsqWkMTUHlCqnw/3t76wHoxzrMJ7kksuuu8Nf0+Oi/gzc+jd475dOl40cMhT0IF4oqQtrCVhICvz1CeOygmnEbWM+JM54GB7wUwSAHgwMNMerXfoOrsvp1ogxcxtL7LICOxIXe6H327ZNePxIsyt1kE2UzbxL9RIYmfHMS0wLgpJrKpqWVXVv1tV1U9WVXVWVdVPDP+P6/s/QXY2IonTE2oc8rQIzWoxPYXLBPri0k0B4AMv3sCv+pJ34H//az4GIJ4NA/K8biCPZEm9zBe+4zkAZjORz6ojjmQpq5tTSDNzKdUDTc/lvVNb7H627Typfg0lQbI/qfM/StYn5phSl5X743DZ4B0D9/zn3jgdERW7QCYC58zxYkqe7mdGxyUCMCaLHBXgGO6vY0eZ7kgUd1OOtYP2po41WVcJCmicgsvXJMp5YTPrk6bglGMnDrluHDDd7C9a3dSto0jTTdOfEUMgzfF9ufUXbhz4cvexTHdhQ2wSzv95LKcEHaP7AkTglghu2q5DVcWvXaqd0RwkkauJs58/jiMDt5i4CJMo2XnHIhzrzPkvCgdF7v+icEfw7LDCNUbx2DkOgyQmUBsOSdQ55ECGJl+iO8YCgD5fbybfLVyDrBJ3Yn+boM3mJ5PwiLI7MiNTiXJ3/tFjRRN+c+jd5b1N5hnz03JIrnxuVBQmm3CdJo5YVHwCHpCoZQyoSLd3ungmCQA8WBvQ4eHZziCg456YRxL/3b/2o/h1f/rv4/FmNwIOZlx6nvIMvM9BEsWaJs7Uy4nWyPHkvQDAt8AIhGvYFhgXWJP4JwB8OYDvAvDTAN4D4A8DuAXgdys+59rZ6cZc6KNIq4IU1cVm0aZPnCyaIZLl0k0BsxD97371F49/T/XpK2aMQnh6MGmSDpiA1H6ndJ9EG6Dls91qamXG2b33yCKJ98+2Hm972dRjgXzJRKWtGemmIZKYV2BNqcvKQrBa1Lh1uMStwwXun+3wyu1D77sl24kkFuVYETuFJEYpSlxNXBxJNCiR6yhYJDGuFFust4xmyM3PkpDAVFiBQwSBGfSfCZJS3kRlXJh9ZsaF36+sbho//zEzWVN7nFSNYJ5+NV1HgHky+Yxq30WXpKTqxIFMwqP03Rw0190itplx8ebefZkiGRmnQbIm9yShChyiX+bz8uPcYLauK0pdWcbNUdeMrlt9nrYVJgVY4RqX7iXB2KXVhEbo3RyS5SeprHAKE1zqktCp5Eroz4QWa5Mic8jP0WflaPok+s8Nl3A1x/CPxyYF7H7jv547Xix5V0peJMdlg3v7PjEO8Y8JbhVqEhPMiTySyLPENPZwQBKNUKOLCKYTCQDwn/73PwUA+Hv/4jWfblpnhGsG3zAFMEWRxGLdqjxvwwt0C4xAuKbvObppnQ8DNUHidwD4WN/3rw3//6dVVf3/APwwnvAgUSDjGCoYywYAeaqFIIWh4EqJnmEXrBiSkp5/CurfdR0OBgrtalHj+aERvEUS030S8z1xYj3YynL3QNwBfeOxRRLvn269AERFNx0ebHm4Q8faIom8Y+f+X8a9884x/udP3sfbnzOoYlr+2dBI0kjKdFG1CqCpb5lGEufUQ5h5TpMQUp/b1NVAiUopxaYC7njGGshnkmNOZI8ylXMRLKzyESWXsAoCFeY8AuLc+eNYJNE9L7SacGKTevPxFvfPtnjX3WOvbqSpq4ngFkNJSyWO+oJDnkoclVTcGKU51oSqXmYKhOtCvil1blyp3YZ72UrPjDuu9e6tnpKtB6aBAxPchPWPxspriZmnEe7gkyTTfYoR7ki17mFqEvXCNcO8ehEl4YJtMycfkSodLlx/wjmk5xhXZS4il5E9oETbbSTpndoXc3TTGJJIBERugn1ctxgEXkmdHgOpkJKZnWGkvKErB7JAPEg3yTTinGivW/SccAGwNrjPCRqmvtvRqhlLeS7SRrqpIILD4VPCZaE9XO+8BE8OSZQgcdXU+H/97l/kXY/UnlhKCFjkPnRmtMI1bfmGBIAmTwbVCNekjkbM4nrbNhM8pJDETUAddU2USFNBSpLDn6A7GvpDev5p9St/Uxz7mzk1ienC2gKSWAikJmMSlBXAPtTAgCQ6VEY13bSuxu+XpH8WgvTYJur+/b0vHAOwAh6pcSVBjJSSJ1Di/8dpqkz2P5rwiNRE3DiwFITYM1CiF8cy5FSQkjgnxe8WLKxMuw1gGqgzyoJArJk1Ny4UjmgLiYvlWN8c36S+4T/4O/jaP/GD5rO6YGNLIYmFBFAqcZTt3ZmkQ5Wc/4tzEkrIRqrnJ0sBjTaKziDp4ZjxmcmJhESSaT14ZK/1EBgS2Qho0yCOFyI3XQ/KIYknGMv3STK5VVhL3DkyDhoQZyWwSK57i7AIZKwNklaVmVVzjtUOd5n7GMhTCd2/x8bFgg0mAIspt2aTixHfiaFOx8QCNfRuGcYG6dHawraMcMdoyW3huo1iVu456cqJoymVeXidedaCxzSXyDleLUY9kIs08ScfngUt3zKUZPe1MUh0EMhUuYcEiQfLGp/38k188CXL2GvqaX/XEvor4wDHL+lZumkoXEPWJBboppog8S8C+GtVVX1LVVVfUFXVtwL4L4bXn2jLChAk0BfbIysSWI50U3/cJkNRBazzFkNSGF59SVnq+RsmY3C4sOpLWtqojEsHDanvZmoZUw+o0Bvvn+7G99S1yCTHH9DQZHNN1RaONaGJOaabgss5MRfo2z5mWoPeGNRAYwXiAIY+lfnrluyTmE0KRBwLgpKWzMg7tORXh0Xuaz74gjcuWd+WOGQc7Rw27UJNXPjdTOBGLqwiJCCCYEp0tSfGAFNEkKljkXl2scAh89wAcRGGtuvx+tC8etd2HpoZpe0SlLTZimyJeySbfa6ntOnzmAScaaZGvCalmMyR5zuS9NO0/KHW1ghtlOptFtk7WNSgC+5jeT1/PP++ZJMrKaQ6GzgnGRB5dCNMCpRq78RioiTs+Q8TTlTibpLMYejFetQsdTxauCaRdMqtXV7SYpx7OeAORZFK42KlIjZwKz/bHgJP1ISGzzdD5Ze/971/vBKVH0ggwF0BSRwDWf/5pu6tCLsgN0U5/5Ne0W16bT1ZNXi8aaN/m2tn23b0sx+uW1/dNCMCd89hsz2SfuIEkihsnYMmQjet60TpWP78T/r5juqmSuEatibx7V+cn0/5E0b7/QC+B8B/DOAVAJ8A8P8A8L2Kz7iWlqtVS9ZxCQIQQxIl+x9kyYt00whlCChvGjmapHtDfuKe6UP45e+7AyAeAMu5KNEYJoFUQe5e/pZqyn73ZIVP3DvFm6dBTeJCjySmgm2LJOocklDK/1s+8jL+k//ll+HjH3h+HAP4GTvzvQq1NglEECDQthl1LLHrJvOUe/YHvusrUcHn2MfUvSwlOH4vh7VOgAJJjCCQLI9f7l+Nuqm3IXZ8TWIo3MGMC9cTuWdTTkmujuKff+bB+PtnHqynxfaTZJOxEithipjlkytAugYyHxCl60PEcmql0/em12Rg2jdPrJSRTyOJXZZqByCREMgpEto5iRlEKjnEjIvQvbjgJoHalNaSYM8pSeS742KIbBlxnt4nxRYAQVKARRLDgE+jdulft3JwXyWeG4Ze7Lc7Ia9b5FyWrl0uSQLkdAimVEcz9/IcPZSUKMGI3f+q2sKQFULsG3IM89P/vJS5weXCYTwx6FIs6coIN2kTR7E6faDMbgLKPqhrx6sFfub1x/nJKO3R2qCIh8t6VDeVueX20jcmQSIcJDHdhm29M0HuwTJSqlZHzkef1xcBIueSVTed2wLjPV+Z/XM2SKyq6huDl/7O8K+C9Tm+BsDfLs/k+ppFBeM1ifGiednwp58nTk0Y3PB0U10AkOrvF9bnfOPnv4Sf+OxP4mtefXGYe1xZDShnu5PUEyXaIPOWINETrqkrrBQ1iW1vzsWkz8xgWyKTH1MADRGAqqrwzR9+2flecvyI86k8HwwC5kry+01yyxtNqd/Y3ZMpPz2sEZExAO8gABxtKC7mw6ubdsGmzTi7YT0KLcChdMiBaWKGba4eu24PHZr2z9879c5TTBSGSUCkaKNA+dmOq4bmxtTZIPET907x1X/8b+NP/KtfNPaUzZltMZRANsb11a136um2FDFhsBiTBHASRxFHPssSSDq7OmRDjk3d/wGSbuZYQBsC5F5D5Ywh3FkBmqYa+5G5xtJNx5rEAvI4zjFAcxn0xfaptK9RQXrkeQM9zhsyzCM7bIISAXm0B5gm4MTkOUqd06lyLj/H+DgiUT4JiLj7OKRc08Glk0gwc8yPcxNO4nyX1kkZp6XJxxV3y89AmLigkruJRFquDvj4EpBEQRGfPznAJ+6dYuPUm4c1yq697ognPly3XgIqVxaxcWoSQ4vtb4a1lf8OU7qptgWGo25aEKVhrPQJfybx+rgmDb+//9wzeQtt16aRxJhCEWAXsdiDM2asg+zDNnMcIB3slTapmEMin+M+oH/gl3wIv/3rP4AbB4txXApJLGWoUgFATs1wkXAKd12P54f6vvun2zHbVVW6mkQjXBN3mMz/5bvl5jjlkY/npOB8aqX1s+IuhCMpohEyjsl2x6nTaQEOwCDjU3px580lNsfJfezMI2Xx4JKn/8g8+ZrESAuAsh+JJkBXmfMfO16pR1ZKWRCw9RAA8PNvngU1ibFaJ/OzKFzTh+tWOblixvmvuVnc+Jg8kvgTn30IAPgv/sdPUEHiroQkjnQjZ47D4RkKaIxiX1oTJvcWysE2EDq7evobQFLLQiR9zK5kh01qLruujPbLPCdIYiFIqRN7cIk+GqMEMqD0WF840k3LVNpU43IqaAufGwLtqaoUSqcPNkrBVEwABUBRcCX0E6xKaeGerFLjMmMi6ySDwFv2ln2NqUkMkXQbSOWPF1KZ5TOoIDHi35USfuGx2MSRmm4aOY9mbPqePDlYqILEXdvhB37oZ/Grv+xdSaBF9oDnjpb4xL1TPDjb2T0xAcIAGMs2gCnddNFUOEso7G92Rk07tg7FFd750oFxzWNbYITCNV3L1SQWLBsk9n3/vnMf4QmwEWGKBYkJ9Cu34aeQxLG3YkE4JRaAZbPPSSTRd0CXTT0GYwAmUtPuZ2gFV86LJB4tazR1ZfokOtmnRVPjEbmQWLpp/DyW6DFAnA5VRs3i57+o2hejVg4/WeRYJPkZhzDXAmNOvZn8LTXHZE1cYbOZCt4QTlqQmGEConGewfHYmsRQXIStSdQgibnsp1BdAOBnX3/sZcBjTgVDSYshkPZa54RrpkEpdV9F6M9zrVRzHENE2KQYMH2+c8mVmLopg4iMddEBksje/2pq2QzUwDueE4DFmDihRe+vEpKYW7cy8wxrEmm0MwyAGURq+LO6/isatHG1bTsPETc/S98uRgsv0a1TNG2tMJtmjuF5lNdzFq4nPZFcGa+1khVi6aYyhguAY6wj5r5M7cH59dWfm8yXqe8PEXGgxECxc3ItV75hkEReuOb/+9Nv4A/95R/Be+6e4GtefSH6HtkDbh8bMZY3T7eOL5neS4WmumwqPNxMhWtSycz1rsv683Oebdlnxz2AbYER0k27HbA4SL+fNI1wzVNrgiTGNrkU+uXWzU3GJBQJ2ZrEeGax7MTEgqJSrc1c4ZqpI1muW0r1mxFn62jZ4HTbeovfqqmw3XFIokhCl9TYcuckFtzQbQrC8084yX0fNmUvZ4RjyQS21iCF5OadhHRNYlrdMV5bCDBByjRwZpxdwK8jKh1Lxvkb4uXWJIbPXIkyVFXVRKRCzKXg/fhnHnrPTYw2yiQgYggkU5M4z4nJt8DQxo8j3TTSygiIZ5KZ9S5Vy5KjScacQVbdcRK4gb//tTVxde3vN3b9yR8v3HNKcvzjPCP3V/k+Se/BXBN4W6dM9UkMvpsJNvJj4kkBErWJJIWZpIB/3fx5ZMdF9jfGv5j0yi0hwHU8SJzF7gD3DPjqvlzjePcY4++lcUFQpAmA3XHye064CYgn5kv9RaNtWcCh1LHzn9839GvkycEC27aftGpK2eOtCX7ePN0m3yN78p1jUzZz3wkSU4wvwA0uVxHhmnRN4mbXpfebFGpfopuG142mmwZ9ErvdhSCJ+yARLk1pejPn6riA+KI8NsCOCNdUVTrYqIKFR6zrkF19UmqeRbpjbOHJfK9xXIQSGIq7xMflkazDZW2DxOE7LZualsnvhs/JBW1AnhKbC5xT2b7U4tN2HSeIEWQx3c+Mjos6hPrG8XaeMxqlE4HzlDbNBcBzJOGbIEvIBKRmLnrHWubp1rYxGUI7zh6v9IzKmDiSaI7/jttH+BeffTg4pdU4JtkCo0BRSqr75pIrMYSigBClqPxip4NTwAaLlhbLt7hhGRBAZD3JqJvGpfX9v6UsrMvV1FaF9UcUtS+y/hTRhuD7lajF3vEi91deuCZOEet6UpVTiSRWwXrOInsyJzEKSYwyJ8rXLeXIU4nCyLpQQnLdY4gxz3eUElvydYfkqR1nfpZbN8QSp+R1c10M4rqFa4KmvMEcj08UyripfkSZqQRM27IwVFovcU3oJAgDIhRdbLt0y43jQRyPRRMlKfpwnQ4SJdh7bkAS7z22QWIqkHXH3TlejkEihyS2OFjEA7Hks0bcx4Cz36hrEp0+iRdQk7gPEmFVSGMIX+gMio100wySGA7btnlKTkogASjXcblzEmOc/9jCD+iFaxhHclFX0YyMSEAfLhucbVsvQ6ZpgSGbVipoY4QjYnSoEgJpM8/Tcfr6I2KOkax1z2StI8EGI9yxqKfiQaUeWfG61eFvhSBxSpPk+k+Z94pjx23aYS1LR6AGcryw4TmFJAbPTqlNCpBG3M6GIOqj77iFf/GZh94GFK0JJbLdMeEmNpDS9kmMofauifPQg3v+LVMjfsxYn8RSn0ogvS7nnNAU2g9wiIgveKNXGwX4FgwxtJNFYMYArBAwjOMSdMd8kDKVkmfGhU5hCXkMx42JfCL7Lx+rrkmsp/sNe936yL3FJAUmDBtauEbvX0QRqUICoq4SCDzz3ISJ0/yQKOLPrOW2Bk+SJP7r6eNN9/ySuq+Mm/TdLq6vmByL/W5anyQ2DjB7TmqOJysTwLDlRFJe4fbVDk3O0e0jEyR+5sEZTla25RswTfYBwEbGHa+scI3spU1auCbH1gt1CwCWbhrsN2wLDOl32A5B9AUJ1+yDRORr1WKCDEAeSQlpLmKlzSZPN02Pi9EKAEOjvYzawvM4kqnNftE4QaKz+SybmqYjSDbbOgfB33tmjungMhVIhdQT73vlzmMki2mzpslh0UbdTNZa6K1hFhOYRyWUv8XnmBHlyczRIBv+az0IlHR85qxD6L5eGucqGfK1hQ6SmMmYTscFDkIpSEwgboIkvvf5EzzetKZIf7hFsz04S9n/VAJIicAzCEWuJvHRWqd8J+co3Sdx6uzaBveZ71ZNxwH5ICWF9gN6uh1z/8fqJlkELDbHsnCNHwQzfVqBTDJBuf4w42J9Ei+tJjGSKOTWZH3LKzPHON209O1iqEjXl4M9IF6+UfYTnDkOP5lgbw5NNQxSWCQXiCDw+Sk6TAEZwwWyYQK75Fu442JIIkO3trTpnqvTrKclGPJ6zkK6LyCU2Pj7pc3WqRJJzAaJnSCChm7a9YbWCnBI4u0jiySOtYwZJDHX47Kp4olFNuE37jc0kjgEiZ0EiXu66YWZ1CTGFrxFAUmM002nC4/8Pw/Zm58xZ2uuummx3UO4YTP9DjOOZIn+k6qJa4aaxLNt59ckLjQtMARJtP93jaGtpPp4yfxjFtto3O+VPFaubqmAtgExmmRyiBkXBEQyR/czY7Zo9DWJstH0weYLlGviYr0jmcw64COCMo+chc61prbQzewaR54b594nJUqyjIk9N5JZff6G2RBfe7QZqS+5mtDc94sFexSVfAZCUUeQbddON1q6KVfzra1JTAnXSMud3BgfEeQ8+bqahwhOjkeO8wWYhn2NRUScAIx9biYquCXaYh3P5DN0R8BPHLFoJxCyC7hgUa45QgAA3VBJREFUQ7smx9AXVhU1rDVz55EcF1lLaMZLJHmaP/++k8yUG8gcfYqkjMsOiyr1aoM2gFQ3DfqZ0gFwgGbZ/Tc/bhFpxVZUlw2+Gx9sY4LIAhzdN0Y3Taubmr2KTQYySKKwzoRuao5j1fxlTpNxQ8L1uaOlKXly1vZUuQeQX4NitdSadkbjWs6qm45Ioqib7rg+iQXbB4kw6qaLOt7QOgbzAzaDFAuKxox1Gy7+ZV53+IDKOG3QAOQl2mXuKbqpNrPL1vul6jsN3bTG6ab1guJFzbfAaIdsduo8slLasdpCmX/qe8n3iH2v5LGiFDH/b6k5Avr6iyZGtxvRF11wX2oMHquHwLBpF4P0WPaNUGRz58VQi91xruDNnNpCJmst40Ikq4gkpoLEre0JBQCffbAes7OpfpNAuSlySvFYS11nkls5uukjoZsqg8RU0C1rk4/kltVNk0m/zPMdYwmwTlp4Lqn7P0A2zO9ldHtKNzU/S3fyRLiGDsCm6zITpMTYXm0BvQyf7VxQ788xtibkx9j1Trcmp4S6tG0iaLpjbM8vBntp/6LILogGG9kpRurEh3HEHhAmXBkhHyCgZHZ8UsBF6dzXk8cLzqVlN5WRxFiilmkBI8Pm1q3SFPTYvZwJog6XUpPIBonlmsSQbgpgpJumBB4Bqxdy43BhfNCuHxlbOSQxJ94Uq6VmGBcTf5JVNxVqaTu089jTTS/OhO4YsxzVBYjThGNZXfk/k2maFrLnN6nUzX8eQZLc4p+iPgDIB6X1tAchYB7Qph7oprvWE4TQ1CSazKZzrCSSUpijFkmMbDQyjsnQansS5ahsOYuNKwV7Ms8UkpgW8xneFyCJ2hpBYAjAyAa07egQlpMdQGzTptokTqiSjCKhzCcM0ss1iVMkFzCbZlNXuHNiN8SjpdRfTNcDJgCIbWxSs11KOMXWkvPQTcV5ONtxToSsE6mERy5JwiCJsV6hyT6hMZYAys+2GRtJQBTFPszPWcIpsUCWfm7M/0tKi+O4xJ5Tuk9iSKK73sfHDQJy0hbHcfxKcwTsmsqdR/MzXJOZID18BChVziqOtjH+hTaZmWodYIKU/BzD+1FeL84x8twwqGDYA7WY7Igmc/iaRJtIADfH2j8eiyTG/MJizXdwT3bks50Ss2IC4Jh4WWrcwSLeKs61n37tEf7JJ+8DsEFiFknsrEqpmCCJKZVqwNQkLpt6bMvhIqBNnfZBc2yxWC01W6fszZOlmzbDd+72NYkXbtu2SwrKpOrocsI1qUJvZrOpovSTQmATySIzgiQh99x8BhGkZJHEXFAUd3YtktjgdBMI1ywqbEgkcdfZGsxYCwA2AJtTfwdMM+RtV6gJjWUxyUDWnRfA1ySGxxOqdakFQEi5Lp2TeI0U35R6EoCx321YzO19zAal5v894djJ8cJgg0FSwvuLUzed3luAKKvVuHFgg0RRjGuqary2YgwlLbbecYEUpghkX6Co1tMaWddEuObhmqtZ2ZF002hNIoGkTGuV08FbnH7o/y1lE5SIuP/DgEjGlZ3PKSPBzKE8DnAc0ILDKpYUrikwJ6KJ2gLdtA7myD6jMhUNlXZURHWmyQUbEbSBSqbF9w3GAQ393RwlELAJxFiJiQ5J5O4tEwDPCS6nCVc2uJ+qAufnGO7BmjkCTjJzpPKXFa61yZUYIg5wwbZ7KA3dN3SVc8hZqp+42CffPMXXfd/fwa/7/r8PAFgPQm25/UDWv+NVM7amuDEEiXVk/Rfbtqbf4fFqga43iUlf3TQ+x9waG++BSjC+wr2DDhIjdNN9TeLFWE6hKFdHB6TbZgCxxZ+jrWiLXcPN0P09r1Ian6P5zMKmPdloONpWDOoXWuzRssF613m1Dqumnji7KXM319iiyjhpMVVOK2zES+vLOGoRj2ykuesdQ6oZBb4YclkK9uRvYSatVJMYnSMUQZsSEQkD4I74XsDUSWDOIzD0jgwccorKNgNJjPWpBExm1QSJNlsoSGIsAcRQ0mLJldL9D8SDy1wjZSCeEHDt8VCr8pisWWFbYPg1oeXvlmomnq9HmR5rLtrT9wwiYufkHk8r9mHnWx7nvt+svYVJQqijOmc3tQeX2m6M9GIlJVbeMypXKpJUYQ02F7Tp9nsgxubhkmIxMY1Sn9w5wk3A9Ltp7i0vuCQS1zLPsL8onVx0nzeiJjEUKtIEwO7xGDV5IFWGUd633bmpgu3YusWo0ip83lKQ+A9/6g0Apo0FAJwNSOL9rLqpLTk4HILEULgmlpTctR2Wgw8KAI/Wu/G+XzTpmsQ8kqi/Zu489S0wpE/iXrjmwm3XdVhkFPFiNYl24YoEiQkOP5VFqGOS2ByS6D7YbOP4KYd8+Fv2ePGNxp1LdFydrklc1vVYk+jSNJdNja6PUwRinyPjYtQHxkmLtekYA6mUSEvC2WXovuG48wnXcItPDEnJ1iRGiuaF/pU6Zqq5N+P8AD4qRSGQwTkZ6aba4JI4j8CQyQ+RRGJcmChhaxJjyZX1tsPBosHNQydIHJDElIohUE5AJJHEUp/EyPGyTkyE/uma1CQ+ItXvxNlYLdIJP8BH29j+rkAcSdHc/8yzDUzrj5jkSqwO2wQp5WP1vZ1bP76eHTZ93joySTIJboiauNS+Ubq/ImsCVzcZrgmM82/nJEaJVASomRnH0oT9a+3OPXm82LpQYDOkNQ/SdGtgmvC2vkV2ihEE0vzkVDnD858/1vz+ovLe3vvJBqXy/nEfJfaA6Pkn1q2xTl8RyIZJKoBMbkV8rtQcJUjcJKicP/nZRwCA24MIzYgknqVrEjcjM6oer8Ux2QJjMdBNzTF24/tzNYmluvRZQFG434wtMAoBX1WZQFFaYOz7JF6cmf6F6YxwriYx9gCkkUSuaFtbyxg7HockxsUmgFLdUpz6UFf5xS4G2/d9PzoJR0NNYtdbh7uUber7Hv/4594c5zDSTSMZ69FJy3y7mBNTotLah9p/nVXfiy3IuYUkKdvNblBRJDGHpGTUTVMLZOSc9MT9H6/lKm9sYb3BmMQpIon+Oel6tibR1hv0fW8cSRKl2Hnnv6P6JMaRxBYHSx9JPHaFaybPtvmZZSVENjZG3CVVM1MSKZL3xex0EOZhW+DIPFOooKVA289j1snx3lIkgVK1tQDnJE9pc/kxMm4apJTHAC5tjgxkI8kVim5aR1goxDqZ2oNLSUnAr0mkEkBBoqrvy8JBsRYYbJAecyQ5P8EfA3COfFSFOzMu1l/U/L+8JkRFkYoJD1+siq3lnQTOhEhIbC+leg4H+8b43fLDpjXwwz3G7AETVeCScNNkb5PzWL6X+8i9xZxLjbrpWJOYWN9/8nMPAdhzytQk7py6dDlsSDeNIYlCN5Uk66ONpZumyqSAfKIkhSSy7bxGl3dEEolNoF4GSOI+SLwQ27VpJDHZyDfz4KSCxJ7ZNCKLeCmzGMuGsYIkc5DEWF1JSelM5plC6byaRA9JND9TdYnf/9/+BH7Ff/Tf4Yd+6nXPUckL16TnGA+AC6hZJLCR78YIYsT6JHI1ie44vt4vhiRedE1irJcj46TFa7n04xhaBzDNLvYob4Yybhc4CGxNlrtJlSjJcqx4TaKhm55E6KZx5dDyZp+iAwLlhFNsLWGc+BTdVDLHrLrxdjfMs6DU69//ZVGelHBNDgGzzqd9TYX2BE4aUycbQ5e0NG06kA1pcwQibsbFEdkS4pykm+bW12AN4pHE4fNdJLHE9Iom7jgkq+t9miqFJNZh3ao/95TFEk5tAUm0tVzhHpBv3xOKItH1roF/wSKJ8eemfCzA30vN+c+PG3tTj/sGH4CZ45n3j+sPhQAH578vCTdN90TG6ipExGXupXHxoCj1jFokMREkvvYYgA0OrbppuU/ioqnx3udPAPjsGvOeeJDo0k0B68PkkcS0nxFr8aRBt8drwLbAAIBm6dQk7pHEC7Ntp1c3zdU8pW5GKrM7A6KOblBdeUGOBaQsJU270QOFVgpNhYOhJtF1nEckMZFt+os/9HMAgAdBA9RQ6cx8N4x/S1ks0033SQy/W6vvk8ic/1ggxWxsseRFrkeoOy4Z3BdqEv1aD95pDTPCpQg4bG/QsujLJLgsOxbmeHbTbknnZxznXO82s/a4c4ypO5og0RboA8DRytZfpJDEueq+xfqj2LpVUD8E4pldwDoPXQ+qLlmU7VYZzyn8fmwAHJtnLnmRe7bLiMgUgWTuyZhQCIO+ADZRxQayMQd0juCTfEY5SRVP1Oac66qq/Oe0gDy6cwTcWi6FAMpkTeZQgxC5Kc0yTAhoqMzxvTs9JtUCZldI+oVKyfIbswdoaaPmc4PzTxwrpgqsKd0YnxuyBcmU8eJ/XnKegT9jGVh5YUL3WCCf7dAHZZHEWKmUSdzH3y8AQCoJKLRSGyQONeqbNrkfjArXdYWv/uDz4/uByPnwxnWDuqkNqtw+iW3XT1BSIE/5jWlwsOUsXmKebYEBmKDQRRKZwLI0l3N/wlNgu4K6aaqRr/w9NgaI00a5DKH/WmlcLBvWZebnjkshiaUgcSIHTyIiufYSY9HwxvLBLd007kj+888YSsLYX3F8sONOXfG7JTLdQBptSCHHRSQxGuyVF+TY/cU1AI4EiQySGK1JHM5J4pipXo4MHQqYokvsZu/STbnaQn+zZxxCGSeBsxyTFa7xauK6HseUst30dVE3dW0UrqlsrZlVXuQSEOk+iZngq9JviClpfTHpAwmYgDHF9hAbBXYy71vUfhseSt0083wXkcSIs1XKeISBFBNsAD4C0/c9xVwJg9lY7WvMQjoto6QKxFkoOUoaIEmSSJDY5RFgwE9wlZBHd44yL4Cnjcp7xbgg3fxs+x41bMDItCCJoj0U2jZdy5maxGnfZ6LFViRJUoqAqwgCOScBoauBd8cRtNEguKSVQ4P9zSJf5eAyVoOqYWpoVEoBu3ewSG5dYxJI5Z7t5bB3pcoJts7+um07bz94tG7x3PH0nrXCNTW++xtfxeGiwb/yxe8AkPbLzRxMCwxBHQF4rDSZR3idcgreZu3xvxtDgQYk6Tr8hxWuAQYkcd8C48Itp25qULPp66NjmKGbThdVhtcdC24KDbAj6qYdsR5H6aYsJW2yGOSLqIF4RtiVgD45MA/og7PdePxctsn9rAdnWy9THBOuYUVhYs6gzD9mMSQXGLJMhb6R4TgO7fHnBXCLTywAs4hgzkmYcvJLSYhUvSWTIQemznVpY5uvZAhvnGmkXBzmZQmZhExsnMyTqkeJIYnbbkQR5diTIv3g/AMluvU0QN+SaPPkuSmtWwUkce30RxQqac5knjkRppACRAXAqSAxQ1+ce/7N3+f14HTrsNmgIQyINMEGEDxvpCOvppsmWzDkhVMAn15cQh7FwvpCTd+8aZBSTgrHx5XmOA1IAa4mLob4UwJrysTwFO20r2fnGKxBDEtGPnc6Tr8n9sR1m9JN5fX8HENWQs6PDOfpghW23CM/xn3vGCQSqKU7ziaus8OiCaBcwmNVAABcn2+960ZEEQDuJ8RrXMHGw2WD7/6mV8fALwamuMdaLqxwDWDPX64sIuf3NhHApyWZSl7StVfQTeulQRCBfU3iRZqhm6ZlbKONfGciicwiEgtuSsheeDwmIKqrGGpp/5adY8RhopqCBwuCnNtlU40Fxm882oyO3irTcPWTb56Ovz84C+imEWekx7yFroQ2pILEUgCQUgAF8pt9TE1VhdJpkcTIM1Bqi5ASBGBU3IDIdysKRwzz0jqE4YaI8rFknrtgo2cd0LAmlEPgp69vu35E2l+8cQAAOFymldwYBb5cn9BSfe2UlVBogZHZfAG/VmXdlttgjFSjApIYr93mM/JiDJI4F+3R0hZlnBo1GOmOvkPIIjAeck8lZRJIYoHJAOhbMJixtVM3SaL9w1vcmsRicmu45cIWGKXDyfzdU8IGN/EERDkonZZF5BO8OeGmYuIo4pMUz0k1rbdkkcQwuUgjidrzHwR7DANI5gj4ZRFAWbgmZJhZ/zPP7nCPxSKC1p+E91NLU5Vjp75aSZTQCxK3Lc62dg9I1SVauun0vOSQRCNc49ckunRT+S6h5cSbYixElqnkPd+suikANIO6adcB6LkxBdsHiRC6aWKzjzg/gM1GxBzDEUmcOE3kIh7LxuScrRhqI59XQKRiWUWgQElLoG1lZzdO2TJ/s0Hip+6fjb/n6KY/+7ofJLpIbYwSy9YapIU7Sn0S/ddLAUAsi8xs9imUgt3YtDWJIUXP/YxkM3FZkANRnjlzNNnI7LDx2oz0N9JpDZ1k1pF0UfFxE1WOM8fj1E1jSKI79sWbJkiU5EpYawaQolTjdYskErK91KZOZEnxMrf5AgYplVPDKJxaJJFHxeW8zkFScuhZtLa2zz8z7thJv0OGaTTjngy/G7NvuONcNH2OcBNg7pvU/uvOJSqKQSCJcl+wlNgwACjRMb0xXrBBJLeGP2uR41Td2JwkdNfPpFtnkHRgSLh6czQ/S+ekqoK2LCSSPq1l5JhbgJ65kgqk6OTKME9Jtpae03DfsMmt8hy1iKB8h5ApU0w41b4qqozNBVFNXSXX9s2uG4M2QRIFNEgpnLp9EmPHM++Z7je71ggvHkfopmEdqWs5NkOMhVh61tyxNkiUm4tFErcWTdwHiRdjObppqIYnZiX2p2NSiyorJKARSDBzmGZImAc7JpPfE4tdrP6oVFcCxJViXSTrxtDvreuBG4fL8XUg7iT+7BuPx98tkjjMMfLdqCAlMk7mmDqXc9VNY/0tx80+t/gnqU3pMWaekSCRQRIjzWTtuFTgbH5qnR9bD2FfYzLJoXIrq2QYq9ugaqtqv9YJ4ChRiwBNp5HEyBrk0r2+6gOmSP9gIUiieU8UScwdK4KAcZTMerohdmXU0v380Na7bkwWpShJru3aDlVVcnjh1yQSfRKTfW8ziYjQiTS/iyNfclxjzjVxL1dukMgFDbFWFmYO5WMBNjHWEiwB+dzwcpcEvvJIVv54i8avHWYC2ZBK2BHHCccAw35DqqKGCV4tIjgmgAhEaprMzCeqUs41U3MfE9dhAzA3ccGgL1U1Q900siea/aZ0LPhzJBJw7vGsUFR5/5XP9ZOL/fh6box7DA0i6I9j1624z5sbt2yqJJK4abvRJ1zvOmx2He4erwAAD9dxuuk248/EEjLusZaBUrgkG1NJKnktqVVRTZFEVhgviiRqahKForqnm16MbbsumX1OOWhZ4ZpzZD5j1LKSkxwPGszPEm001UuwqIAY+W5znF2LJPr93uT3sUdT5MF+87FZKG4eLPBwvfUcldh36/q+6GvF1d/MJpq6Bkl100IGOl+3RCQFlI5F7HhcTWKcXux+5mSOCeeHbVLsnxMis97456RlC8SDebKOpEtbLJ0L18JNkapJjNB4xrHD9/5ff8vn4y/8to/jC9/5HIDE+dfcW2pKpj4pVkISN7sON4dkEYUkdn1SgEws7Plp7/+ykxxFUpJrgn2PmEVS8jat+Vb0SRwFmGQepEMYqJuWg0vz09JNFZTYGCLLICJhkEIEpou6HlVvNZRYwJ5DJuFkx/jrFrsm+zRVUgVdmQAC0u2McuclRdMr1SQ2k7pJ81NNd+xYpWpMAme2JneuCJxWuCZM3jFrq4zzNQjK40KatpaCrg2AY6U6XR9n24ktmzrZAmPb9rg5Boktdl2HOycmSMwhiaZH4vSYVVVFNT/MsQzd1EUSbx1ZpXAgEySm9oB62t6GiQGA4FyOLTCIh6BeGBRxRBL3QeKFmIGa4xcgJb+de7hzSGI5SAkXuvKDHc2GER5JCm0rDEsqsJbu4VhtmzjMi7oKgkSr0gjEH1BZXJ6/sTJ0U+eBjQb3PZfFjKu/zXAiC87PXAQ4WbfHZk2VAUDoWANA2+Zpeqk6WTqLPHGaOGfX9i7kHWvAz+xyjqQ9JxZJJILLAJUtoSgyJrlBDWMXTY2vHNBEM79pIoFVNzXjnOMUrrUcL0Y31ar0ivV9j/WuHZ2Eza7DG482Xh1yaNtdlxWtkWPGAuB5dFMks8jxxBF3n4RrV9tx2WcjZqJzCEOnlW2lEF67Us+2cY4RFgqtrhlm5YmEztJFEjNBvX88Oy85DktbnCJSXJDiUgJ7k00rzDGoSQw+jx0nx6aQxIg/UyqniNUksiidi4DNSUBQzJUom4dnrnTBc0MHpU5SUuaePV7AwmJqGacqvdyzHZaK8GtJFVU3zX23VVMnRQnbrsfNwSdcbzu0XY87xyZpmAwSu3y/7lTfc2mBUVXVeP9JgjJXO7/LPDsxmirvlzh7h6YFhiCJEiQyYwq2DxJhbpAUkhJriAk4mZxMxiIepOicGAYRjAUb498KdIS+n2Y/S+OayHdjsnZNna5ta2pLNwWAGwf+Axr7bqJ2dedkhYfrnZfxjTkjbE3ihFZDqLgB00Vk13bFtgGAX8tIXe8EcjwPSeQCgFDKeaTgpoLE2BwJtCHmXPfgKUqj01rYnOw481Ov0uigjwokcVHXaiQxpBqJ5Tao2MYmv+a+Xoym6vYyzc0xpsrMJFdi6+uu6w3tfHASNm2H7/krP4Kv/Pf/Nv6HH38t+nm7Li1AJhaWD7hMhtI8p3THfD2K+/mAju4V1vJS92SEbqp93sZ7hDgW4DugrLppLHlKBenh+ScQvkVTj8EluybImi1rHnOcuACKvnG2RW3K47TJRZlnOMfS3pFKkpQc8pDNQweyseCGSZJUYVCq2RPtayWhQMChF49zHF4vzDE8l3yQGGcAaRBgnl0Abxy7bsX2qa6Q4Fo2dVS5WvZIl266bXvcOc4jicaXz/nKccBh2/YTNuGtwzKS2GXWlLkJbwD4hs9/CR9+5Zb5j1bdtN1Y9PECkMR9n0SUswExeLr0cMfQF7YmMVqQnh0j7/WP5f4tZu7NLw8WG5TOqbdsIgG3m8m/OQSGgF0ccnVL612L1aLGzcMlXn+0Rt9bHnmKEks5aDORRK2THG9dMv2eyeNpUbrIudwSNVmxutxSLcVcaffowtqVJcnDupmWXIxjdFNOgKYenUj5ioyT7CIbwHBvET2y4vLb6e8YC7aZwCGWgBjXuoIjGUMSGdQyyhLY+U7CZtfhn33qAQDgT/+/f9xDTccxbbpsYDxm7dPtNEiipnVDVIF4RJyzU0RTVx4FixZhcq7B6LQqE0dMC6RwHNuTMZyjGK2uGWTkmSBg4ST9eJaAn7xgEkdxVggfEMkwTSAVS0AwfTGj5QYFJon7XndsKUiJUWIZH8h9v/tazpraF0Hh9ht/bgDXcmMagOmeG60ydni9mXH2uYE3V23iQlPfPC2Vyj87y0W8JlFeE59wvWvRdj1ODhos6ipZk7iLBHuupUo3Nju7d8itcOsoQBITycxikBgkypl18o9/+xfZ/4wBH4kkdjvdmILtkURIkJSqSTTBXgijl3rOuNQfdwyTjYlmCHOLcQJZks9LjktkOoCycMr0u+lRUnfOi6bG4dIeVOimYSNw1za7DgeLGjcPFvj0/TUA2ycutWAxmb4Ly3R3hZqszHcr1ZKaz/fnqHUI3d9z2bcY3bFEU419tx48shHW0hU3qOHvvtgE7xBqVRrNvYzxWADZX9FBNgCDRjHy51FFtszYKJIon8dQQCNrSQlN17ILFuOxpn8TloAVrunG8/vf/4vXook7qUfJWUxdFiggnpXv2Inl1rzceSyWHNTTRCGLJE4l+Qtjwvtf1NYLx3Pl61k0JJyjWAlNl73PfQbYY7r0bpYlIN/NFaYq95bD+F4xLimMcW4yxn09Oa72653o1iVB4MaxBPz3ihWvW8BUsoFseY5AUAJArK3ToLR8H8f8C015Q1jLy4j3ucdj9l/A+KFdp7v/baLWT2Zq6zTpALjCxE8u1Q2vmhrraJBoPkeShGfbzux3TY0bh4sM3TS/n6a6FWzbDquFP+6W0E0zycysemvUL+fuZc80IjQh3XRfk3gxlruxRkcmuD9KmZxQxVA+g3Hk3WMxFLFcbRuTyY/J5OdmmQqkSot/DJFyM/nuuZnQTROO5MGixs3DBT77YD2MEwRymvmngo16Wm9ZqplJCdeUMte5WlIWARbTZD/dcSWVUjNumigR2nAxSJmJJHr3JLjNvnFQorbnnVZzPOvIcJS0yqOxuXMvjdu29lwy6qZhbz+xXE1crgcndW8p15Kmjjv/zLFifWgFEXCFa8Qx2LQdPvdoPRmTU6l2jxm//xlnK+Ikp85/NEjnnS33erPKoe53Yx3C0ElmUQNXFENDt07WfOeSVJH9jT2m0LtHWiXzjDb+fcnUMsZaYDD7fXhvsXVj4fF4KmEVDzYy48K11R2rqdWn610l4HbuSQqljlBpi/tNIsFeOp78OUTbSgmgFJJYTrD7QTqz54TJZBoRnBkAR+mmhUDd0E3TSKL4c0a4xrTKuXm4wMMk3TSPJKb20m2kNIgRrmGQxC5I5jPrpGejcA2BCu5bYFyO5WqlUo5MaZOKoWZUjUI1df7N68xiMB2XVUWN1B8xjky8lyODZNWRmsR4Jn+kmybaSwDGcVw1virq8YF9sKfIBtHMvYo4gxlhI3fuWiQlpHUAOgRYXWwfOR5TkxhLlJSQxDoyhgnSU60b2EyyLzZRHhNK1/MiIfb+0tYkAva8UDWJkeSKGZtObqX6VALIOjLRmlAik5yim+aet1wt9XpnNsZRuKbtcP90i/c8fwwA+Pl7Z5MxDN00pLwzzlYsSJGxqXMiL8cSflpxEVY51GWh0GITgSM53iLFhJ+t22O/1zjHwCcsIXyx2lU2MSP07hENJ+Yo19u2zigHlzFEitvvq+G98H7S66QSgQyfU3btMvek/9ouU5PrfmZYb1m6AlO6Y/l7AeY951X8HgPZwrFSFPTSPC0F1JxMJkkLTBFg5rolzz8RkAIuu4C7t6JlSIV9eLWIC9fYJKEVrhGRtxsHS9zPqJuWlKqjNfAR3Ylbh2VdjFyiJBY7MOj2xLoWQGXrk3LWLIF2r2564cbQtqY9wPKOU1PHeqQQ2ZhaX5Aeb8pOjJtLU41ljDpmg5pSVnYBIvWxd90GEGsKHg8SD5bNiDYAwMnKqqLO6ZMYW+iKNYljoOG/XgpuQhRLxgCkuEhwvWkk0ZkoU5MYX+zM8dJtQez7/DmWs5FADIEsL6xulpwXrgmzpqy4hR+QunPPjhvua9kYmUbdqbrofBbT/PSeATLYC8cxa0LM+WfppjEF9JBuerZt8WjT4vNfvgkA+OS9qcrpri23wAgDsO24/jDqmkGQ2KcVPXPPNhM4zKEoudRKGpEK1hIW7VmO93HvoCHlOdZVJNju9Uk4tpbLaAO4lNjyHKX0xBPlKfY7xPheMVPeQJ7/wJFn9in3eHJqysczFNBxnSTWf0D2/AiSWBCzAuzayiLpMTElav0PkytMkF7Hg3SekmmPxYyb1M6TyY5wD2D2HLvfmwvAUtCTojzFc+L3NzZj8/vpsqmjPXCnSKKhmy6bAUlM9UksJPRjAmuAef7CUoWwJjGeqE0nuFKsHG2MiG7HI4L1wiCJooi6DxIvxnKZwjGrOFkgzc9cFiF0fihxlyoVJJYXA7Uq6uwgJYLSUb2F6mJt2/f/xi/Fb/z4e/Al777jvZ4Urhk46mLHK4skRumfyvNvjp3PTkn9Zqxulblu7uLDOGlx2W6+t1O0UTpB9woFVzjlVv+eZOcYCgkwC6sXuBHnwxzP/NSrm1pna0QpCC952fjXnEESTVPe+AaVRBLPkQCajis7F009RftLz5vMI083Nc/z6482AIAPvc0EiZ+IBInbtsNykT+XyZpEok9iVLim5CBEzj9DuQ6plcy95QaXemc3HJc/lgRSu67T000DZ7fvkU2UxIRrxtrJknPdGHo3U9sfHk/6K5ZUqoH49e77cvI/PP96BDgI7gvHswnN3vtZWoMWEX+mtHaFaytb72r3APN/tm3AVM9B0ZdXef7r8LuRz/bY99lZ/wEuSPeQdOK6hclrZv13x01rErPDJig1o5y7bKpon0R5TQCA9a4d0b6bB+maxG2BTRLzXQE/WfttH3sFgFO6lPFBc4mSdFmQMkrsWz7Ym9Qk7ummF2JZ2lbEaQLsQ5p6cGKZN27R0quWpYRMgHJtIRDQTYnFLuT+yzxL3y2m0jjSLYYH7aVbh/jef+WjOFwGfRIjUP9m1w3qpvYBOhkEb+L0N6BEJIktIjSSOAlKS3TfWJDOLcbh8ToikJpfkzgNZo2yXfpYdfS7lbNocbojt7A2jU0MsEFieLySYp/Ywnl2NEiKT9PrKcQzlvAA8ihkPHFUnmeOplpag2J1ypxIzvRvQjeVjfpzD02Q+M67x1jUFV4bgkbXtoXEhRxzF73/y8+3O27M5Kf2jWiyo5wAkrGu80/f//UMummwJrCO5BhItb0KSQ+ZMuH6Hx0TWV/HwLTklA/nkkUeZQzgCNcQ5z+t5kwG6SECTOxTwHwEchqkFJ6bZurP7Lr88x1eN74mzvx0A7fS+QCme/ecmkQ6kTPShHXnf1KTSCZYwv1U7s2s5kETv7fYNcGipP4cknNM+K6lmsRNrCZxaIvhC9eYpIRBEjN9EgsJv5RSuDz3f/I7PoZ/+Ie+eTwPOeEafaJwhnBN1/L9DmtRN933SbxQyzlqYeZHTLjWqU0ghiQyi1Zd+04Tw5GX9T1EX4ACIhVx5Ln6o1j9HUd3bLtAAGWsics7uyFKB5hsk6ibip0Mv8dpBRz9JFZ7pFU3ZbJvKXGLeQqgZYcklpFnGqUvA/oVMIiEKHvL9T1RjxJJCjCqtICfbdXSTT1qGensyjiWagTEaXpFJLHWI4k5xeOcw5WiqZbXrela0hbkvnP1xuutjyS+9tAI1dw6XOBgEXcsGHXT0JFk6HbR71bI5OfqxClxkdBBI+nW2mAvKXdfOJarbqpB0pNS/pmxiwB9Z8eZsabmaU7dsL+W5MdE1ZyJ4HIS7A2v0wm/1r9ufAAwBBvjeSyMi7AZ2H1xpI0Or2sThT2ROAUwqdtjzr+lm8ocyUTOzAA4bCfCqCubcfHnNFsTGiS3WAq6/Flb72rUbKdJydy9lVrLNyPd1AQ5p1uTNFw0puVZtk9iwS+J+a6uv7Ba1Hjx5oE3BkgEib12D+aS1551GiRxMSCJF9cncR8kIu9Qpm6QEgXI3Iz+zc9uGjFkLxtszKWIjRubfc06kmmL9bpisq2xIGVXcNLsYjz923rbjX0SxU4cuulkjoQARAwRYTOmMbn7nEOeogTOpWTOCS4ZCfRUTWLWsY45yRQlWc6lfa0H6SQ7AX7bc9SyMChlg0tLQ+9phxXwaXrMuZfPjQlF5eaaq1POUdJm35OR4L7v8851MzpMOSfBPNuCHN46XGKVcCxKVCM5ZvT+V7IgRvS4tG8okVwZGzpoTC2dm2Bk27KEtZPWkS/fk3Vl1m8Nkh46abuunKRq6mmSiqWPLoc6zTl1w9IHlVGXjbEtuBYY/nrXKymZE7pjCYEMgxsWSUwkT5l9w6Kd3DUI97euJ2sSg8Sw5vyradp1OE6SK7r7RPwaRrzMPR6z54TggRbttK1LuOAy9LnarjxuESlBAmxN4uGiwbKp8GhADpu6wslBWt3U9EnMB84TX75wLmP+FmCp8slStQjAxPZJ9A+0K/PWx8mugHazDxIv2nIB3yKy+ANlZ9I4Ff5r7KIVpYgRDnkMSSwhgkCcblqqW5pT71dHzmWpJi6rbtpO6abHB45wzZya0Ahq0xMJAfNd/DFmHvljybzcOfK0Ufsa+93MuKmTzKibhs4dlUXu/QWyvEGZn7PVTZ3eZiUqmjdPB4Hh2g1Yx7UlnlExl8p2HiSxuLHNXhPi9yT7bGuypjGavJhcx6NBiOre4834/4NFM9JRXdu26X63YtOaRPPdilSqOqGKmvh+ucQRk8wJnUFauENLPwwShWy/PWBA6bpOVe8XliowdWqxJChLHzWtqHS9HEPk0qwlbHJLl1yR6WhpwhO0Ddx1C+nkLJK4qKe9Wkv121MqLbg5TgK3fGmDmAlk7f8Zuu+0bo9MroyBFLyfpesWqptqkcSwdUbeB50KMDFzDBOnmrUk1k6t5DvFatIlSFwtahwsmjFIXDaVSRIO5RqhGb8k064skuwo9nx29uzYOJ0uQJmVMDFNTeLiENitsa9JvGDrOgbJUi6QESSRrVGIIlJK2iiz2J1HuCbWWHoO3ZF90JLqposazx1ZJPF4KTWJ0zHMHOOCN/kFUqYeVYTMLZARJ1mFCAbHO49wDRMEh82std9tTk2i1GRpnWQt3VSuF60k6dzLsllpGnVvWwdJVCpyAvzGFkNfcrOc2zcsHlwWnpuISq+YfL/DZY2qwliDslrUWSRxVcgM1NW0JrFUxwhME2Ml+qJ1/u1rMQn16LHqadDA3MtucGkDt8KYibqp/aySLYfAQVPvF5YqjEgig0hFgkRWuIZ9P+DWDQ9rSSFJCMxf72J0d0DfzohGiYK9iq1JTKl+a8owtCid+wwwNYlVFVm3CmPka09rCwvjgvPI+GnAFEksreNiY8CnUEWVP1m6qbxOJo6C/orMOQkFt0rjYnsbYIPEZVPjYFGP639Tm/8DcbXRbaFXbpgkBOyciz2fJ+y5/JoSUoRljJ5uuuNrCxeHwO50HyRetOX6/aRqEktOcizzZpym/FymdFPuAZ2MG35SEsnd9HhawRVVCwZnnrsxk5avSYwtJOtdh9WiGXunAZbOF6Ob9uA27XCcoA0pqypDvVIH6UIH8egImobz/vFKS08USRzu0VzrgFRNUL4BuX2fWA+F8xM4rcy66m44LbkYh5t9Kfkzjhs3+250DFVUtk6BJEYoMqWNLSqcIn8jEk6TetfsDBPBZeFetj0jp8+2fM6yqXG4aHD/1Gx6BwvjJKyjNYnlgG8RJO/arqPpxV4AIEFH4gvG11Zkx7hjw9pCVnF3ikhxwY0WyQLMWrtrlUhikMnX1CTGgsRSDepSWmAUnhfXmrpCVZlnmxUOqocx7r3FjgMcSqC8XtoDErTR4rigvpxdg0K6NUNTnYrCkHMM0W1ijIzz1hLm/CfnqBvHBESAEzi0/nUr19ba/cY/Xnpc6JdohYNcum/pWMA04GPOpatI7tpmZ9f/g0WNx5t2+H/l1PVH9oAuX3IQiuuYMflrkPJBiwBHJLnOJFwnpqlJXBwazvpuUP/e003PbyLTm75B4lmLUk1Wqo5IC9nTD2hAr2QRQQCT4JLeoJQZknCBBKZ9EkMrqps2Naqqwu/9xZ+Hr331BW9ciAiyKN2kJ2bP1aSoabvJ8885dqEDqg3AzO8dqqqAeEZqx4qKr7EghaEthlSX4PWcuQh3RyKJE0pUIfkjNjZY71xUozhsDGIMkshRjYyyoHJjSyAbQGFNqKbXjXm246qopSbp5me0ubFzbo5XDd48NX2xlk0GSew6LBeMSqObpCq3IAGmzJCSKmdVmaAhpm7KtEUYa2s7zrED/GSCFtmYjCOQm2VTYdv1dGsDeU9U3TSLiPgOsjuuuFYO11vulxXJ9RLnVUNTbapqsieWRoWlIiySGD5v9PUO9g45p0wAEFMFzp3O6RxlfGkPhjdHhiUjc5zQ3UuCPMEerH1uxrq9Li9kGI6bIInKcXJOc6iZjJtbE6oV5Zn0+CaenRhzC3DpphUOlo2DJFaWjbOL7BuFPokx5LJlfdAIUGQ+M36TjT6C0geaWNdyzgUALA/Nz80j8/MCgsTzf8ITbmxtj5ZumqJkMjUKWtl6wNxDUYckS5P0HWQ5nqZoe2B3DgW5+Tk2zTTgpouGE0jiwdJ85nd/06uTcdq+bWZcnFbABZe665YSHCovxpiMo5DcyPG2hJO8DDYo+QxGuEZDPwSm11uDbKyaGtvBGWRpHeGG2BYCm3Dc1kFSOLqpzS6eB0ksbmzRe2T4G0EBdQ9nkivZKU5obPIZVC115Nl2z83RqhmFa1YZJHHbduO9mrJYTWJJOAiYridUM+sqdFpRHDMea0TSFUFKZFx53wiSMuIQkgmPnaccWh6TVjct90mM7Ysl5HhZG7rpGCQWkgj2mOF3Y8+//T+TlAyTOTzabH7aZBp3vVO9C5m66LbVXbeUngB9T7p7ALH+T4IUct8G/PIGQKHCPZw/tpdpVVU+40XOI4GIA25wyQf3YQJIjW4r0FV3KWeOt2jiSGJIN328GWoS6xr94HPG+iuWxMuM6KL/mhWQ44M9wK2LTh/L/XzzGVzCw7Nup0MSAWD9cJjEHkk8t5U2AZvBmdYX5tGXOEWMojtGgg1GtSzmkGiRRAOHl+fozg0QKqcuiwmUM/JhzZhr612bzAzHKXpcpnUyruMyfVqqRbyXmiLTpwzAwkJ2+b2IZEVoEyUkMVW0zd5bE0l+YmGVgnYznqS/Bchl23HjlhHaqKYGctf1RWVfsVx/0dTGFkUECVTqvIq7muudo5K7SOnR0tZVrDJI4q5QjwJgIuXPIonh880ED6EKNFMTCviUqBGlViIpdEA6cZJBzREYHDxP3ZR43mrjSPa9//3yKriR9Yd9dgZK7FobJI6qqMO86fPvK0CzNaFTJLEwbkKTxDBOFxTRbIa69mvZCfrueamc4+FIxzrmA5XPh32ve8wy48X8tME2X2vmAghsPe+4VgYtT5ha2ZCSzN5barpppa8bLtUkLpoaB8sGj9bt+P6VU9cfWrFPYjVNSpaStSnhGhvgF4LLCQiTnF7cNMI1yyPzczMEiUy2r2D7ILHg4Lm0snBcqUdNLEhhsjgxRUIG6lejBnNpi0lHMj9Hq9Dl1gTJAxq/FatgMXZNhGtiVkdoDFyfyviDXQxuJlQjmX/+HgGmjnV5g0qMU4pUAINkdKmOKyrlTPbI6nX3VmrTZvbf5dATTebHqJuG341VH/P7xJU3w3Ccq7hYCmzqukLf+/cku7GFNaEAR4HWKu7OSXikBAHceS/qGscrGyQuB7W7uLop0wIjEKBpSYGjFAJWeL67yPmnxLOGN2uUc92glK7/Cu4Ttk8cYAL2jYukk+fRzM/8nxFvit2TbGJmMVBi1UFibQJgpkXHOM8qLPnQB21skBKeE2Zvc8dNkKxikBgEAEwz92COsu2XE4XDMZx7mXGsw4CDqqWOoZYoP29S7+cmO5j7H/DromnhGqnDG1VRh/kT/uQ0kZCfX/iM8my2hDJ/ZtyirpMCNIBhAhws6lHddNFUWC7MByYThVlWQj0BfMZESeLExNYfoLwHhH0qZcysFhga4RoAOL1nfkrQeA7bB4klZysoGLbjylzrMEikgpQAsufpJ/EHlMnk+7LFvNz9dByXDXPHsbVVsYBPWmCkxk2Ea4ggfW69ZRiUMnSvOW0DgDgFl0JJI05523VEn74pTdggiYxogX1NEwBPnSbSad3JJqpTN/UaZxPHcmsL2Qy5GWePx6qbxlTSSghASCME5lOg+wJrIjWuLVxvGklcTZHEON20LwaJIb2JVjetQ+Ea/zukxvhrOR+4tcH9T1GgnaDU1jKSQYoEpaTzCVgkUXP/N0GiiqFch88owCFZwCBc03bjunDA1iQ2tY8kMmtJ4yOJc8TcaHXT4Hlj9rbY8WjKe+DMU/0twzkOr9MUUC9IJJIkVQV3y+9RftbC2uExkCoezUf8u557ZgAfSezI8x+ygDStM6woEvecjijpDJQ6VnJTKsuKrf9usO4FiXXtJWhDM4nC9PHcXrLjsQpreWz9AcprUMxPY5/TyQS1dNPT1/3/n8P2QWKBKpOqSSwhNym6qRayZ6XMp1SL8oKQ6klXprbGxhF0x0jA3RY2m5Qj2XZGdS7lFNaBU2fmOLffW3kxriufEstsNnHUhs/0hSq42qwpwNHtbG8/HwHOixaYn+ECOTezyyyry0WNjUPH4WT8LbIn81XRTdte6VjbDY510GL3JJvFvJh2OoyUfDzhUULawjFicj0WdYXjld0gV0ONSjyLnHcQAN+xM8fm1E1DKiFD06tSaznhbIVOPI2kBMFG+d7y58buN+azB+XQwh7qH89f85jzGFu3WCdZAnVBnqWGvWQGSXRqEpnzP2GTKGrihmFsUixWt8fcI2ESjqEEAkOwEQnSS3TrcI6MTcTEuGGoK31yF4CniqpB0kPknvX93bpoFkl0a+ABJ5lDjJNjaO+taU1idtjk/mfWBSMQNV3L3f3tYNHg0cbSTcXni9Uk7rp8ojCmVVFqw5MUrimg6bHgkmUqedbtuAUZsMI1p28M/z8/krgXrhFHLXGDxHr7yf+LGZIokpWfT0gbZR2LKoFA5kal6KZ09jOYZ5lGMh23LdSWxGhsAFNLCsT6VNIonZJuF15vq2TIOMn2NYqSWQ/ZT/e6QYGSukEiQbeLO2kFJDGCZPXgnaY56qZzkMQY3ZRCBEcRJsdJpmiqNrhk64HCRsru76Va3gn9in1GldctrIFk+lumnm133k1jaxKXTYW6rrJI4qKEJNbnqEn0kkDE8x2yOxR0u4lwEzFHV5l5VP9UIsBsjRQwqJu2PYWqlo6XuwbR/rpkTaI8b6eDk7lqONqWIM6aeuMwMckkTuVjJ20KCseati7he8kCDpJIJhNMLe+0TCQb3AdzlMWcUQp3j8EqVU90AToy2HNowhrmSl3Z92vopi4qK8G9tsc0Kxblons0bXQM0hGMK/slMR90Tk2im7xwEzvLphrnsQ0VaGCC6Fz5RpgkdI9VLDlL+KClFhjn7pOoqUlcDEHhnm56cVZEElNBYoGCFUcSORpJ791U5meZSjhFbQBdzYAcT5tpYselONpABklMZXEK4xZ1HT3/JUv1e9Orm5qfeSdZ3us78hRqEM1aF8YkkcSCQuCMPonx88jRps17A6eJOCerRWUzrQRFEnBpo3bzZTZ726vJ0u2ooLSeBpdFtCdG5SxsbDF1WYbqkhKumdvfsqT+GR5LTO61ZV2PdFPJEJuaRD9I7PvetMAoOqD1pLazVBNqxgVICoEeh+wONuHhPtsa4ZRFXXk1uaX5AdO1XHUvN34PQkrddIIklo9XZ/YNRrgGwIhEqNRNu14VpIc9OOckTu2+rR1XZpK44yTIppMJtd8aignSk/V+bJAiARi5Jsdq4ph9w1WG16hpu883O0dguE+c869JZoY0VaZUQUsbTSngUsr80Wc0P79YTaK7N7q6Ey6SGBWuKZQcLIJ7BCi34UkL1wwKs4Xg0lUFZpM5ns2qSXxj+P8+SDy3sbziCR+50I8llFoH+D5xUUSqtNlEgobSuLktGJJ1SzODFPdvyTGJBzvnJIdrD+Mkx1FSjtYRng8zj8yYxPlnaVthc+/S4iPF9iFtq9xraaqKuuu6rAMaTyTokaxe4SS7SCJzrQFn8x2da25cTLhG0wJj2/ZFFH2cYwLJdf8Wmr2P7WuaRII2cRFeb6a5dIyiKuYGASJcIw6+oZu2k/f3fZp+LmaETMJ+n0RNYhJJSY9JCTmUbhMRKur7XhWALRcR1UQlkmgVENmgtHe+V3mMvGdEKYh5yjMaozuyVHmR0NcJ19hEDvNsu4gUIPR6LikzDVKUSRliDDBFRUqtdMZxjX//M3TmaQLCvF4+J/4xmAQ0ME3KuJ9VGhdSW7ng0j7f51E3VSUXg+BeJ1yjDdJ1idqQTcWVPNUTUTbAZ4odLBzhsqa2e2iiDVKpvjmpUprYB9LCNeanpsf3/D6JrLqpEyRWNdAslQeb2jMfJO5IXnEUScw5yZEFixVACSkrALGw1vGiYW39kaGkcdlnbXATU8lsO/NQp445kcOWcQUHO1RjM5+haK4bOOTa4F6GU+qOQUCqraMAFEFRIGXOZDJjdMfS5hZPJCjkt2cgia66qaGDl8fId9t6GWF+nNsCgHKsHZoq27tNJLbjSGJqYxveF9yTTCsd8/n2NQoBDsYxCEyKyg/YdXlRW7rpqrFBYogkWvptWd00PI+zWmAQmfwJksgGAM6zoxGFCe9/mXf2WME10CAiy6G9BItaAlOFawZJjDFQ2FouSRqIhD7fAqP26KaUcE0drskKoa4wkFIGidLMvWRh7za2D2Toz2iu20jlpHs5zv9uXe80uGcTrs7e3RN+kztPlzZNI4mOwJFZf8r3ZKjnMPZpJfyZ8LvRdbITdLs8Lt4rupwAmvQU7+zYCZK4iNck9n0/tMDI9Ems0khialgKKCr1qowlt1j/zrOuBeoZSOLiiHOcCvbMB4mljFistxxQ5snHmoQyN0hT24cZ0C2sbRA0AJxwil9/xKGWQIASEfz/tEpmLtg2P2NBOpDng4foIxuku58v4yjZ+ugCmR4TKqvZY2UPNR5PiwADZlMJa3uYRsrmvT6SkuX+j9k3+xpV2xbJkAMkkrjwaxIZx842N3aDS84hBwIkkcoID0Fp248OfarXp1i2v2ghi+nXrTKtLDA5FodA+uMoummCJWA+p0NVmftI6KbyfumH6a6TtvlyOeGhWX/GccF6ziB8TSLhx65BRl1zZpDIOv8hskT0hBWbU7c3qYkb72NlCwy6T6L5u6gjlp61cdyAJGpYAuG91fUcjRNwAikJUgrHClEK1vmc1LaR1y7s1cqMC9cSNgCe3pN8mxr3OOw5cRPszLol5l7vEmjgzTNAEpnYMl2TWL6/bLBtXmPZPPY8cj5oyN6Se7oEppj3Bv6dU+d86PTJXdRun8R4sJcrOYiVgVkRrIQIYmQvdedcKpUKhWvUSGKvCBKlBvH0DYsqntOe+SCRpTvG5G/zfPx6clMxjvwEkRof7HL22a9/KTsX8fojvSMv40rfLUqbKwQpSSS3hKQEWS0zR4UgQEAbYprdxoQt1NetJ6kuVYDSQV9HAXB0uzlIovxJm0Wzyq0yhtugAOMkS3axpKzpmvREs9lZLmgAMDjJ/txLcwRMcM4iibEWGCV1x7hwDU9jmyruktnnCW2OGBNDEh2ET+im8l0OFoai5DoJY1+tonCNGWud5Dw9yY6LI4m581lVfsJPQ9uS98sh2TpZQWCZ+QFxBJgW0hvo3ZZarA9SKETKQe3FWCdZqGoPzrYANEjiPOEadX/doC6dTYrZ2m1nPJlcBKZBIpMo9M4/MS4mZgXom7mzAVh4LjXnJAyImJ2jqW1tISuuA/hrSVtAvtxjAZg83wydPAwsyyKI8I7BJrdC9pZNnqbHxHpnm2MLSgecOC2QFk26BcbIPlGqm5ZooznxSgDJFmLhXsqIuUVtTk1i315IPSKwDxKLNRG5ICUvyjANLBknLaR10FmcOq6kx2Typw5h+VjhOGqO1XRBKGXyY2ibjAPyNVkTdVnoi7bl92Kj+iqk7crr5azplLPObIjTeid2XEj3LaIvEbrjroC4xVAixmmqhvPsUobMH8rf7WChVzcFBIFx6r+0SCJJ/QF82pAEtCXHdUS3HSdtV6glitVDMLStKE2YQCCnIhX+PPJjpn9zr9+NA1NXETZEd+lGY8uM4r3sr0GMui9ggkvXKWHQ4yS7Q3ENbLBXnKKhfw7oI4tuj8kced4K+5p/PBNIyffSIInW2SX67cWSiwQCCQA3Dkwtz+uPTZB4oKpJ1AnXxBJ+jCo5oEuuAPF9ii03AGJIop6mXRoXo40CRMI1TFyQa3kVrl3E+QeGhOvoyA+v0S1gJADj7n/AnDMZtyOftzG5GF43Jnkdnn8S3Q73YMYv9ND+Tsbpnm3AgjBVVeH4wNbjLerKqev3Nw6pNc/5MzEkke05PAGKCtcgXOs0CT/PNDWJbl/EPZJ4MVYqAE5RojoCSYzXJObn09RBQ1g2i5MILnPD5rZgSDdK5xw0TyWt68p1RFWEIlCoJa0rK/4gpqoRmYGuRs9//nATxJOlyEyPp6+jAC6vJjGGUuvuLbvRm8/LDgPg0+0MIkJmdocaEU39kfRXdIU7mOsmTup669QkEm0bgBBJ5JJbk36HSqoXQCa3gjlaByEzRjLWEbrptrW1Os/fWAGwaJCgQ+utFa/ZjHRTEhV3MvKMuqm5R2JB+sXXJNpaca6uR2xMXHRdMYkwOZaD2vAIfO2JuzCPW1iXzvR7GwOb3l+3zLj88SRIfOPRBoCGbmqUW0vJSNdcGiFA7vfBescyh2K12xSTJFjLWQGUMOHBnP/JmkD6MvJn755UJCDcgJs5J/E2EdyaMNYIEgnQcVxdeX152XsLsEkVFkl0a/BYsacwwaipZQz3DSB/b8V0Ksz/7bgbB433fkkSTurSiTUv6ksWnvFkCwwCqABcSji/TnqmqUlcHlnU8QLaXwD7ILH4sC2Ch9Mdl0dSpjc+U9tWV3HIvohk1QnBm5yTFqk/4lRKp+OY4MZuUEFtG+HITCgChQUvRYmdQ6WlEeAAkTVzzw6L1C2RtYWTBZl1EupJsMHWJLbhdStk7IAQXVUo4I4Lq3mdrUnseoyOq4ZuunUQEa0qKkt9AzDWV5xtWzqwqSPnf44qMIUIJino3Dhb21M+J6K2G6Obuk3uXxiCRHlbmFUHrIPAouKuSiClblpXHr11dBAKdbkhSwMo319uUkBT7+r24KRVMidBii654iLwnLhLiIiUe4VG62RJBOxkcDBfe7TBoq5U380TrrkkdkfY7kFLSbbIfdm38McFrVKIWl41khgGsiTjItw7WHR7ci/PSLhGlqKkuTWJnWK/cZMJdE308J5ta6+3fFZ2XDNVPGYEaNz3s+tWGIAx+2IKSXRp78crH0lcJemmwibJCNfU0zKk2SVnhfMZe0aBGXRTTU1iVQHHd83ve7rpxRibkQ9lc7suv9iFzjhAqjvWYbDB3Vih4A2ImsQ43bRXy3aP4wrfLdUUmWnkOy0aJmuyAgouvfkGgRQT3IQBEcAEl3rURo43RRKLw0zyIqAtzkcSyw5CGDhrldU0NSKWAmpqufgakToI9ogxQnnp9OIiTV3hbNeOSGKJAmefG/taad2KCtcoEjlzE0Bax8KlbLm26/ox6Hn+5MAfM7y+cTLJWzLgXgZ0UyZJIp/rI/Dl4CbJ7igcy1WP1gQptudnRyF04bEAHrUBDJq+6+apm4Y1ifl2UnG6e2kc4COJbD2ifK6pUzb/Z2sSQ+GaMnI/vDd4Bth10qVJUkhusJZoWiloaxKnwQYX2EyFU/jzD/h1msyd7Auu6J43CUw05Q1+TWJHjQtLPlh1X7d8SUNRBSwSqCt5sv9nEh4x3wIQv9B85xMXSaydmsQASRSF8lyiMBRgAlAUwUoK1yiBCk0S2jNNTSIAHL9gfu7pphdjpWxHiTOdsngLBi4bE23Knh2VQbJyQWKCEsiiPbvJOG7xmQQbxT59056HvLqjfc0gKbogBeCoiyEdxyK5xLjgWOzG5tOEuWzrtAVGV6zriSVKTE1iZn4RJJH5bmGdmoxmkUTABA+mb2RxCIAh29rqHHKhm3q91Egn4XBR42zLt8CI1fKWarJSSDqTpJL3qsYFTivvWExpPDLvEUm86QeJqwiSuCXon0CcbsdS2bZeDSThJNfhMzq8TqJ7rnANRYF2ajU16odyLPOTd2KWC4MksvexezxNqw75k79v5BtZi51ITaI2SJQWGJrEUV1NkHR6vVM+NxO0jQhIveNJkoRFpAKUtCT/DzgB8DCMFU6RqbjUdWZpbYJxTHmDzDNsQaJHIGeqm/YclXkx47mRv7sqscyY8fwHCT+GBQdMkeNSWZZ7LDGXvXLiIIlNbVtgTNRNBUnM7AFu38hxXGGesSStOy6JJCaSJKSbYE1TkwgAx8+bn3sk8WKMpptG+MjZ/i/nqEn0nSZ2YdUL3sQdQn2PJvkMdmMLM8Ilx66qpotIub+l+TlFssg5KtG9qvID2V6x2YfI8TxqE78hhrShothHpHVJCUmUOYbnkd1oRqepK2cjxVaCMA1Oskrd1EEEKWrfwkFthq/IHu9w2Xh0U1bd1K/lLSS3xqDNvsYmqQBMEhDsmhA2Sdeq+4q564Krbgc4KK4btHVyLvPHWzpoG2CcZQ5JjPeJy7duSKibFul2GObWqxyLlUM3ZWicwPR6sz3pAFMbunbuY0YUZoIkEsG9tKnpouefCxI3bUfXI8rn+vWWxJpcTWmLPN1UNy7cp3oyuRgiN+3oWJeP56GkogjJlBwEa/kcNgm7JwIucsMGl/qG84AVbpJj0khi4yOJbA9OOQ7gMCcUgkOsCFN4T9K+zCRR6H9ezFJIons+TxzhmuNVMyKFYZ/EMVGYuycj+418z9QaFCv3AOz9ybbP0yQg/APteLopYOmmeyTxYoylm8ZurJJwRzxI5IKNfsamEat/yQ2LI4m8kqG2/iLaAoNYXKeBs/tgx8fGhVP4GpFwjuUFMkTN/M/LHS+kBHK00crbDM1nlceFyQu31UByTDNdJKlaxmpab1maY1inpqFouKqXuk3b0OY0tYVujUhPOv9iJkjsRrpMiSKZquU1c0/c/xEaG3P+x2zwJEmSHxcmZeSwDN0xFiS61y8MNGMS6Fsii+zOx6VtcUhiPUmSAIWaxGqaJJHXc+auQSxFDEjQTVm6o4M2sM/N0bLB2a7D2SAgdLAsOzKLAAUenzmCTeIHKdyzesNxMDVI4sGixnqn64HqJuDYNTlFry9FfOE+xV632P1v5l4+/3Po1u6x2DUh9C/Y7ybfwfWdKHVTx79gewnKPEcBrJ5D+8242gsuKSQxaDq/a81aXrxuHt3UvpazEDxg65tj/S1L40JkW8xl6h07ScK7J6tJok9M7sncfhrex2Zc+RmP0VR3he8X1lLLTypG/LH/CvjeF4FP/yjQdzok8ei2+Xn4HD8mY1cWJFZV9eeqqvpkVVX3q6r6Z1VV/Vbnb99UVdWPVVX1uKqqH6yq6j3O3w6qqvqzw7hPVVX1e4LPTY5lrLQJp2oSSw93qIYHkCjdmMUZxow3YnZYUklPKz/cQ4M2+JnFMtowpRZs23ImP5b9YYuNp+qO2UNFA9lSQkCOp0Vy4+PIja2al6FyxwF8kA4EQiFdmYIbUglVAXCwQTHj3FoFlbppbWhz2tpCAB5NlUUSD5a1qUlsTcN4VjgoRvdS1eQS60+Kbjq3llTPnDAWJi/+3G/5Cvz13/m1AOBIoLvrSDloc/8u76drEusKfuseQnAlwe4oHc293poWDC4NixYJCa6bpin44dIknB6tTZDIIHXJZu4U4jwVbmKenaMheNUEiUerBU63rTpIn6Ao9LNt/k9TkkOHXIm2WVl+7jyGyUXmvKSDhvwcJwEwuZbHKO/MreyKwEl/aYaVI8lFAINwTflYgFlLXJVSTb2xUCq3hCq8mWM1ScjQa4L4oMrklte7E/nrnUQSHa0EN9FTVUZ8yuzZM9RN62npEtOGJ6w3BhwkMXHhQ1VmRszNHnAJtBtgezbUJCpCtXs/Y36+52v4MbmpXMincPbvA3hv3/e3AHwbgH+vqqovrarqBQB/CcAfBnAXwA8B+AFn3B8F8CqA9wD4BgC/v6qqbwUAYmzRShnhmIMm47J8/Ehgo1EODeknTAF82ABe5pEek3II83OM1ZsxCOScVgpyvLT8cKEmS+nspmu5ygvkHMGh8D7pe66ZdYxGwuxRYVBqgnRSOMUTLigH9xOUFNyG6I6T0RTdNEQSSWdXREk0SGJTm/6dWgQScGh6O0OBY6mcGuGIFJJeDFBiCSAmuRU8N7TgVopu2vqCDl/z6gv4grffAjB1mMzv5jPKwjWBAETLq5uqm4nX89RN3XPJ9LsVW47otr0nS8/2xLFWIImi1Pvm6dCaZMnXJI59KklE0Ih92P+PAQcxV6Gr3T5aFt8rdrRscLppnWCbWLdia3IxIDI/tQhkWCfFXrdwX5wjgOLOV4ckGh9BvZaQa3l4vB5knWblsnLMa1zg5iCJiufGXUt2Hd+CR94PmHVrSV7vMdgm2RbhPckr7g7jggRvviZxurfJZ8j1dPskii2b2hMuAzjxsiZI9rnHLt3LSVVUEknUJPNHqujuVF+T+Pm/1Pz8wDfyYzJ2ZUFi3/c/2vf9Wv47/PsAgF8F4Ef7vv+Lfd+fwQSFH6uq6kPDe38TgO/t+/6Nvu//CYDvB/Cbh7+VxhatBInH6rFkXAmeDm9GBiUKG8Kep7atNC7e71CxiLsoETHHlJT/nD6JtiYxcawgQw6QNXHRwJlERIJjufPIjZtTk+gGpRq0IdoCg6B6AfrgvpkEzizaOS2216B7p5sWXc83zm6GrKQWEVw2NTZtp0IgAYPAnG07rHedSuwj3qcsn9xqg3uSpQxNadr5OcbUFt3XUxaj/wB5GqhcZ7cmhUH23L+7AhAc3aueIOml403YHSNKkT+WFySOjlZxih4N19II82PChF/X88mOSZA4oyaRrYmrax9JZIJ0Memz9s47x8X3ih2taoMkahJHFdTBxpTapxtnBWhYmnxQJ8UG6Y3vzzB061jiSKOA6yJgGrqpTJOtSXRVObUJ153z3dj1369J1LXAsMktEkmsa48SC+jpplqa/GTvzvnJiT6Jbiue4wiNPUwaAQ67oFACELjl1L0cO14pUTKtSeR8eTN4EJ3ZnuprEr/8O4E/9Gngxov8mIxdaU1iVVX/x6qqHgP4MQCfBPBfA/gIgB+W9/R9/wjAjwP4SFVVdwC83f378PtHht+TY9k50YhUGCQWKBACa4fCBUywIe81P83rTLFxmP0HkG1nUQeZH4BDBGMohaYmMQw2GMpQ+ICWio2jgSxz/qOBc3lzSwXppfUg7D/V9dwGtWhcJT3zGkfl9K8bU5MlwhFz+ltO1E2pOdrrrakJkoDrwdkOAIdsAIMAQdurziMwUBDb3tZ6sM71wgjXbEkxjdgaVFy3ks8od6xpkkSX/WepZakgse36ZEbY7Qdo58gFDcswI9+V1ZXlc2PIZV5JT8/uMHOcqpQyiEiMbkohMM7a1ZLPKICRxilBouZenjRzZ/r0KZIkrr04qOO+8w6v9ne0bNB2Pc62ZRVPscahZNJ068CxpinJwT7FCg4lzz/xfEeFs1R0UxKhG6n8QuVkz7/56VJ+2RKMSQ08mZRxrzevblp76yT7jAL2vG+7PtvqQcwFK+ZS0NmSpzAxz6x3Yd9UMTcxIPfRb/rK99hxzUxEsPZ9QvfYpXs51isdyAjeVP7nq/okLt0gUYkkVtWFidYAgOLI57e+7/+Nqqq+G8BXAvh6AGsANwB8NnjrmwBuDn+T/4d/Q2GsZ1VVfSeA7wSAd7/73ePrpYxrCg4vUSBcp0kyFEaWv7AYT/jg5KZRT5urA5xwzdxeanNVUX2VunKfoKoKe0Aq1B2DAKycocVkXEtct5gAjft56eMF1w0Kiowy0wf4GxTAIymhcAQTXIaBM4PkAsOmHWQjmY30cBEiG1z2bTH0e2MoVN64xvTJ0kpbHy5rPFhvDd1UgyRGkKwkkl4bOqz6GU0kSTTol4xxX09ZSNMWY5DEWEuK8tol2V2duqlb2+OOLyEp7hxZZ8sNgjXBnkc3VdzLrsCUpim4iySuFmXaNOBk11v/+eaQxGmShJnrO24f4R/iDTx/46D4XrGjQXb/4XpLzQ8wDqha7CN43myiitynnHVShUg5SHpVEbWTle+UU1TCyXfjSilCaiWT3AKmyWtVUjIM0snAzWUkHBSUlcUWtV4V1bZcGsYR/Y2BeE0isyab95v/s+h2KlGYe0ZjGhDAdP3/qT/+yybjJjWCBMVe/B9XsZu5l6P9FQt7cKjKrPHTvCCxb3V9Ei/YrlzdtO/7tu/7/w7AOwH8dgAPAdwK3nYLwIPhbwj+Ln9DYWx43D/d9/2X9X3/ZS++aGHYovztcD0nN0iBApGiZJbuD/m7y6s3r5cX8VAkBMgv/sn6u/wUkzL5pTXrXEji5AHN05RC6gmg+27hudQGRHNrsjQUmTk0BpcSBRjUganJWtaVV5PIiPnEezkSc6yryUbDUGlFBe2NxxsAPN1UNlJtbeGyqbDterrWRkzUTTctGSRGEh5MfUns3iqyBIKaaDNOkQAKGBDMuLDWA8gHb6H4jHl/7/0tZTaQskgK61yHfULl9ZTVVUpxujBHJwhmHTTAIom7tqeDdACewJSmtupoZY735ulWRe0GIuqmhWOG518TBH/8/aZv2Es3FUHiEAA/HER52Ho/G9iY19hgb267Aa3gUB2ef0WS0GVGsUi6zE2OpelBu1XW+4VrEJPwBnwWlmVglc1ti6NTN7WsBPa7SdJP/J4t0d8YmNZNAnyi3KrEii9TnqN5P+hxsR7AAAfCtAFwY4GD9PFCEAZg7+Up44Wp+zbJFb2fhoVbk6ikm16wXSmSGDn2BwD8KEzdIQCgqqoTeb3v+zeqqvokgI8B+G+Gt3xsGIPcWHYSpRurqqqBEhjexCUYferYqVA65Y1VBQ45My5Wf8fMMYa2zaGkAWYjOFzqAimgTC2I9UnUOLtaml4YELHOXdhwm+4J5TigbNYasKiZGIukxJDEcnCPgG7Kop3zUFIJEu9JkEjSTWUj1dYWmnoPnUgO4PRJ3J2Dbtr7f4tZHSK5IJ7RuTTVYJyulnr6+i6TKZdz5t3HJN10EQjXaGoStcIdMeEm83rhWI6TXMpW++MkAO6KTAvXwj5xdG2tg9xrEjKAW5PYj3PIzjG4l8W5ZhIzv+YXvgvvunuMr/rA89QcARsAPxyo6yxLowvufzopGQQprCqqJ+6iQBI7ZeDmIj5uTV3uvowFslRN4oikd+NcqXr7CHWXuZXryu4zGgVKt5WFRt10tajHeupN2+HGIeeGL2qTlAQG4RpK8Kb27hEz73JyF/DXciYJKh8b+iVZhC5Rk1jW/KinSOL4/XJI4vTzx7Vc2V+RqfsOE3DADCSxa9/SIPFKkMSqql6qqurXVlV1o6qqpqqqbwHw6wD8LQB/GcBHq6r69qqqDgH8OwD+p77vf2wY/p8B+J6qqu4MgjS/DcD/ZfhbaWzRGMcwJn9rbrL056ZaKTBOEwDHSeZurJhDDuRrElMOIUst06qipgRQqNq2AEksLUDpusn8HOvg/MtnaM8/7yQH55Gsv/CRxOLbR1s0U0SEU1fzN5ueyJxOhWu4hs+uc22RhvK4oxFJlBopkm7a1J4iJI0kLkzrjG3bFVU1XRPhms2OGxevSSwLfoSKbKr1Z2Zyqw2uG9XfNYokpu/LRYRuym7AoXCNQRK5jPw22oIhr6QXCjcBZWdrtbBz1DitXi2jwiEJ1xK6tnblBoncs2b3AJ26aVi7ulMkZqqqwld/8AUa6QcskvhovaPmBxiWhovQMeNibRuAcnA5qfcjmB3ufNyaRCZJMkEgKWpfGGxwaNuY7HDOJXOtp6J/iqRkcN1oddNOhwgCQw/OodaV3QPM8ewevGNbYNSVt9YBXEIGcBFB8jxO6L7mdS2YYsbmfS6TqAj7JJa/XwwYYVghUV0MYg9whYMYdt9oy1C45q3D866KbtrDUEt/DsAbAP4kgN/V9/1f7fv+swC+HcAfG/72FQB+rTP2j8CI0fw0gL8L4Pv6vv8bAECMLRqz2S8i0HZpUZ4r7hIqRLES6Cm6Y+5+jFFiu15Tt+QGN0S9ZWRBmK1uWniwY4Es5ewG2c9xHOPERBxC5njaIF3GuSpuzLGAISBSBumAjyTSPcqaSJ0m891mbtrHQx3RG490dFOhDakyfTC0qG3b0bWFYgeLBuuhTyIzbhF5Til1zQlKXX62qypWy6hoi6Ndt6qpAAGQD95ifRJLIgLhWJeCRSGJdY2+j9TbFPaAOXRrq6jd0cE2YIWbvFpG8tmWNcQkxMpzBBwk8bECSQyTCSQiGAaJLVHLfh6zNYkSJJbHuMG27UlXToACjtjH8Lp2D1YjgkoqZ4hAMutPrE8ic8mklqtVBmCWhYXxuGxS0hVuktdK5vqFGgT+YNFg7SCJ7N7hBnzblmVA+CyBqirfk/I1XESQuW6pvphaMEX+X6r3ngI3ZYXraOkGM66eGZRW/nmU14omdNPtYwD9W1qTeCXh6RDMfV3m738TQLRtxdA2418b/qnGMsYoPsVq4rrCohyD0RknLdWQtMgHn1CbMIwrB7IhAqZ1CM248sIaSgKb34l+e5EsTslJOy9KqkUgqyqsPyKvWz2tJWX7JG6cugZ37jkzipw+IsIiKbvJ8fLjQkoIK4Eea+/BfLdJTSJJNxXakDxzvHCNQWU1Gz1g6KbrLR9cxtpStGMdBbdBAVxNIpBKXLBOqx0jc8hZ7NkGhkx5YnBUuIZYxwEfSen7nneSRzGNDk3djMfOZ59Ddkf5PAIOIrjTJS5cuumIis943tjaKkHuNff/eP6VNaHhPdl2nJjMXAuRRPb8h0kSVrnSojbccxMigkyNeGycNgAbx7V6h5xFOwG/lo5Gsibqpvx3k+dZlkt2TdgqzyNgkpebnWEJsArXgEm6jkgiyV5ZDInMcY4zEUFOcC7uuzJIYhjw7Ur+dT0FDmQ7YNqyRNsZlY7nH84m4nKtMxpb3sMCBwCM47g4AjaPhkFPP5J4bY1GEsMbcgaSSLVgiMg4u5+XHhcqSSqQRDfbzRxrLpVz+LteJdN3doFyTWK03xsUNaEu3ZTIEsaofWCOFzg/dMP5GVlrIEI3bfmaRDmeBKelmoimnrbNYDftztl8Ac7ZOljUqCpLN2UpcMvBSdBQW+Xz17sW621HIymA6du2aTs8XO9m9ZYDNEiiLpEDTGsZu56hv5mf+j6J02cbyNckjgJYs5BEB6UjEfHYMQUVKQmDhTXRjB+5dAJSex6ZcTZ4bjsONTCfbQN1TX3toZOE4ZFEX/K+63kmwwRJZIvAZpgVrlHQTeuYkmT5WHU1LS9hxY28Zu4kJbOuwsBNQXkPe+4V7n85BiD+D3fNlk09MgVMsFceM1E37fjgZspcKR/PpX+WWqK5JgmV9a6j69LleB5NmGyBoZ3jlCbMCs5hPA7A+UAx4EDG5u+taU2i+BpMUNp1/t5RWitjLTA4JHHazotmvS8PgfX94YOe8prE62zWwU6/Jw5tlzMd7ucDXEZs2muGu7Em2X8iAy3PxLSZe+FYUbSNUW6digBRNYnVtCaxVD+WqgllkcSdc/7ZmqzQIQS42pLwPHL8/ym1jxMFqMfaqq7r0fVlRUjAbNpjj6Zh1SuhB6EiIS1AEMusE+OqqsLxsrHCNRp1U0cRkq1dOlo2ON22WCuRxOeOVwCAT98/owJZqwDnb2wlml6Mgk5t9kHCA8z9H6xbHbGuyrjQQQDM90slIWw/wGlNYsmZd4M9tkef+7l+LVf+y4XsDjYjHwZ77vFztnL6JGqCPRfxbDsFkug0uabbzYwMm6FOipTyP09N4hwT4Zr7Z0MLDMKRd6+3RgTLHyev5ceYZ9+ex67jGCjAENwIJbDlArDQn2FqokNfhqXEAqI4bREwtrYQCOs0y8eqHZRIk3BtHHYNm4AD7L60aTts2x5LsnXGsqmw3dnnhkquOGgn295GSg5cdVP2Ppb3AxZ8YBIJUc0PJZJoOxXwiQs5VrF0JrJPsa0zQl+evU+wPAYev25+X51wYy7B9kEiIyVfT8UVSjdW7TgjYoyTFtJUZTSjkhkVrskMk6ziZBxxLPPeeQiYhyQSLRjqyANaQg5iAjTMQj7tteS/nhsXtttw55GysHWJqrdT6JAzaIMTuLGKkOHxtiOSWAgSm2kAzG1STjaSrG0TO1otLJKoppuWM4OuHa4anG512WAAuH20BAB87uEGd0+Wxfe7fVbFGAR+GqT0WSErsWktY7m/WUq4ptwCYJoAks9J1iQGEvnucctBokWyNEiiRW74OqkYu4NCKJyaS51ysYzrVMiGi1CwaCdg+yQC5YRROEdLd+RqC8O+aCyVcK7Jd3vjkVlL3IA4ZW4vNU1w3zjPALvfy/G2zvPGng93LWeSHWaMj/iwTAYzBuNPnm7qI4kadVOv3pVMuI4BkWIPmPQ7JG/Hg+FeGksOSIG1ZWNVUXdkC4yli3aqzr/fzkUVJAZ+SW6oTeZPuweU7q0Jklhgl8XmaI5NruVBWQRzvKaetsWhg8TFIfDoc+Z3EbJ5C2wfJA4XLp+1mELbpRsrRLIEkSoGYAFqQNcoVIFDMvykBAGUjky84TaXJQ9FgHK1R+4cJ3TTwiYVE6CZo9xqs0WlcSG12PxkMsJzkMQoRYZxtoYG8O44uiZRejTtzLhSkBhSQljhAhfJ0lJAj1cN3jxV0k2HrLXGsQOA42WD080O652Obnr72AaGd05Wxfc3wZoADM4182wH9ySzP9VVTLhGlzgaVTkL42IZYSCvumiFa6Y1icUg0ZHX3ynu/zAIZjL502eb7BPn9Unkn20XYW1JpAEIUBtFsHGwqMfkiLZPoh+k6AIpgEdS5pqIYL0+iGAdEgmn2tnbNErJcylpHt1Rg9LVbr0fi+San27LB/N6ziE3Pz26KblMLpuglyCZgAbMd+oUe2KsTyIrAucGiWxS5mCkmxrxMhZJXC1qX7iGZEC0nam/1iRWwiQ0MypE6Zh7JKxRFtsVkkfRtnQksufO0RyrnCiJCde0hG/urlsaKjMAExg+fm34/ZgcdPH2zAeJTPFpHQQAQDm7NeXjD59VQhKHm9UGKeZ1JiMfKukxx5sI3jBoW8A9l+NRAUAQlLZdX6R7xaD+UuF8jBJL0UaDAJilIMaofcw4l+pi5sifx0kgq8x+MuIb7vG0NYlhANCRG6m3QSloW4AVrwF0dVK7tlcp2wFGuON022Kza+mAFABuH9nA8O4xESRGkHvGua6r8J5kBSCmiQut2qIGgQ8TcPI5pWfbFWBi1TytAI0WSRwC0zG4KdfETQWA2CbdjkopkcQUk4BtMyCJLCK+bHxxC/b+r6oKL9ww9y/fk9SvSdTUKYc1qKxTPsdODszz/NqjNQCr5JozN1Gro5tOkysM4r9orOCKJgBw66to4SDxS0IkMfP9QqYSU9svZhIXEtzwwZ6Zo25P9Or7x+CSmGNtA1lWlA1wg0SDJB6QGdBVYwRvALP+MMI1S2e9KwVeroXsAja5CLjCNfJ6JmhL9UksXPNwPQA41fUYw49nhfivCQuiVPIRAj50Kx43SNzTTd8645SNEkhi4eaQ9wE8jWTM2LX+plEO9ux7AYVwSiTbXbqFR4fQddJIBzQMHHZdj2XJ2a2BLoT6C05h2H/KzLGMJMrmMK0RKTu7k3YPxLjG2UTtHOdtbKwim7aXFyDy235wWaJYToRryI3UrUHVontHM4LE5aIa60MA26eOOdbpRt8Cw0US7zJIYmRj65jkSh3ek2xz6VBxV9/f1TrJ5XGxPok5hkFVVVgFrVzYtixjkNJ2472pcZIFKWKC9JBuzdYtLRykVJN9HoPEXUcnZAD/2dbSOF+8eQCAR+0ntGQiiy/jvORif7lI4sGiMfdY22O1qLnklnO9NUiiRzeVfYMOUpxgW4MkOkm4OUgiK4zkXjfdHIcSAEWSxBVOUdUWVtV43jVq2ovG1M53Ha+SDNh96fG6BVBm5IitFjXW2prE2iacWrIHsxnn+xeqIL33n4E56qamfjJ9rHBtlXkCheAymKM5djl4jiGJnOjitN6YXrdWJ8DZPfP7Hkl864xZFMIbhMluhXRTXto6RBIVwV6AGgCk4I2ybm9UpHKeUVoUI6QgEjWJ4XeT45m55NGGzkNXufMITBW6ynRTfZ/KcZxHI2SFa+aJu7iS2HIdSohgOE+6JjGSgNCKVGjRPQ9JJOqIAIMSbHYdzrZm02Yd3iOHbqoTrpkXJGqRxDD72YNENuqwTpYQYAro3WxNYuzZBgg6vyPiYObI3ScukigOtg5JHBC3lhOu0QpnATbY82oSGSetNsHzetepaKMujU2DiABWhOkdt7mamZhK7GzhmksMEgGLJh6yVNpYCYCydOAq6I5uULojaOtmjNQkWsSZeW7c5GlPIoKARelskrA8xl2DNLXsdR3Z7xU1wO1A5eTppua+ejCIIrF7x2phkcQt2QLDVUo2CQHqUF55CZuQmZTqEAnelLppribdfKafJHQ/gxKu8XwuItiLsNk6Zg+u7HnUJCUBAMcv2N/3QeJbZ0zx6dTZNT9L0rfANEgsO03DvILsQxEBq6ZZa3ceyXF1RNxCibZJvSWDgDU1gprEMrc+JlxTrEmMUGIp5dbEdWOQxNg9QiGQc2m7o4Pgzz1ny8bPPpvPImoSnX4/Y5BY2NzC4nJaktwJbrSKYC6Vk0USRaTiwZmRu2c3bVE33ShrEm8e2J5HVE1iJNvKbGwu1QtQJHLCtYQQpQpFKuSWLs8xjiSWmkW7arsA6IDPFU4Rh4u53rFauiK1tQ4TcJwj6QrQaMWUVosa622nQjZ8REpBh4LtI/jBl25Q769rX5VTQ3f0HDtSFfU8duPQPKeHZLLJTXhoeq66SRmmzklsLt1xgkAq7kmvVYo24ddx6w8wqHArFafdZ1RTy+7eW/KTO56L0unppg+GZ4dFEg8WrnANX5M4zlFxj4QlHxrhGg0wkkIS20JAG6tJpJDESMKVSXgYRNB/jVFYNucR3jHpdevGS/b31T5IfMuMWZTDAIDJbk1USsmgIczYaZDEWJ++IpI4cWS4MUCs3pJDsrTOrtukeBxX6pMYIBsAp+4YCnDYIP0Sz7/yfABx4RpKytwJ9liKnrxnrEkchGtKdNMwucJKkrsUXEZG27V33DGIRlXxtA7ZtEXwhlUqPVo16HrTS02DJFZVhVeeOwQAvH34mbNY9pMvtg8QQbom0f6fCe7lVE97ZBHHSiKJ6e+3bKrRYTLv7yj6m0s3lfHMtZNxtnavKye3al+ki0FkAQx1LmaOrWJtBcy9vN61KqfVVU3UoA0AxnYz73+Rr5mZqEIq1x9AgsvLdV9OVvogse8H+qEmSKmsA6qpZQxLB2hRksbfO5hgwwrqOcE9yXhpnQCY75NoEBiNY+2WmGiQ3KaaBjbM8VyUTnP+Zb15qExKejWJZJJEWreIercGbXYTCRRqHPhOmqAtJgpTAm7CmkQNkqjv1e2XzgB8yYfb7sedQ9FOXrS/75HEt86Y4tOplH/55p+rUhpm7OhWCpGstTuP3Dw9wRsCNZiTMXLn6QZ8W0rdtE4WKac2qphjbeguhfklvltpH519/oNxfMNbPdoJSON4IwggWWhaOGI4nu2TqLtubLY7RjdlHVcJvlhkG7BO4P1TXesMkcW/93iraoEBAH/79309/ubv+UV4+3Nlml54T8rvDEoX3pNUTWIdUzfNjwlFKmSqFN20m75uhBlyTkLtCdewWfIokqigbWmRRNcZYdsEVVWFZV1jMzynAFejBgxow66DRu5+6SoeK2sS/61vehUAjyQC/vPNqFsD5l721Wzz98dF2M0BSWTaXwCOKm3XqYKUurLrnKYGe+kkXLuep3IaCpy9jzXtVdzgkkZJHcaRVoG1LezzrtkSk56iOtpxFknU9Bx2Ubqu1yRyzP30cEAS2b3DpZvuum5sBZQzu951qjresJZU14LE/J8BD8KWOGIl9DJWk8goXIe+q/yuLd2Q41FI4jBOWzrjIYlvYZC4KL/l6TZmMw0V+JiFK6VSygZgtpEsiseScX6fPvOzdDu6jZRlHEstCx1ClkrlFs33ffn8pxqn1hnkIC5cw6mNApEAjLhHoue/FFxWU8EbtkZkjmMhmcW2s83EmUyyew3m1CRqKMkuBVerbvqOO/rFVOTtpXG2BkkEgNNtSweW9pgNPvjSTeq9qewnR5EJkiRs9n/OOMexoIVrqiltCCg7octF5fVJZGmLdW2C2V3bjyIQGrqpHJNrgVGr1x8xaQGgCTYAU4e73pnEJx8kOsI1ZNAg9i9/8TvwL3/xO+j3A34PPDaYXTZTxsVlCtcAwMmBIInKHpAOTVIbSGkcSYP2uG0iqGn6VEK23mySJOnGvaR4LGefoinQg+LuWFtIJjIB85xp+4uGSUnmEXADHJbKD9gk5KyaxNaiUlq66U6BJIbnhE0kA5icS0rgMUQFC/dlSD93j8scz91yWCQx1nJDM24UrmEf1JM93fRaGNNvLEabAwoZi0CllKUf2sbZ8MYVna0aAWowzKMU8AVoA9VLMAjAYs2w0/P05bcBot9eM4X6S3S7MJAFuHq/ScaUrImoK/888PTiaUsQDpGdioRwfRLtxmbpGcxmX0/UTZnrNgp9KALZ86ibvu2WQRK/5N23qfcDLpJoMrus4I0rksM2RJ5jIUoHWAZEzsJ7i3VkQnSbFVxx6wvnqiuLlYLgpSPABPAqjYB1QNc7Xqho6SRXZH5lwa2QyaCtyepUKpmApZtqhF3kWIBe3XSOuXtASyKJrkgLYNYgZt06j0mQyK4HI7VPiYDFkmJswm+OcI3bX5GlLcYa1bMIsGVF8WjncqDS2kCjPEY+Wq1u2viJa0CfcNUEwHNrEl26qV64ph8UQ3kkcU6bGnk/wPm8oS8ptmvz93PI0nCPW6KphsfjRcj815hnJ2RNyGdRtkcSr4e1Xbl2aVLbQ2R3QySxV7RSAOwNRdNNg+w/G5SGwjUM2jNyz4OHlM9+6gKAGJJoNsX8cYCpcE2pJjFVb8nRCqbnv7S2hgikhtoxaVpL0U1tbZWGI+8Wim9aLriPZWjZzWa90wUbYh9+5RZ++9d/AL/pK99LvR+wSIG2JtGtVdLUJM6xsJaX2aCi6ppEVVyIbrNN4EORCnktO8faqvSOxxsZBrmaxDqgH/JO2tGAts0RrrHITZnuKNluQ/OthtpOaorm+w3nAeDvf6GkLeqaDkhXbp9EBSVwrrkOHnvdXLVFwNz/l/3M3TzQ1SSGSpIAj4CFlDQWXZ0jXBMGAFxNrh8AlISl7LHgJY7Ye9KooLfq5CLgq5vSdZOOkid7PMsu6FTqprNrEj26qa4FRqusm1zU9YjusfXNoe/EBNzC7IgxxUqIYNQnrPL+q2WK+XtHuZZ9KrDGIKyuumlJkX9iL36+M/HLS0KXbB8kdh1V77fZ+TcVkIeNJyqlLJI4UiYCZ0sRuNV1NdYfaSXoVeqafejIc+Nc+W2AC9LDrNGukP2Jcc97Yo4TKX+SNldXRrRgdAhJBDJEG9jNfm6fRDfbx55/wBdJ2JK1XNKkHtCJG7nqppoWAID5fn/gWz9EvVdMGmXfP9uiqriWIIBfq3TZDmtYy8ts+OEYQ3fkjhU+N9S4aromlDfRqYPArK+Lxhcu0NAPTeuSdlzTGWVaSYi46oKMgwCY895UfE2iOZ5p8SHfkfUrDoZeagcLDZLoIimKTPdMc+uJNMI17vXedj2OlXXAWhMk8Yikm7q0cE2w4bJQNPT6OWgPIOdfV4MaokS7lqSbOmuCSkypNgGwZv1356hTN3UbnpvXqPr+gJXDq5v6NYnsfuMFiW1PnX/pQS1KsZo+ifORRAmKhteLTL1EH/IikjgVuymKuQV1k2aeXOnG5HjEeVk0NuGtFq5Zcm2FLtv2QSJ5g3goEbGQhyqlMpqt9wvRNqYmDhiydah4Jb0J2qAZZ8e4c8hZqGwHzEMSS7QoW5/gXzcmaDZzs8cBOOEgM87UCsylm9K9BKt5dSxjv7fW1iSWFLqARE1iQbjGQxLJYBtAXN30Eh3XA0e4ZtXUdN3YrSPb71DTAmOOuQg8oFi33OemByqy31hInab7KzoIkcyhNCZZW5IZK0ibO4ZGEldD6xKFuqlcX3HSmKDUVbhuBsSUDxKN47RpWzR1RTmEZp7muxnnnxuzbOox8WPmSg2bba5TSCOJTe3XoLbd6ABflr148wAAcLaNKCtFzGVp6IRrqklSkkISnSScBslyNRa0AYB73ShV1NqnoNOU2CEJpGGSuDoEKpVYd46KfUpKDDa7TkWlleTiyFxRIInrYc3aksJNXuA8M5Gg8UnMsTAeE9ArvDPHTCKJhVMpf3fHsjWJIeOFFo8LgCJVEu7X/nng5/8R//5LsH2QSELN2prEpEop8cC476cz8g7UvwCftQ4bZ/PjpnPUohSy6VPqphO0IV/LEssYMc6ufKS2vUd4/nV0U9fZVbQpGLPP/hxyZiWxrSPDqKS5SqWamsTRGVHSeEKa6mWWH43CNadbFSLotq+4iiDRpchQWcyAAdH2PXmtpzRVLbuAdZJjCaAtgXAL0iamcYAOnf6WAEcvluu73vFIYkwFmvUPFkOLj/W2o5u5yzzvnW5Uwd6yqcaAW6tuOsdCWvKKoHMuG//+Z4U7zmNf9I7nAAD/7NMPqPeP9d5K4Rp/vRteY4KbpnJasuj6JLpMJU2jdHm+GeEmGefuU+w6vmhqTyVWrW6qOf+NPnEN2DXh8WZHzxEw+82qqfGZ+2sAfHnDQSPKxZzgH+Ao7g7tdOYkEvhepiGSWKZ/AvF2FqVjxmoSS+wyM84vA5P5zkYSFSCARihwtA/9MvPvLbS9cA2xSE6y+MTCZR0En4/MIll20ULxWO7xOgfdm6NkyDY8d8ex9ZaAT0G0C7Ku356MzbYgGT5y0iexMMVQJERDNzXHk2P5r6csjiTmjwVIhtb8rqHWuAp8+ppE835dTaLtvwYoMusz6i3n2ihcc7ajREzEXrhxMP5++TWJ/qZIbYjNtCeplu4L8DWJvkgFmwCa9kks9UAFBGkLgkTyHjla1jhzgkRGmXYVIIk7QjjFlZ8HeEQWEJSoM9RRsiZO5imOpKZPogQbQpe/TJMAGNAhWe4ezKprnse+8J0mSHRrX3PmJ+DMa7xwjfnd1jKWjzeXbhrqAnDr/8CMEnXfjhMOcv0ETQJiOcxxjrqpvk9iBO0hjif7xummHY5fHALA+Bi3j5f4zIMhSFQgiQBwtjXHY4RrfCSRE4kCpiwglv5s3m/+T9eyBwkg5piNUzMpxqmNmp9z6vtDEW66v2LICrzk9fWi7ZlHEpk+QZPaHmLhslQj838ZzkDvZly4aJXGmZ9uTRBzLxq6l/2/blwIozPjnLoGTU1isFGXMplh5hPgahJlrLq2KnL+AUI4KCIuom1SrAnAvMyiIrPlKsyOfRJLSGIdq/UoHsrLrGsywnNNNvuH6x2ecyikJXPn9J7n+WbicyxWg6elafO0oSC50oHioLsiFWwCIkTSATfjmr6/Fk2NR4NzBgzng60lXZmaxLUKSTT3yHrHBzcW2TD/1yCJ0uJjvWtVKLXUJKqofUHi7jITMoCv0sgiWcsBWRLbdf2l001vHi7xv/32L8TH3nWber/Mx1WOZoI9l5WjE65x6aa887loqpFCy7eOwfh+wLCAGLqju25pauIWQ+9OTQLUltzogr1FZL9n5ikMFFmH2OcNAO4cr/BPB4SaVjdd+K2amHUhVDPXiBu5e/ActLnt+PMf65OYRRKbCJJIKH6HmhNmnn0xURgteSIo142b8NYK11wTe+aDROZCh4W1zMI17XfIISKTZu5kABBSm/qeo3/W1bR1A+vIhzc/tyDUOG1bb67l8x9BEkuc9YhwjQYR0TYFn55/7ro1dUg35TL5EqT3TtaUo5vaTUOcLlo4QhyEndBN+eumUqmL0BYvE91w6XxzaaO/QNFyY44t6tBJ7nCwzC/fTbD5alTqwueNzsgr14QoktiVN1MRthArtcRx7WjZ4N7jrUrd1CKJZu1inGTLCrFCDpqaxG3b4WzbKYPEButtRwdfgAlItcjeeewgUGmcI1xjsv+XT4T6Nb/w3fR7XT0BFd2xmq6TLHLj0U3J07Fq6rHdj3HGGXVTn6Znau+5cTuHTaISbup0iKCc6q7rVUhuU9foe/04SRxp6aYA8NyxTUbeOODccElmSS0jo7or101QWZ7uW2EtiYRCOwqxkG6qEkGM+HclEGDKLlOUZblIYtfjqOTfxeitDN3UCWbVwjXXxJ55uilzoUNxBWbhSqmUagRQACcgJWmqEnD0LNQffDe2JtGnaJjX2Fo6l+vuzj05JpI1KjlBdXD+ZZ50vZ8SJQ3Pvz0n5XHud2P7vS2d+0QjXCObxrbtRroGU6fmSmJv2w5VxSzItYMk8omEpvLFDsxnXT6SCOhpo//Sh1/Gc0dL3DrkEcg5tpyJJLqBFFN/DQzodkCB5lgCrgCHnUPxWJGMMFCmm7o0wJacI+DUJM4Rrmm78WdpXJhZN04yOceFoJ0t3YIBMNTZTdtRDBkxobYCukB2rh0smrFHJdPvE7BJKkm+mT5x18vZirE0WKXqOX0Sl41P5eR7ENpnx/g/5TFhGcy25a7bsqlG7QEN3VT2YG1tJ2BFWsxr5WO5iVOWuQVYJPGxIImK5+aOEyTeOVlRY1YLv5/vERMkOm1ZdOff37upGtmAbsomJVPqpqU+idsJRbXc8zzGMKNEyAI2IUDSW6/Yl7kM2yOJxIWO0baA/MV2s4qArt8eEEES2eByzOTr679U45yHRjZu5tZ369QsYqCH+ku9bWJIorQFKVlUyl+5+GgEb7wianIhXy7EIenVjgUw1CQqEUh5/6btsSRUQN3rxp5HQNBt8/uVqJueA0n8U7/xSxHsHZdii6AGj+mTNUkA9Wxm3Re8UfVJHJNiXOPgEEk3Y8tI4oR+S9Roih0tG5wp6aYSEEp23dBA807aJOGnQOmOVw0++eYWN3Y6JHHV1FgP9ZY3D7ntfdnU6HqMTvllq5uuFvWIvmjUTQFBsCpaXfMqLR5sKJFExTrpOteaRuluK4WWRBJDlGjX9WOQlJ1j4yKJCkpsXc8KtgGzXs1SRe10qqjy/D8aWllonP87xyYwXDYVTlZcEkjWIEESj4hxrgYBW1so49x163DJn3+3BQbdJzSyB5T6JAr6K8dgawTl871jlVpn1PGSJyp2CIRrnrQgcY8kEhc6vImZhatxFiyAV2kcszHOOIqiF3Ct2fqX8Lt1fc/VH7nCNcEcsvN0aEMs/C5Zrb4PncIykuh/N7ZucipJztJNw6xREUmc1CTqags3Xt0Gn21162bYcfL+bdtRjrWMcSmxtHDKBIEsDptti6Yeg2ctklhVlaoWZa4t6sprAcBs+NJGYRzTlyXCgXjiSCtmxQR68vcYjQfI35erph5RPRlDS9CvrLrpasG1PFnUFarKQRKJ4C3GCmGdtOODBU63LdbbTiWmdLA0NYlnWx6BlOBGnPLLRhJXC3vtOiLZ4c7RUrc44ZSrNI+loQhu/D6VfHDp9orToESroW4VMDW2zJoXokQsvdtdt1hGgsxRmtQD/Ppj5qgLEl2fSxOku6rYACeAJXZ7CBJvH6/oUoqxJlGCRA3ddEwA8UiuK4qkOo9a4ZpgD+j7vhhgiv8TsrCYGkEzRx2S6IpLjeMooRynJlfhA10nu16r7FtgLGQcKukB+Zs4pGewTnIY3LQdn/0HfCSLuRWbwCEEGaSYAMD8rhGucTNUrHCNpe7a10p9wMIgHRiQROKsuI6rRQTzY6bnn7/eXW/fz1LSVoFjxxwLcBbXtrMCNKSTsHWEayjRAucZUKnUVb5Eu7x2mSZKpZetUjrXlk09rcEjauLaYBOdo27K1pa47AIZX+zvGqHxMAyDEElkxRUA41ydbg2V84CEzaqqGkVhAAwN6wtBYqS+nEYSlw0eb3Zmjgrn82DRYNf1eLzhg8SVQ5PUCN7MtYNFbeudSCRrWftO4a7jhFOu0mQ+Pt2RRARbfbA39hLsepVy7oETpG9IYaQQJTJBOrffjN9Ncf9L3aqmvZO7B2sToIBJPGuC9ANHFdvMmU/mvHzL7DchgpYzqZ1/4/HG/F9JN2XblgAB40sJVLhMMT4B7TJX7BxyY+QYYmzpmDmGO64rip4tmgTaWfJdI+1VnjThmuvpEV2hURB1M1UABTgkUavS6NIDgMFBo7L/Mjc44xiH0KrvyTw5h9B+JzmmlpLGNnMPBSCAcvbHDVAALjsl5tWIkNctPP/sOZF7aKRXsnTTwLFj5gj450UcBbYpr9A7ti0nP9+4TtM4x+KwaE3oZVM0Xrpleh5qNvqrtFDNjRGccJEGgL+3JuqmPdkD1UMSOVGkEEkHrHpuqSYxpN+ywc3hssHZtqNRFDFXlXO9LY8N0S9NAHC0avB406qFawTdeOPxhu6v6Pb3uxJ1UydIYQV2bPmGFdO47BYYWosJ11CIoFtbSCaFzbga27ZXMUkAvyZx03L3V7ifsn0q3ZpEjbrpwcJQoKV2VaVu2unPP2D8i67nz+NBQP9k6Ldin/fyTQDA64829BhR3v7Um2f08cZaalE8Js+/K9TCCMIAcZ+XBQ7C9jbu56XGuO+V4zH7jTtH+X1O7TxDU3UTQHI+r4J5dJF2vVbZt8CYbIBxZHyHBMgHN5MsslaAxkFSNLx6VzhFG7TJOOYWDushAM6RjCleloRTFvX0wS45hbHzAZCo7Ay1uRTdtIxAYjxO3/MZ4TFI3OkU2RZOcMm2sgB8J2FNOq7LgOoC6Otd7b11uQvr24bM7jFZH3LVtqx9oRa2JnEidjNHzIp0Ltx2OrRwTYCkyzyBfPJi6QRsAE9bBGwtz/3TrSpIPFhawRVNTaJLXafppisrXKPpk3gyKCU+ONvRSKKfcLp8J8YNttngfjkyJ8y53HbdpbfA0JovXGNeYwU/vECKVaAcEBgNagbY89/3PZ0oCe/lLdmncuEEpJp7a6z3U4jCWN9JV8vu1iRqBLAOFjWqygaJmgTjqy/foN8rJhTVT903QSJTk+i27tEgub6fVhaEAVwk1/xfQzeNtphTgDAAXzoGBH0SiX1xEfjJcuxSnsSjkvd7JPGJNMZxiilQAgUksfFvYra2bUJTJZWl5mZxwgwJq25aO2gDK9Ji5lnPqEmcPtilxrD2fJj/d2okS8aZn1pVWhlXrGV0kgIaRFaEazZtp2rA7ArXbMZWFooWAG2HM1JxMUrj0QbpCvTlPCab6YdfuXXpx5pjc/okhjWJHemQzxWzajx2AXe9QyQd4GoSlwGyyvTIEpNanjdPt3pRmF2H3RBMsXRTTyWQpZuuDG304XqnmqMrp88iG7ImCJX2spFEqZsEeCTRb1RvkmlX0QJDY15POkUt9aKufXEjhbiLtt0GYIVrdsN5pOrLg3uZvW7LwElmGcJy755ueFEYeYtL9+XOvwQ3vapNh1DQx5pExXP64lDewPbgBKZIIlOTaAW3WpUCrpso1NBGzft1QkVhXTrDOgqRbYBEEoNkh5lveZzbcswfR7B5xN9VJnOuiz3z6qaslHx4UwEcHG7rUVAc4/7drWNR9ajxKKDzsjiz20RQAdg0cGb6JAIYWzDI2Ny5HDeMoLaN60Fov5OtLcyPSdckFsY5Wcy64gNZryZR4SRIMLRxkMQlsbnJhnS6aWkkMZTfZufoF81fvtMKAJ99sAYAfOhtNy/9WHMsbB6/KyRJgCkiqEk4hWJWWropmwBaOMm0cO3L1yQGLTA6Xt1U0OLXH22USKIJbiTAKdUKRtVNyXv5aGW25jceb1UIxfHKDRJ1SKJ8r8v2YVZNE6hr8vvbru3H637t1E0d4RomkSzWNLbeuyX3e0B6CepEcgATOOy6Hmdbs54wNa9h0ntHqgl79ZaKAMz2IBzopsS4qjLiUl1vnXlNgl0Cbo0Tf7BoHCSRX0uqqsLf+998I24d8a2Tbg9tMz6pCBJlTutdp1LA9ZXJdaUsI5uELW8I96nRv85pTtTeewGeXSNzc4/HCt50PcZEh1m7ssMCdV8+UX6d7Hql4t4Co+imiUxH7mLXYeaNRLJCmupcdVOAbGQaIomkQ+j2UtNQCd3+Owz3HACaiJJVKZNZVZUJgINAlqvJuji6KYsct72ujmJuTy7ZNM627UhxYjLJ4rSeDq0DVEhi11MUErHVwqLNGvrVeewP/tIP4Svf/zw+/v7nL/9gMyxsHs8mt/w6Xr4m191EWQq0L1zDJUnqYL0DuABzOVD0eicJxAYNd4e+ZD/1uUeq/pZC02NbZ0wTfrxKrwSyjIqqaycH9rnk1U0FtWm9/1+WhS0YWEQK8FWZnxbhmmWQcNUoUHprKx1cmuv7cGjdoCk3kHnS4mVuTaIiAD4IexCy52TYu1vFXrrwrpvOiT9c1jZIVNDCAeCV20ce8l8+VoPVosanB7rpIUU3tTWJc/sksiyNULiG3bsXDrvMjBd/JjdmiiQyCZapn8wL0LhzA8weV0qUuPuUzHVPN33CjJWxjXGmGSRxWqOmQxLZRWuCJJLj3HYDgGlnQQWXXgBmXmOl5OVcyMLAqptOlKyI67YdF6zhNVrd0f9u9HVz1GXNuMKxIsX2zBxjwjXMhiiO43rXOXTT8rgRSdy2ONtyinieuikZNMi4sY5Fkf08j33RO2/jL3znxz0k5jpZSDfdEkp1YU0iq1LqNgAGeOp6KFzT1BWRJDE/w8wukEeKQgl0DUohQeKjTTv+zpgoLkpdYskpDNcEjZPm1saywR7g003Z4FJYCRI0aHuFak3UNbuup5QFAUfKv+2cfeN6uS/zhWtqj5I2W7iGXCbl+kp/vxWBVIdJb7ZP5bJ2kJSeRztljg/OZI7ctZa9W6P47X43TZsOwDybc5DEuXb7aDleg0Piui2aGk1dYb3rsN3xisAekqigjQJOiQ+5JqeRxPRYt5TFHcf6kmFNYmktiSUzmaDU7e+qUc69Tna9Vtm3wPiM/BRJZG7iSf+jwkNTVRXqyqebapS9tDWJYQuMOY2zWWqljAvVnlhFqlDdlLlusohYuikxx2qKQGoREXVw2ek2trFP4s7JWiuQxPW2HbPBTHAvTquR5efQDZcSosmsLxrbF1PTW+5ptkVTjwkPYJCgLywM7nkElPSfYE3gaNqBSqMq++xu2oS63djKxX43NkPrBoa6INEI10j7BnWfREUg61LJdEiinm4q1L4HZ8bZvew2MG598xwkUZ6D64ckDok7JQXURfw1bVJEuIdRA3ZtFQRgmoSf7Itsn0o3ucX2aTVzkvYSwz1Jotuyd+sUv81nd0NwqaOb2vraKwkSB8ppU1f0/W/m2NJaAvL5Lk2YeUbDNilsUsCIu/gqpe7npcYAvk+4I9bXKCJI+pKAn8xkSj7COuUnDUUE9kEi9QDUtZX/N2PK/f0k2Jv0eyMXLZfKqeHVyzPT9fraQjuuOMwTvBmRRLIHYUjlLAmnxJSs2KxRGKRrOfJs3eT0/HNBae0sPhra0GphF0lbpE8EiQON52xAEhnRGsAqqQmSSPVoqv0Fkp3j0hmnoSg9zbZqfErOlsjkh/1F2SClriqvLU5Prgluwkm/bk3pprnnWxwkaaXAKNuJzQ0ShSYpx2TVTV3qNI8kOoigQlr/ZEZNoji39xVBw3nMrZNikbOmtkmB8f64Zi0w3PZVmhpsL5BSBCny/SVpwa6TEnBpUDqZ09ZJ8LJ9El1WCF2TuJQ56tpLiOicRt00RIB1dNN5iP9cu31k1qujZUMrfksgy2oJAGE/a6XgjZOUpPaNBJKo7ZPYUXuiMLB0wd7op7m9eYlEqOsDac7jdbLrtcq+BcY4TmEWQaPKGdYkchRQvyaRC/bgHacHWVtYV56yYK8ILjvnWIACSXS47vJazsJ+YwDLI7dUF82m7ao7suje5Pxr1R07qGhDc/skjpLY225AEskg0RWuoZFEm1nUCAmIkI6I8jxpamCXYYvar0nctV2xdYxlM+hQCldcCuBrEl25bzZoiwkJcOqmln4I6Jxrl5KppZuKswWUnWsXoRjnSAvXWIfzWNUCw3VauWd7bAp+ejVIoqwdjzc79D1XyyV7wLazglvXLSvvthfSiFS47aQ0zInxPG4HBVBy3KQmkbjeouS5Vvap9BK1irVc9qk3T6VuknsGJDGvEdNzy1k6hQIoAK+m+SqQxJefM/18NQHpwaLB2XYGkuhdN+5Y3jhyTZ4w9YhnJ0UbLaqNNtYncY9XVK8f/hwiieXWGXaf0rRpuk62DxKJGzlUUmKdcrduT+4tGklUPmhjbZtTE8e1GwiyMbPqjwQ1m4nSEecRCNAGgkfuK3Sdd446zjpPNzU/XeEaSuzAo5vKsYrDRprKetdi0/a0Q2jppnokcdu6c+Q2DXfcnm4qdFN7T3Z9GYF3kQ3gfHRT5t5y5b5ZhzD2bDMMg1hNIuuAumuAFklcuzWJRbopJnNkHdCXbh6Mv7/jzjE9R0/dlFRFtUiivt/bHJtDd1y6SCLJ7rhqc4ONEclineRWl8gBLNr2aK0Td5Hz/1CJHK8W9ZggYdAXwK+31KmbDvfkKArD1yR2vbLlkpNM0yRyAOCOs35ohWvm2Cu3D72fjB0sazxat+h7PrgMfSC2/jcs1bm8mkS/3EDGlZaEsJWLjCv6oI0fA5jfUayndvu7auqNr5Ptg0QqSDQ/3aJtgAhuqspzEADOka+dwK3tdbU9fuNm4lgTuil3I9e1pVaywZ68Z0RkSQroXCUrz2lV0k/Ca11aI0dnd6L4mh/nCdcogu2ocA29ATc4G5BEttbj0BGu0SKJu1bXt8pFidia3Kfdlo11JNkWANO6aF7IYSpcwzmEWyWyF9u0uZpE8zcRX9q0XFNwsbcPGXlNkHi0bEYkHWCCxAFJdDPy5DP6yu2j8fd33+WDRPecsQ7h4YgkXg3ddBUEABq6o3HkBUm8XgtDtE8ik7hrXMYRX1t4uLB14gCPJI5BugJJBKQmtxtq/rggfdlU2LSGSdKRiWvAouAPznSiMKG6qSpRNcxRw1y5e3y1SOI7h3VBo8p8sKjV4jqun6YJ7he17THNJnhdJB3gWF8LZz0YxxFIYl2bMjDrF3LXPOw6YH4nkMRAuOZJpJteTym/KzRO3dTPIrA1YF42Rql25iKJLELkzZGkTYTCNW3H0lsrzyF055AfV4/1nSxKF+uJw2V/pnRfJuBwqbT0HBNIIt0CQ7mx2QyV05OLdS6WppCdlTEHLJJonOSWypoKbXTXOZRYVQCsrxF5Ws2VCZd7unTtlkH2syVpQ1MkkU1cVF7NEquu7M7R/T33fK8CJFGT8ACAv/o7vgZ/7u//NL78fXfpMUcrQ9vajH0SCzWJQQCsQTvd973zzlHmnWmj6aYTJPGy6aaDUI5CTXUUrmn7sZ7o2gnXBH0Sq4p8bhwnmd3vARvcj70ELxlJFHVfKxzEXDfHSVbQFq1wjV7dVARoAB1zZdf243VjzUUSr4JKePvYHI99tgFzLsdnm0YSfT+NvW4GdDD3R69hrrhJScKfSQvQlOcogm6A9Qtphf0+PB43Tkpn9nTTJ9CY2pmwBQOLnIXBHsA5yXWAQKpUAnt7vFmNsxXHC6mcmp5Eu64fkZG5SGJpXLj5yrxL5lFpycBNnAFL91UG90MWU45fMq9PoiIAAyySqBGuERqboZt2OCQ27VUQ7AG6e0S+2z5ItI2zAVuHV06u+NlWmiXg3P9SS8pcgWXjP2/MhtgEz42ZL+8kbEd0tafvZQB48eYBfvcv/jxVy5PjVYPHQ5IEmNEnsZ8nf36i6KUGAM8Pjit7rMMrrkmcI5wyqtl217cFhotStArUWPbgXqmu6dZ2yvEZk/P/cK2jF4tKJtu6CgjQVQ3ddBmgzQp1UwlIAZKFFSRqVUiiEySyQjLnsVdfvgEA+NaPvp0es1rUlrbLIokBKl5C6MZxtS9cw/pAoUopkPdnQpaMHI9S3HUCWQtwlBFIAJOWGxo9DU25wXWyZx5JZBynOnC2WJqkG+yNAQBJyZzD6wYsrZLpIwj4DbABXd2SRduG10gH1Izhm4u6AihiTE2EK+OsoWT6VFoukI2pm1JtA6J00+IwW5PY6vvvHHhIog5t0DQO9rJoiiDdlbvX1Og8zeYqIIq65rKw4bsZ8r7vdaJUY5BoXqNpQzPqH4EUkliuSRyDREXCY64drRY43bY43UqfRF2QyNTMuPbXf+fX4pNvnqrn+Z/8pi/Dv/NXfhQffOkG9f7RIb+imkQJSt98vKGP597Lkiy5bjWJgNOqRpEQWAYOOU/JNOdNahK1dFONcI28bzMo0gIk48VFVxWiMG4LjEVd0Uq2c9RN/X6+/HkEgDvHPF39IuxDb7uFH/qeb8YLNw7Kbx7sYFGPiKymJhGQ+lotkqhLijV1NQm+5LNStkiwy9jjbQNWTtmXHI7Rh0FpCeCwpTNsK5HrZs98kMg0hV0EAQBLr3SDvVYRAITKUlyQOMzNRRLJTH7YAkONtik2DZdLPo4jz39YpMw0Mg1rQlnH1VJp/Tmkxwzz8oSDiofykETNHEeUbqdXAJXaEo1wTV1XOFo2uDc6dgTVyOmH1isyu97CqqwReVpN6jb63rYAWBbvSX+jd18rjXNb8ADcvezSTWkGhKytanVTSUDYwHm5uNz75GgMbrisfIjkajPJX/D2W/iCt99Sz/MXvPsO/tp3fw39fqltk5rEy0YSRYH19Uc8uuEzUIRuer2QRABeb14eSbQiHJqkmFAOx5pE8nRMkFxFonC968bEK3P+Fw5NuCP3RDkWAJxtu7HUgbG69tVNWX8LGNg8Srqppqb5okwTIALzaxIBvZiPJxZIIscu+giAKk2JIYmsmNLSYfjJs1ouHZOgVKeK6iaA2BKM62bPfJDI3MhhM3fW4QqDPWaMvMeFw2cJ15D85xjdlFnI/cbZuu9mjmMRES1tS35neOQTtVEllZZFEmPnX4MkqmsSFy5Kp8t+HixqnG0NbUhTx3W8avD6oyFIJDKSY91Y2490RQ2VdjPU9uxjxGCzIfvEuQqgmnurquzzonlu3BYY7Lplqfz2NUunzQWJAZKorEmcY+KsyjNQoqraPpV2D7iO6nbLpkJVAQ/WV1OTKPTZN4aEE0U3dRAptkzhrTDpC1jXFT0/+2zrEn4Hi1BwiAumJuqydO1qY+imgr4QSO7CWcvbjqeEu/eg5n4UjQVNnf6ISrU6ui8AfOQVk8T52Dufo8dctR0smtGf0SKJUn/N0k0npVLnUTfN3F9237AbB9O3UI5nWYFcO51UyROPJD65rKhnPkhkgqkYbQjgaoJCARSW/iCgWauA7MM5sgGRc9/zNDG3l6BCFGbhbIjbHZcRjvVJZOi0LiKoQUTc68ZSayb1R4oF0ryf760ITNVNNeU5RrjGBGCaRt03Dhf43MM1AF32f9t24/fkqLRu9vnJXFgv2hZOwG2FI9h7shtZECxLwKW703OsHXVTsh6lDhJwAJwgOP0B4hBvdh3YliDnNeld+NoYJBaEawIGhNYBvSqTHngjQqpYE+aYnLc3FHRTd02QXn1XoSapNUHbDhY1ndwKVaC1CqBvKmtJpU/oa4/MWk4jicsaj9Y7mqIHWLaDiOuwc6yqaqwB1iDbkuBV9UUePl5L9wWMkMyPfe+3juvedTT3eeZFikJRJO5YbqmCKbkpj0n1SaSQxNb1Cctqo+PxQrqpks0mqqjFHutOf9fdE0o3vX6r7BVb2zK0RT8AYAprgTiSSAVuDpLYkXUsoXANn8Wx30vqlrS9beb0JGq7Hpu2RUNkXOeqmy6bCNpJOsnuYuDOO2XT889mtTCOm9NLcCPZTxWSKHRTXR3XneMVPvXmGQAuI+kFsprMriNSoXGanmYb6zudZuJ0n0TPaSofy6WbatrbLJ26ybblRATCWl4AlHqiODtSW1t6/0WYBDevPdygqni6qYskXlfhgsNlY5UkL/k8SpAyshIodVO7lpwNjqumofhV2eHSKOB2Cpr8wkH8NUmxsbZTSSUUiuTP3zNrOat4uWp8uiklEjJ8t0dr/b11+8i0edDUyM7pk+jWt7GKnK4dLhvcVLSkuGpz7wv2mZExUn/NrlsuwMH3yq2jNYl6ddNy6ZKMlXHj3lHquR0cj1dFdZDEa7z+52wfJBJI4qRROllLF2ZV3M/KmUuTpPuNDe/pe9242qs/8j+rNE7ezyKrgEvdNVLmzKYRg/p3BFLa1H5zb5l3yVzOulZcxxccKh7Kp5t2vCNfVRVWA7VJW+t0sKixHqT8dUHiEj8/BIk3Dni66bad195js9u3wBBbOkgiqy4YIhQA3yex781aorlupgbYQRKVSRIx5vtJdvxs21khn0sWMhmDxEdrHC0bur2Nln71VphH77vk4EtouhIkMkiRTQp0OBvUZY+uYZAoSKKGNroc7xNd/ddcwaHjVYPDZY3XH22wbCqckDV/BwMDRSiIJeEswD6Tgkhp0F9p96Clm86pwQasLsDTtt+4tHi6Lc5Y72quG4uAeQAHmShxyxQAuxfkrkOc/skiiTW24t8RrBXAqRsOQYcSAjkyIJ5c4ZpnPkhkgo2wRwodOFSW+6xVAHUzFqxj5x6HDi6rqbgOcx8vPF63BGDlcR6SuOP69MXUTRmJfSP2IYiseY2ici78puAA1xMTCJBcxQblFtuzm9SyqbDddWpK5uHSIIlbZQNyV8ntpZuHxfe7dNOxtk1BpR2dpidwYb1oc88li5y5NYka4SD3GdVk5Je1UY3re6m/KA6ZJOAAUDVn4hCvdy22ZHP785pk4V97uKHENKLqptf0XnYRhstGEleLGqumxj1SAAiw81vvTAse97XrZCOSqAg23GRO13H7KODWJOpowlVV4fkTI35y53hFt244WDTY7Lrx/DNBuiSOHw3iOpqk5O2hUb1mjxIV6DHhrWDltF1Hl/c8Sfa8I67DtzsZ6KYDAszeyyHAwapp+7oYw2dlfMMYu4xV9HdbYIw1iSwrJ+wNXvh+nnLxE5qAeOaDRCbYmNaWmBulKHhTV2PQ1ikCKROkWAroHHVTjQT9RMmQrWV02j3IZ5XMhe03bYeVRv7cocWaBaFMEZj2OyweDsumGtEJlm4XOrua2k4Zpw4SF/UoCKBBKI5XDR6udzSSK3bbCRJfvFlWWIvRTdkEBCD9xp6+TXuOuVLy8hyUHC43uaJBEucq7spGK+1tGLGDkJIJANuuH8RUckHigCxtO6e5+mXTTaWWazPWJ+Zs6VCNAF45+q0wOZ9VdTVN6o8PmrEmjkEuXbXLs63QTa+f+zIiiYqEQCgwpVU31dJNAUs51ahzGrppOyK5zPmX/f7xWleTCNikpOZ7HQx74qhuqkhcS6uga9hZ5Vz2grNX00ji2INTahJJJDHoscucSxdwAGzgpkUS6d68DsNs3DtYEGDiT5aBCjPPAUl8Am+u67fKXqGNwQZJG7IZEvM6E1xa6J13tlZzpOQDdU1WScmjlmnq9mo/Q86PsxviZtdhpUASXWcL4BSptiHdlEJELJK4I53rSf0RmTUaWwAoKTKAka439S86uumdkxXuPd7QSK7Y3RNbd/E84VwsXbqp4ru5weWWvEeednOl5AU50xTbt4oEkNc6QzHOFZjqSAchKkDQdkXqukWWeGT1vCbo4ZunWxwvy5pvrgIxIGv55c3vPCbnc9XUV9IU/GS1GBEpquSgqbGoK6x3tk/ldUYSNQIoYTKHHWeuFfCmUt0UsMGhps+f0E3PFOdf9hdBEjVB4nPH+prEg0WD9bZT+iTOeveEoj05c1tm8EjiECRudUFimJhnk5Jdj0lpVu6Ydt9wg0sSSXTorbxSuB+Ujm1uSj6o06rpSW2BcU23rKuxMdhgM/IjlbBDVXEUxF2QeWDpdlYlcJ66KRP8huM0gezSqT9SIYnO8Vi6Yyh3L8dlsjhzxHWWCxtcskiiRQQxjtOcj51z/tmA72jV4HSrRxLvHq+wbXu89mit2rRdJJFpbrxyrpv2/jfjBG1+ppcpANa52rbdWE/Bqpvuun5E/XX0K904D+1khWskueUiiW054+oK14w1iZd8n7j0OgpJDNYttk7zrTA5n1elGHri1DTzLRjqAUm8/uqmGrl7t+enpnRAVGltTSJ/Pp6/MQ9JdOmmh0TAIUGJticjYIVrNM+1CWRbXS11WJN4TZ/RufbCDXuNRTSqZILuC91UgySOYo0dmVyc+Nfm9dyeE0USyWdHeg4DViSNrUk8r3DNdS03yNn1W2Wv0DTBBgBPNpd1tlxkCeCd5I2jrjlX3VQVXPbWIWQyycthwwDsedHUO23bjhZOcYMGwHLWi6qoTTUuAlokS9Aadpz4w25bEH0ri2HetAT6kLUmlVTFxDHYtr1Kle3lW+U6RNfGLNqus+09VIhUN6DNz/QyBcA6Vxp1QRfZ06qbAj4CqWpvM4zT1iiL7bryuuDTTQWRutwN2HWwmJpEV4EY4NvivBUmiNJVoXOumAb7fJta6hbrbYuDxdUgnlqTNVnaYDDmOqDahN/hshn3YU0y7cNvN/39Hg8IH2NTJLF8vCMHfdfOUe5J2YupOTpBOqCj14/1/dfwvjqPuUgie/4ndFMFKu6pOVNskiAAI0qz4vvGjJrEkW5K1iRO5sghibvOJE73QeITZqxKoM30KSmgDvf5PEGKSgDFgewZfralqTo8a+I+XjbzUFJZpDYtL5ziNht2fzJ00zDzQ82xqb3gsq7KgfNcuq8bJGqEgwCzSVu6KTcG8LPHNw/5Vqlf//kv4ju+9J34nd/0KvV+27ahp7KDYhaRGijJ1xAxuGo78OiVXA2elXbXOU2eJP+4bnGUQMBkZ2m6e5BFBjCgkKXNt0ZTV77a4iUnE547Wo7fiRHtqKrKiEs5SOJ1dRLe/+INAMC77x5fyfE8JFHhuEpNIoPkvhXmzpENuF1RKi2SdbzUn0cA+IYPvQQAIwrPmDRll8CS+X4nQzLgzaEnpibh9+Xvu4uPves2/hcff49qjqYm1Pyfed5kbd0MiVrNXvokmOgHfOxdt+kxc1tgNIHPq2VTyTjzevpCuHsUYPytvueBCtlDx4SrouewP8dC7OAATNdZ3TpnvIf4FJptpJlfFdzABuB69AFSE2flgAHOSV4t/CbwWrEJgFNtNeMwjtOKVIxzVIwT5+psY7KtjGMn12ejRPcWdT0uWOKDMmudofva4FLT780KB5H1pwuLNlhxI5JuOmStN60ObbvjBYk8krhsanzfd3yMfr/XpmNEEonjOLVcrLjR024r5xmwNXjcxqatCbWbthXJoQSfHARy1/U41tBNnYzwtu2pdcE45FfXJ7GuK9w5XuJzDznhGpnTru1UPWjfCnv/CycAgBOSjnZeE+r6SoEIiipzXXFUx7fCDoY5apBEj96tRLJuHZm2RE1dUSUAYu9/4QR/7Fd+FL/o1RfpMeIHvalQUxXE/Y3HeiTxY++6jb/yb341/X7AtneyGgTlMYeOKNLTWJN4uGzwn3/XV+JDb79Jj5HAWfpb0kiiq+jfc+qmY6LQ8bmA/J6zCIM2kv4JmDVZgl+2dGPh7KXmuFzS1WNFtR1uKJLy18WevBlfoNHZgCBI4QOwCqdbvxiXUdtyaxJZHnMUyVK1zuhVlEAJpNxeaswDOgaJQxNsHZLYez/LQaLbgkSH5Ar15zzCQWxAChiqi6aOApAG2Fust51OtMCpLbx1yYvWYmjTMbZgUDQ33rV7uqmYOGTrXUvLdrt1jHNqdLT9FcfsbqsXrgnppowKnFDLNjsOWb0Iu3uywufIFhiAXSc15/GtsBdvGbThfUOweNn2toG6fqgIGlZDUqDC9VQ2Bcy81tsWZ9vWo9TmbOEwJ7RtUm6P4i6681FVFX7DV/AIHWD37tcfmYCPQRLlObk3g246x4QS2/U9KoIBBFhRJGHlXFe0/zz25e+7q3q/3E8P1zrBoUVTYb2zgVRJNRTwk5IAV5oV60EL8PodgiDypRtxSmxRPM6pNzZ+2vVct3L2TAeJbE2iXFgXyWKldsMehBTdzkWyyMxWTKKXnSMwqGuqKJn2IdU8oLKxnG5MAMBspG4gJXN1556yWAsMKgB2kCyWRz63J1qsJpF1JA2S2GG9a1Wb790b8+imc0wSHhon2RVyMEji07dpa81HEnXJrW1rg3TOabLPtk7MSujFfAuAaJBI0E0BoZZZJPEq7hOharMBgKkv71S1nW+Ffd2rL+KP/cqP4lf+gndcyfFeHoLSW0c8k0GQxArXU9kUsHTHs22Huye8Yw0Ikqhr+XP7SN8mYq7dOjL3/GfunwHgKNfHId30soPEkW6qr+08G9rpMMyhp90OAtSYfd7cFhi7tqfQ7Zjv5L4esxFJVAoMyntG4ZqWDPaCoJRVvV849ZabVpfMvy72bAeJM5wtQGpLOCpVWLfHBg4bh6aqlZ8HzMOjFa7RBLIuaqAZJxvL6bY1ffqITcOtbQMcmjCFJArdlJ/jygvclP0OB193lnCNsibxYFnjdKMTSQB8AQ4N3XSOLZt6qEnUCNdIvcEeSRSzap7duG6Vnp0RSdzpakJdJFe1JoT1F8r1R2zbcjR0QQ2uim4KWCGHD7zIIW7LAUkXsa3rqpxY13pk6TwmIlgsIgvYGmyA6634Vtjh0uzdp9uWdgjt/tZh13WqPn23Z7SJmGvPDQH9Zx6s0dQV9bwdLk2bjhFJvORn1LALeJZSOG6za59ItOeiTe6n+8oenH4AxrXYmqqbln3lEElkgzbABw8EKNL0HAYsM5AVj9u23Si49aTZkzfjCzQLGZM1iYIkkpnuxhFO0QhHTPokEpuGDWxsUKqhm3Zdr3JkRgquixIxSOLKFkSzffpEAGLXhtTR0oNdO0XU5jVtC4Zd15ECHOanVrhmRIiUdWOACbjXuyFInOk0XT6SaJxkTabPQxL3wjUA7Kbt1iSyglvuM0qplDobsC64txuilqYdqtQxdNPDoSfaVQaJP/6ZhwCAj7//eer9gqR3iiTVs2CiuHhEIrKA9MBrcbZpVTTVqzTXuWZbeyydhCvbNkDMre28bJMg8dP3z+jzX1UVjpcN3nhkkMTLfkYPFg22bY/HG51DLkjivuWSsWVToa70SOJq4feY1ug57CY1iennoKqqqH/NIYnOHEmgaIIkttx+6iZ3jZ/25N1bT96ML9BYRGrap4/Pko83sVY4xaG2aoI2G1yaFhDMHIEBSVRQosY6QccBYh7QsQn2VrJ9bLZ12uC+NE+jwOoHlgyTZI6zOxWuIemmDrVVQ/cFzLk83bTnylBdCZLYdiqZdlEEW+/2m7bYytlsxiCxlNwKEHFgXm0hwNLkneCSZVsI3T1AEhnnQnqiSYuJqwgS/w+/9hfga199AR986Qb1/mVTGSRdWW/8tNsrt48AAN/ykZfpMYfSgmHHK4detUmt5JunW5VjDZgEEFvKIiZIoptkuSy7dWiRRM35Pz5Y4P7QJ/GykRRxwu+f7VTo6sGyxtmufWLrxi7aTA/OZrxubA2w3xqNS7C7dGv3Z2nPcfuQjz4hJYRo/XI2wTgJZEmgYtXUqCs4bXGu57qVs2eabtqSNYmugwbwYjJNXakgdLGFU5PIqp01tcn82CCx48Y5mXyNI+mjbfx3G+mmA02SpZ8YKXk5l3Ldyg+2VTfV0X0B3aYdIiJsLalbb9krg8SjZYOzoQXA/CDxCpDEgY9fVVwioa4r3Dxc4N7jDdqux6p58hbWizZbF92Oz1sJhY+1V9Gqm4qxTYoBS1OlhGvG58a+tmt7imEg7QYkoXYVtORf/OGX8Ys/zAc2kvDTMEmeBXvfCyf4b3//N+Cdd47oMQeLZhQXua7CNeIE7rpe1doDwNgEXiVcM6B7QsO9TBMk8c3TLd5xm79uLqX48msShyBRgeQClpWwT0paO1jWVsmWDG4MkmgDN2YdFz9ubGdB6ke4/Q41ZRGx4LJck+jPkRVrrKoKR5LMV2pHXBd78mZ8gWb7jRWCxIDKuVMI17TOjc+qba2aCptBbEKjdubWMmp6OQKmT6Kql5rUUbQ6B2g5KImdjkgi/90kABY1w1Lz7EVTY9f5Cqxsn0RgEK5RCge5fSo1Drlx5P3PKtnh0qiwPlzrsqYA8Od/61fgV3zsFdy8ZMl7cZKltpCVu3/uaInPPlgDuBoq1XU3D0nccYpsbiJHI9w0V7jGVXIzgk/l6xbStM1xSSQxEK5ZXkOBI6Ffaankz4K96+4xvR4AFkm8f7obUa3rZkcre9+yaJtLJe/I/Ubs7UOw9tpA57xMc0WGNAGYK/J0FcI1AHD/bKtKnI6shH0N/GgHi3qsSdQgieudpXIywjVuCxgZ576eMjfY0yjsLxzwgFc39WsS5Seznx6tGjza7LBt+cTRdbJnHEkkIeOJummnkNp11C7JxX+sURjUztiNdNXU2DrywxzaaX76dFMikHLl9dXBjcP/JxfkReM82B35YI9UNr6vDRCcf7I+ygrX6K639BLctDq6L2CdkDeVWVMA+KoPvoCv+uALqjFzTIL7tbK28PaxDRKZbOTTbu4aJKhsGUmsxjGdItPqCtDII61B4HedUdxl7skwQwuYIPNwyVDXa7z+qBudkuvo3JleubogfW9xEyTxbNuNqNZ1s+dPDsbf2V6Oq7BuSZHw+9oPvoB/9UvfiVeeO9RNdIYdLhusFoZOqOlT6SGJVyBcAxgkkVUgBsy1Oht0EvZJSWMmCbcef+fG2GT+tuuoFhhWhMYXheGQRCvUyIwBLHgA8EDRtOWGnUPJjlYN7j3WIbLXyZ7pIJGtSZxSOTkkcVFX4w3f9TzVaOkEYAaRooZh6TygLG3FpUmqeqK5vZ0UjWuBoZZu22K741QMAR9JZGWLbTPxDlLypJHy3+w6uv7UIrJSSM3VP8rx3DYFmppEAGp106s0Uxcq8s/8HJ87WuJnXz8FcDXy7tfdFsMaZOT1Wxwtm2LyyCYgbHsVDSLoijZp2AW7tsfZtqMk8msnSSW267h14Xi1wKPNDo82pm7mqhrBa0zYHcLc3QvXzLfjVYN7p1v0Pa5tkPg2J1hjE3cu3ZRNrojVdYU/+R0f003yHCYMD835lyCxqi4fSXdrEu84/YBLdris8ZkHW+w6TnH9WTB3PeWRxGos0+n7MgADTJFEvibRaRWnRBIFCWR7DoctN2Qcsy8eLd0g8cm7t568GV+gsTWJgMn2aamcLhze9b0iaHACMBUCaVVRu05Hrdx18wIpgyQaZ5JFPI9WRspcw/+XVgpyTHfupTn6ATBxLA8l5c9/XVmBIk1tyXKh7yUI+H2qrmuGajEUsmtpPLePVnu6qWNVVY1rkEa4I1SXZW4tV8mtU7AE3BrIs21LORbybHl0U1I9+sbhAo/WOzxa79DU1bXcgFeL2tRoXvM+iU+CvXDjYNyjRLDlupm09gBAK4DKfft4Y9pCaVC6q7a3Dd/vfWQLGMAq2WrKDebaHHVZGfdgFNe5vuf/Ks3VK9DUJG7azgm+NEgir24KhDWJvC/vMvzYnsMj4OCAAAD3/Y6WzdgCZq9u+oQZi0gBgWqTIkjsnOwIG2ysnACsI9VNAVEAtZkOrt2ACKcoAylPFEOXIT9aNng8cLR5JNG2wBg560VFKkubm1eTqKsJDYWK2GBvNaCkVlaZr9sTu44OMjCIi0iQqEESj5c4HcQY9kGiMWkBcLrhUDrAJiA0KqWLyHNDtc4Y1q2zAYFnnN2wkTIwqJsSa/KNgwUenO3waN3iZFVGVt8KWw4iZHvhmvPbCzctMnTrmiKJtw5d9IVU7h4UEO+f6pQk3woTwZr3v8AHiSJOdKToiTnX3JYDmmDvcFnj/tnQy3G/3wDw72XWv1g2RidBfGWuT6L57JA6WvKDouqmpM8btrIo+aG25YaPQDLr+eGywZuPTc3wk5iAeKafBtu7jRFJmIEkVk5hrSLYcwMwViQHsCIJfW9qGanWGVLr5LZgUNUf9SqUFDAPjWyIbGbFbYGxJbNUI9rZdbPUTQXdYxxW+WxXqIimFzc1Nrse650Jiljn4s6JdZqua4bqZLXA6WanDxIdJ3CvbmrMRxL5TVvbg9Mt0tf1d7X1QAB3H480bY9uyvXXunGwwHrX4c3TLW5cQ6opYNkde+Ga89uLNyxKd13ppm6iQotkvalsXP5WmNBpNedfAsvLVtIG/DVH2ydR1q19kGhM2mOtmpr2XeXcnW6ML3OuPomFPWfptLLQrK8muLTBHkuDXgTMQHmtZMerBm88fnLvreu5s16RabMPbu9CTt20Hp2sXhk0AAbd01EyqwE1MP/XNS63yCOFNsi4sU2EbkH+zIMzAKDVNZeutHIr6qYFwSGvlYV5jROuGWoShyBdIzgkGTRW3RSwwb0IcLDOxV0nSLyOoh2AqWt4tNZRiwEr7Q48mQvrZdjBYugTt+HppoJSq9RNx1reHota0d5mZYWUAA4RCetRAFHFKx9PamY+ff8Mx9c0SFwMNYn7PonntxdvWlGY6xokAqa9x09+7pEKNV4tLJJ1XXtAAsDv+uZXUVXAL/+iV+gx0hPz5sHlX7NbR3r0CzDnXJagg2u6l161SVCvSXaIH/JIgkRNr+6RysntVZ66qUKYbTmIifV9b9hspO+6qCtbk6hgfR2tmpEVdZ0TQCl78mZ8gSbQMQOJuzWJfFsEn2etqVEDgNNti7braYhaxF12mlpLr+G2zFuBtg31fhrf59bhEp+4Z0RJbpDZRfNgi3ANiyQ6iODoJBPHcnoXaoI9V9mrJWtCzfEqP0gkF5K7xy6SeD0di5MDI/+srkk83geJoa2GIPF0EK5hbEwcadRNG0v/0dC0ZU6vD3L8zD0pn+urm3bUxn3TCRKvo2gNYIP0Pd30/PbCDbve3VaIkly1/Y5v+CAAqNp0+O0GrudaDpjz/kd+xUdU1NF33T0GAHzLR952WdMazT3nGmqfu+deV1bOVdsYJCrOo+zVjwcxMRWSKPWFdPuwegzaxiCR6a87PF+mVRNX2iDzDJFEZp5z0e3rYtdzZ70i2yqyAa66Ztf11ELijtEEDVKT+HBtHjSNuMumtWITqmbure1Nxkxz5QRSmro9AHj+ZIWzrZkkm110W2CMQaKidYnGSXaFg0y/Nx5JdO8RWpVW2kRsW1QVjwrenFEzcNV2vFrg8VovLe4iBfsWGMZWA1J9tm3poEjuLRXd1FEFPuhqepxshm8M9ReMsxv2FwVAU7zlHHzm/tpTlbxOZoSDdO2F9hY3V63ybbeu5/UGgG//0nfii999W1W35zcuv55r+Vx73wsn+Nu/9+vw3uf58zHXLqSX4x5JBGDppr1TClAy8Z1OFUjipE8iyd5yaaMaJFGer7NdqyrnWgz1ljJHmUPJ3BYwT2JN4jMdJGpqEleNL1xzzIxZmALZdui3pwkaAOCRBInkwNVAidXIAcuxNrseBwsN2mCzPxqUFPBr6WgksanxYGvOhy02zh/T7T/VKRARX7lVFySOvTQ1yPEQ3EsrC1aAw6VjXFfH4mTVYNN2eLTZ4fkbB+UBgz135KCk1/S7XbUdLE0vr9Nth7snCrW5Xa+6/21NYk+3CQLsdRK5b0bdMewvCgxIIrHmydrxYL3DiaIn2lWaEUnQKxfvbWp1XeFv/p6vw92T1ZWIoJzHPvDiDdX7V009qmteZyRxrr1feT7m2smqGbUBNPvGnZM9cyU0SUKLT8OY+KqPhyCRSfCGdNOWLDdYNJUj1Kjfp9bbjt5rZJ6ToJShm7pI4hOIUj95M75AU9UkLowjD4hSafnzJWuwGYIUbU2iIInsjbVcDCIJisaiSzfYU9ZoAhiQS12QeNdZkNlidnG2AIsklh7uEUl020uovpsJgNl6y5VTN9lp1U1nNFJ27bpmqKRW7N7j7Wy66XWuP7pKu3W4wMP1zvRJJJ1kQRIFqGNuZVfum21sDBjRjqNlo0IS66H/oyR+ANDZ3RsH9vOvK91UEkeaViJ7S9sHX7rh1WI/LXawsMIpT6IjeV2sqqrRp9AE2y5KvQ8SjQmSKGVWjC0DuinVJ7Hxg0R2/V+4QoEK31V8pfWupevfAVPyJPuUBM6MT3P0hNNNn7wZX6BpahIPmhqbQX3StMDgFFGBQTjlHEEi61xLL0GrDsUfy5XJVwWXSnEXwF+QWbrp0qWbStaohCQGtYUAuYgsLQK5U6rSjgq4qhpUqUls1YvIb/6q9wKwMuPXzcSRf+PxRvXd3MDwbc9dz+921XbrcIk3T7cmSCQdSWFAsBRtAGM9YOvSVOkeqA3efKyrrVo09ahYDIhwDaNuau+Rk4PrmSRZDtnufZ/EveXsYFnjwXrfp+8iTFgFmv3mSRCBu2p730AP/g1f8R56zARJVJQ32HYWHbX+L5zyHg3g4/p3266jQYDGUVMVMIBJKNx06mQ1dcrXxa5n+vWKTFOTuFrUo0JRR2Y6LN2xVaFtchNrJZlFgdUW8RIOoTSOV1LSvOBSEUgBwPOOAAGLJC6cAEz6JZbELVwkcRTlUQhwnG1a+loDppZ04yjgalRRH57tsN526izyH/22j+D3fcvnX9sWAFLr8XjT6tRNHSTxun63q7ZbR0vcP91h13V0ALZcVFhvO6yHGmCqwX1jN21t6wYfSSTXLSdDC5iWNUziznXsrjOSaHqg8kH63p49cwOT69wn8UkwCQ41wba731xXEbirti9853P4x3/0X/KCnJIdLPwgkQn2mqBP4q7lfK5lU43aFpqab7kvzrYGSWQ1Dxa17a/IstkA4O23bf30y9e4ljplz/RqpKlJXDoBwLbrOBUlpyau7XlHSzJhb4wNONkgMejJpWz3IKwCVQuMIUuuqkk81jt3riM5PqCF8+K3wDBjmbhNHPCzbTugxmSQuPCFa3QIZD+bbnqdgygX4dFkaFn1zmfJnjta4v7pFqcbjbppPaLUAIfuSfJlp6SbAibB9cYMJFGCqLbr0ffcmuy2RPjgFdU8aU3q0sVpehLpRnu7fHMDk6exJvEqTRx5TcJ1jyTGTRMgAucTrtk5KB0TfC1qZ99QAD4ukni25dtJuX2wbZBYPp60gAGeTCrzkzfjCzQNRO0GAJtdR/XSCYVTWEamqCGJs6VtgaGhNrktMGzdnn6chm76Pkf1TYWSji0wuCLlqLopWZPY1BXOdi3arpvVJ7Ht+XOyGqjMZ1s93fS6m6cap/hurHjPs2S3jhbYDK1SaCRxSEBIxpW5v2xzY13iCPCD+0N63apGCjnb3ia0j7//edX7r8rsWs63Bdnbs2fuc7kPEs9nv+jzXgAAfPn77tJj9jWJF2Ny7h6NLTA0wjW2wT2z/i8jwjUckmiFa0QskLGF04Zto0AS33H7yS6Xub4QxBVYq8gGuAEAK+fvFsh2ikDqZBT7MI6FLpDqnYCIQUhtsNcrIPtFGCQqkMTbx6ux4TBri8aKwlh10/z3cwVoNHRTwCgznm6GRYSlzTX1qEjbdjz6crxq8HjTqpz/J8VOZgaJAPBrf+G78OrLNy96Sk+suXWa7H2yCpBEJuHkZnY1/UWBIEhUPDfbnV9bwlKA/qNf/wvwN37kU2MvtutmRysr3ATskcS9xc1dG/f3yPnsD//yD+N7ftmHVXup+16XobA3ncm6PdJNGeGasCaRpJsa+ufA3Op5VqBc6/WuNToQc5DEHeeDAsALClX362jPdJCoRRI3ThaBChKXFsnS0BaFoidNqXV9Ejvne3FjAHjiCkxNoifKowwSAeCv/86vHSW/GTtYuMJBHaqqfN1C4SCAo5sCRoDjbED3WERk5Sjgdj3f8uTm4RIPznazhGuuu7m1Htog8Y9/+xdd9HSeaHOL3tnWMcKAWO861BUXfLmKo5r+ogA81VV28100leMg6Gr3fvkXvYJf/kWvUO99K+w46B35tD3fe7sYc/eYpy1ReNU2V/jnr/ybX407x6u9mvY5TPZ4UTed0wJj13FtKdze2Rqf1y0DO9t2Kl0Ml/HS1BXl9zZ1ha943118w4deoo5z3WwfJELfJ3Gz6yjeulBS17vOUFRJB2HV1FjUlTr7vGqqgSKm7wno1u2xwjWLusLptlW19xA7XDaqzfBgUWO9s0E6s4h4wjVdj7riaYwHC9OT7mzb0YiI0EYBnXDNzaG1weNNi5duPl2P5NueO0RVAX2/r/U4r7nOy8tktvtgUeN0I1Tmhr7/F42ppdOskYDv4LK1sst6SiVnkcTrbpLwG9fyfQCwt4i9/TkraMH0F93bxdvH3nX7rZ7CE2+huinFSpMaeIcpxpYFiSq2hj3nCtesdx1eZEs36mpMYpr+ivwe9QPf9ZX0e6+bPdOr0ShcQ1xsD0lk6aZLP0hkkZSqqnC8amYhidu2V0HvVVWNgjeaNhGAoZadbuYhiVo7WDZY7wwldtf2lLSyK1zTKcV1Dpc11ltdYbPLkdcI10gm6/VHm6dO/nzZ1JA+6S/cePr6m12luXUzrErajQOTgNDQpgFDAdq1tpaXpZvKsyJNraljeRlhqUl8Oramo5kiZHt7tkxaGDV19dTc+3t79mxEEtdDCwxG3TTok7jtuBZIizqCJCpYcOtdh7VCB2I1A6h4GuzZ+JYJkxuMUwE1dTPdkF3X1CRudh1NURU7OViMjgXdJ3EIZMfvRR5uOaAGnVKk4nDV4FSpADrXDt3ehS3XR2ds7zGI+WjEUA6XDR5vdqo6QVfcSCNcIzTCzz1cP9WNlL/kPXfe6ik80fbeF2zdHRsk3jxc4vGmxaM1T5sGhg3Y7blKJ47M/cvSYQFflGpHilI9KTYVIXt6n++9zbd33jHP9v7+2NuTbFJucP/MrHdz1E13bcf1V3R0KkT0huo64PiSGv/OlDxZJPFZYUY9G98yYbvO1OkwiI8giYImMgGf2yeRpaiKHa+a8QFgKUoirqOhjXrjlHV7Bm1r1SjdHHMpAhtSItlDEpUKrEfLBm+e6qT8PXVTReAsSOK27Z9KJ+HzXjbtCT70tltv8UyebHPlyFlUVu6t1x7pEhCGbqpfS6TBvaYtS1jrAXAZ6CfBRMjn3ogkPl1Mgb1djL0y9FLbK2vu7Um2m8P6L/R6hs0me8uobtr2tLqpME82ijKFUbhmq1OUX7lB4o7zQZ8Ge7oKoJS263q61kaonNKUmqpJdKR2NXRTwHey2OBS0DYpGmZl5CWTr2kTAQx0022rboExx0IkkVOktfWWnaJPpTleg5+/d+odu3w8S0nueg3d1Gnk+xQ6kX/ht30cn3u4ufREwrNkLCXt1lDH+NkHa1UCYjEouWnXhOeH4FWzgbq1HjtFCcCTYG4LjIoUDtrbs2fvunuMX/jeO/i3vunVt3oqe9vbbDtcmvZhkmDnVEqDPoldhxvLcmhi+iT6gmcqv3zXqXpTrxbN6N9t2w7LxbOxlj/TQWLbcRkLwN5Y0v9FgyQKArlSBABz+suJkp6ohjJFvIARvPH7K+qCxB2J7J3HDh0kcUdet6qqDI+8NYGltibxnhJJPHDppkrhGrETBQLzpNjzNw7w/BMuA31d7C/9G181Ji8Yk3vrcw/XNEUVMEHe2mEXsPfy80NTasm4MubWJI59EtkiyGtuso7fe7TFwaLe9//cW9SWTY2/+K9/1Vs9jb3t7VxWVRVOVs1YKsX4aXVdoaqs+AzLwhItDcDtr8szzNZb0wJDJ0y4r0l8pmzbahqlm/c9HPrgcRkLC2tr6aaiimc+hxsnfPAxuGEFbxZ+f0WWWnawbIxy4q4dM+aXZUKVO9t2JotDB8DmwTbcc/78HyybkSKmQhIHcZ2u5/skukHiy7f2wdTe0vYl776javkg95YWSRThJitcw93Ld4cgca0IEl2Vut1Tpm4qa/KD9e6pZAnsbW9725trUgcP8IySRV05JQccw89tnbRV1LJXVYWDRY3Hm3Yo8eE1J9b7msTLsaqqDqqq+jNVVf10VVUPqqr6R1VV/ZLhb++tqqqvquqh8+8PB2P/bFVV96uq+lRVVb8n+Oxvqqrqx6qqelxV1Q9WVfWe0nz+ySfv4/7Z1rSlUGQRACdIpIRrfFhbQzd9/sQGC+zNaBs3D/Uvmlo6p+E8C7gdLU2biNNNi8NLDhIFSVzv2kF+mOeRS584zfk/Wjbj+ThSnMeutwsWm4C47ahWvk2B9uxtbyUTUaSu11GZDxYN1rvWCDApEHihm6qDxJFu+nSpm7rJs6ex3nhve9vb3lxzS6XYNU+EIQHQ5USLukbb9ej7Xl3LfrRqRjExFgQwbdhM8Lu9AvbcdbGr4rYtAPwsgK8D8DMAfimA/7yqqi903nO77/tYd/U/CuBVAO8B8DYAP1hV1f/c9/3fqKrqBQB/CcBvBfDXAHwvgB8A8PHcZHZdj7NNq+Iji1LmI0WQONJNdx02uxYrRXb81UHsA+Cz+EczGzcv6gpbR/BGQzf91LbD6aalA6m5JpTPs21HFzYDFkncKK61OZ49d2ywLdf7bCc9grhj3XEazr/83D5I3NvFmYtSa5HEs22nVi6+OyS3pF8oY66U+dgn8SmpX1029dga52lWLt7b3va2N8BXtqZ75XqJQq4FhgSS29a0Rasr3nd97miJzzw4A8Dvi6G66dPCdinZlexafd8/6vv+j/Z9/1N933d93/+XAH4SwJcSw38TgO/t+/6Nvu//CYDvB/Cbh7/9KgA/2vf9X+z7/gwmoPxYVVUfKn3o4zFI1CGJjxR000Vdoa6GPonKFhif9/JNAMAthZS8DRJ1tXSCtkmfRDYoPVzWON22ON1efpBo6aYtNmQLDMAqUq13vIoV4KOHbOsAWTTOtsZBZs+jW6ekqRvb295K5ooiseuBvPds26pVgYVuyt77QKIFxlOUpRVHaU833dve9va0m6x3R8tG56e5ojBkCwzAsE+2na5G8LmjJT5zfw1A5ydvWlNOtNntaxIv1aqqehnA5wH4Uefln66q6ueqqvpPB4QQVVXdAfB2AD/svO+HAXxk+P0j7t/6vn8E4Medv7vH/M6qqn6oqqofAoDTbYv1tqUDN3mfiMIw46qqwtGyweNNq1Y3/fy3mSDxO77sXfSYsSZRiSSuBrrpiCSSTuHR0CfxdNuOx74ss3TTDuttN/ZjK44bEBEt3fS5I9e51t0jZ5uhZ4/Cuf7AiycAgJdu7msS93Zx9tzRcsyuapIkB4saZ7sWbadTBb51uMB3fd378ed+y1fQY7zakpFu+vRkafc98Pa2t709KyZB4k0FwGEYX6JUyjHFpP5w2/bqlhQekqgoOet7g3RulaDPk2xXLqVYVdUSwP8dwP+17/sfq6rqBoBfCOAfAXgewH88/P1bAAjn8k3nI94EcHP4/QaAzwaHcP8+Wt/3fxrAnwaAg7e/2p9uW12j9BBJJG+Qm4dL3DvdoOuBVcMHUi/fOsQP/r6vx7vvHpffPNiIJD7SNW4+EJGKsSaRRRIbPF7vcLblz+NcO3SQxMfbHV66ySFuJwcLPNrsVKgx4AeJbAAs98jpVuimvKP7A9/1lfhnn3rwzGSn9nY11tQVXr55gJ9/80xVN3y4bIY1oadrlAGTGPuDv+QLVHP061GEbvr0PAfvfeEE//gTb+6DxL3tbW9Pvc0KEh0k0ZQ4MHTTAUlsO+w6Hf3zuaOlZdwphGsAUz62r0m8JKuqqgbwfwOwAfA7AKDv+4cAfmh4y6erqvodAD5ZVdVNAA+H128BOHN+fzD8/nD4v2vu35N2utE10pQbQoRr2HG3jhb43EOD7GkzD+974UT1frcnF8DX0h0uTON4Szfljne0bPBoULG6dHVTpwXGY0UN5MlqgUfrHdoeuO0EfiW75SKJ5CIigbK0SWGDbQB44cYBXvjgHkXc28WbJDneo0g4HS6bAUnU1STOsWVjle127dOHJL73eXPe931C97a3vT3tdutIgkTe31q5iUIy4JM9QpA9TYmCCwLQSKIXJO5rEi/cKlN49WcAvAzg2/u+3ybeOuBZqPu+fwPAJwF8zPn7x2Bpqj/q/q2qqhMAH4BPY43aqdQkKkVJHq5NUMSigjcPl3jt4dr7jMsycQbfVLbAOBgomVq6qYseXr5wjVWKPdvw9NbjlaH7aqjFQEg31QWJj9d6JHFve7ssEznyD750o/BOaweLYU1QqpvOMdMUeahH6Z6uFhgA8OpQX86KOOxtb3vb25Nqb3/uCIBVqmZsuagskki2wBC2ybYdkD3FPuX6d666fM7EfxSNkT2SePH2fwLwBQC+ue/7sRt0VVVfAeAegH8O4A6A/xDA3+n7Xiim/xmA7xlqCV8G8NsA/K+Gv/1lAN9XVdW3A/ivAPw7AP6nvu9/rDQZoZvqkUQTgLEBx63DBT7xxqlqzFw7cpDEpq7ozMrhIHe/2XWqcR4l89KFaxwkccv3ZRS66bKpVXQvd+F44Qa3iMj5F7RZI96xt71dlsn9qAkSDd20RdteQZDYWHXTEUl8iuimv/Sjb8NL3/nxUYxsb3vb296eVnvnHRMk3nucwoGm5jaqZ1G6EUlsDZK4nAkCvHiDY3BJOZEgifs+iRdoQ+/C7wLwxQA+5fRD/A0A3g/gb8BQRH8EwBrAr3OG/xEYMZqfBvB3AXxf3/d/A///9u48SLKrOtD4d2rprVq9S4LWOpKQQGhAAiSBxmYZCTBbMCAQCCFAWGaRwQ4CDAQDAsxiBk/gGcIsBssaEGI1iw3YCkMYEZ4AwshmMfLIgEBiES20dXepu7q7ljN/vKVSRS+Z1ZX5KjO/X0RFV2W+l3kqO+vdPO+cdy+QmXcAFwLvAO4BzgWe205MRSWx/XbTKsHbVVUSO7gm8a5dRSVxZZffVKtblonoaJKK8dFycpfZjt74W1r+uLq9TmLrmpOdLLmxZsUou/fOsne6syUwWg8i7Sfb921JbmdhV6nb/uL5D+f8Bx5VT6DSjpXjI+yZmWPPzGzXrzceHx2pJ6yZn910cP52xkZHeORJm+uZXyVpUFXjzM6p9pPEaq1uqJbA6Gx206L62P6YsaFl2bEj25wssCpU7Jud7XiinH7Wk0piZt4KHOx/8BMH2Xcv8OLya3/3fxU45JIXCxWzm7afOFTJUzW7abvtUEesGqvX/up2JXF8dKRYc2wuO5/JsKqsdrCWV2uFreuVxLHid9u5Z5q9M3Ntt5tWlcSIWHS7absWtvs6UYWWg/NO2cJ5p2zpaJ9VY6PsK0/ItHtN7mJV6wjC/OymwzIAS9IgOaasJE7u3d+y5/u3YmyEyT0zZCazc+22m87Pbtpp++fxm+bn++h08sq63XRscE5kHszQXiRRtJvOdry8weSeztYgbJ0ApRdT5q5ZMcrOPTMdr4m2d7pacL6DJLHlDEy3J66JCNa1rG3TdrvpijH2TM8xGjMd/W6drE9ZqRLlHeXEQd2uwEjdUp0s2jE13fYxcrHGRkaYnUsyc76SaBVekvrO+tXjXHzOcTztIVvb3mfl2Ah3z87VSyG1c/yvK4mzyUyHSeLpWxfOd9lejFC0m+6Z7v7J0+ViaJPEYjKT9iuJVeXwznISmnVtztzUOg1wL3qYN02sYOeezhKiVeNFqX/3vtmOWjLv027ag4Ro3aoxbt9ZTHLb9uymK6sZR2c7qpKOjY7wR088jd/qoAJTvQbbrSSqz1UD4I6p6fuc6OqG6tg6XV5bAu23eEuSlpc/eeZDOtp+vLwmcf5yg0Mf/6uW1Om5IrnsdAmMTrVOXNOLtcGXi6FMEkciOm6vrBKAbTv2sGbFaAcT1/S2krhl7UpuuWt3R8lete3knumOYmyttvVi5r51q8fZViWJK9p7vjUt23V6TejvP+6Ujrav3iPV+jud/B9Iy0n1Xt4xNd32NRuLdZ9rSwZwdlNJ0oFV6yTOX25w6ON/NbvpzGyyb6azJTAArr7sbNZ0UNyoVzjYM0Pm8HSKDWWSGFFMLrJvtv32ymrSgV37Zrn/+vYWcgfYumF+204WF12sqrrXSdWsaifrtAIZETzqpM2sWz3GqUe3P3PiYq1bNc5P7tgFdNBuunJ+u3aXO1ms6szS9nqdSqsh6k/VcWD77umeTFwDMD2TAzm7qSTpwMbLdRI7udxgfnbT4uRip5dFPO60ozravh4Tpzq75KzfDWWSOBLBjg6rPavGR1m7cox79850VKo+vmUB65O2dD+R2nJEkcx20i/dWjXo9Fq8T7zkkR1tfzjWrR6rZw5tf3bTlkpilyu51eymO+t1KofjIKLBUx0Tpqa7P7vp/MzFs/UENl6TKEnDoaokznRwuUHrjPfTs3NdL8JMlN1yd5erFXT7Wv3lYjh+ywVGI7ijvLawk8RhczmbZyfX6LROO79+TXev7YH5SmInJ+Kr12DHVGftpr3W2rrbbj/45pYZWLudJI6NjrBidGT+msQhOYho8LRW4Fd1+e+m6grYvW+Wmbk5RsI1RiVpWFTrJE53cLlB9Rlwaro4udjt7pPqkqq77i06xbo9o/9yMZSfYkdHop4ApZMP8pvLltMNHSSJvS5JV2fgT+tg4eYqxp1T08v6OrrW5LzdayBbK7m9SIBXjY/Ui8g6cY361REtJ2S6fQyrBtvd+2aL9a6ctEaShkZVSdw3M1f/fCjVuDG1b7ZY3L7LS1JUJzOrAtOwJIlD2W46OhL8akeRJHbSErhpoqjSdToz0juecQabJ7o7+UPlv511DL/asYfX/k77S0dWZfO9HS6B0WutrbAnH9le6+7mlgWsjzqi/WtJF2vV+Ci/ntxbfy/1o/Wr5//Wut1WM39GeIbp2azXv5IkDb6qklgniaOH/uxUJWl7ZmaZmZ3reiVxYsV9K4nD8vluKJPEsdGo34wbJ9pP+KqEo9Mk8ZJzT+ho+8Nx7MY1vOMZ/7mjfVqrh92e3OVwHNdSFWy33TRi/gPn2f9p05LHtFBrXMs54ZYOppeVxOq64arddNy/G0kaGuOjI8xl0ToK7VUSV61orSRmR+skLsbISLBmxWi9DJ5J4gAbbTlT3UmF74LTj+Znd+/mqQ9tf5HQftBaKejFWo6L9YTT7wfASVsmOtrvokccy0/v3NWTZTpaWxCWc+uudDCtkwB0P0mcH+yHaZFiSdJ8UrirnJiwk3bTPdNFu2kvlk2aWDnWUklcvp+Vl9LQJ4lbOlgD7PGnH83jTz+6GyE16j4zgC7jN/7qFaP8w6se3XEl993PemiXIvpNrbFZSVS/uu/Jjl61m3a2dq0kqf9VSeHkniJJbGudxNERxkaCqelZZuayXhKjm9auHOPnd+8G2u9m63dDmSSORTBbft96zdqw2jTRuxlAD9epHUzI04SNa4rXcsXoiDM0qm+1tmn3qpK4e98se6fnrCRK0hBZUSZ4VSWx3c+hq8ZHmdo3x/TMXNfbTaGY9XumnIF1WMap5Z0RdMnoaO8+APWDDS1LcyznJTD6wcYy4V7uybbUrl7ObrpnZtZKoiQNkerSnMk9xczw7UxcA2WSWHag9OKz60RL192wVBKHcjRuba9U8Qc6Ub7hvY7u8GwqJ0Iy2dagmOjyYFi3m+6bsZIoSUOmGgN2TLV/TWKx3wiTe6bZNzvH2h58rm+d12JYxqmh/CQ7NhI882HHcPE5xzUdyrIxUb75rYAdnqrddN/sXMORSIfnggcV118/+tQju/o8K0ZHGB2Jot3USqIkDZWqm2T7VDEpTNtJ4vgod+8q9lnTg4kJ167qj/k7ltLQltTec9GZTYewrGT5by9mAB1kVZI4tW/2EFtKy9v7L3kYc5ldbzeNCNaMjxbtptNzbJoYjsFXkjR/XfqO3WW7aQdJYjXbaLc7XgCO2bAaKD4nD0tBxYxAANxRLgD/8BM2NhxJf6sqsse3rOko9aNetkyvXjHKVF1JHI42HklSa7tpdU1i+xPX/HL7FNCbSuIpR60Fio671sndBtlwpMI6pOrNf/r91zUcSX87+8SNXPCgo/jIi89pOhSpb0ysHGPXvhn2TM8NzRlaSdJ8kri9wyRx9YpR7uxhJbH6nDxMM9dbSRQAn3rJI5ncMzNUb/5u2Lx2JX/5wrObDkPqK+tWjbFzzwx7Z+accVqShsia8SIVqSuJHbSb1o/Rg4lrqiTx1Y8/tevPtVyYJAookpvNa1c2HYakIbRu9Tg7pqaLdlMriZI0NOpKYofXJLYu3zaxsvsnF9esGOOWdz2l68+znDgaS5IatX71ODunptk7PecyPJI0RKokcefUNKMjwWibHW3VRIHg0nbdYpIoSWrU+tXj3LN7H/tm51g1JFOLS5Lm20b3zc61fT0iwKaJ+SSxF5XEYeRoLElq1PrV43WrkZVESRoeoyNRt5h2Mqu2lcTuM0mUJDVq/er5a0u8JlGShku1VmInSeKmta1JoicXu8HRWJLUqNYk0dlNJWm4rCmP+x21m7ZUEsc72E/t81WVJDXKSqIkDa9Vi6gkVu2mR69zZv5usYlXktSoo1oG+fuvX9VgJJKkXts8sYKf3LGro5OEx25czSv/6ylc9IjjuhjZcDNJlCQ16qQta+vvT9gy0WAkkqReu9/61cA93K+Dk4QjI8Grn3Ba94KS7aaSpGZtbJnK/P7rrCRK0jDZWiaHx25c3XAkamWSKElaNkbaXEhZkjQYqiUs1q4cP8SW6iXbTSVJjfvcFeexZ3q26TAkSQ3pZOIadZ9JoiSpcQ87fmPTIUiSGnDpo07gh7dPctl5JzYdilqYJEqSJElqxKaJFbzvkoc1HYYWsK4rSZIkSaqZJEqSJEmSaiaJkiRJkqSaSaIkSZIkqWaSKEmSJEmqmSRKkiRJkmomiZIkSZKkmkmiJEmSJKlmkihJkiRJqpkkSpIkSZJqJomSJEmSpJpJoiRJkiSpZpIoSZIkSaqZJEqSJEmSaiaJkiRJkqSaSaIkSZIkqWaSKEmSJEmqmSRKkiRJkmqRmU3H0HMRMQn8xyJ2XQ/sWOb7GWOz+/VDjIvdzxib3a8fYlzsfv0Q42L32wLc2aPnWux+/fA6Lna/fohxsfsZY7P79UOMi92vH2Jc7H7GeF+nZeYR+70nM4fuC7hhkft9aLnvZ4z+bsP8u/VDjP5u/RnjYfxuy3686YfX0d/NGJfbfv0Qo7+bMbaxzwHHKNtNO/PFPtjPGJvdrx9iXOx+xtjsfv0Q42L364cYD2e/Xj6Xr39zz9Xr/Yyx2f36IcbF7tcPMS52P2Ns07C2m96QmY9oOg5J0mBzvJEkLVcHG6OGtZL4oaYDkCQNBccbSdJydcAxaigriZIkSZKk/RvWSmJXRMSmiPh8ROyKiFsj4nnl7Y+LiH+LiO0RcVe5zTFNxztoIuIVEXFDROyNiP+z4L7zI+KmiNgdEV+LiBMaCnNgHej1j4hLIuLelq/dEZER8fAGwx0oEbEyIq4qjzuTEfHdiHjSfra7snztL2giTqlbDjT+lve9MiJ+GhE7y2PUbzUZ6yA6yPH/xPKY0zoGvKnBUAfSwcaAiHhkRHwlIu6OiDsi4jMRcf+mYx4khxqDI+LyiPhx+f6/LiK2Nhlvu0wSl9b7gH3A0cAlwAci4sHAvwNPzMwNwFbgR8AHmgpygN0GvB34q9YbI2IL8DngTcAm4AbgUz2PbvDt9/XPzGszc231BVwB/AT41wZiHFRjwM+Bx1BMgf1G4NMRcWK1QUScDDwb+FUTAUpdtt/xNyLOBd4FPIvib+Mq4PMRMdpYpINpv8f/FhtaxoG39TCuYXGwMWAjRUvhicAJwCRwdSNRDq4Dvv4R8VjgncDTKT6D/hT4RDNhdsZ20yUSERPAPcAZmfnD8rZrgF9m5utbtlsJvAV4emae3kSsgy4i3g4cm5kvKn9+CfCizDyv/HmCYt2yszLzpsYCHVALX//93P814PrMfGtPAxsyEfF94K2Z+dny5+uA9wLvBy7PzK82GZ+0VA42/gLfAV6dmee0bHsvsDUzPWGyxPYz/p5I8aF4PDNnGgxt6CwcA1pufxjw9TzQ2nhaEtXrDzwKWJ2Zv1/evpXi2HRKZt7cYIiHZCVx6ZwKzFQDVOl7wIMBIuL4iNgOTAGvAd7d8wiH14Mp/i8AyMxdwM3l7eqhss330cBHm45lkEXE0RTHpBvLn58N7M3Mv2s0MKk7Djb+/j0wGhHnltXDFwPfBbb1PMrhdmtE/CIiri67e9RFC8eABR59gNu1RPbz+kfr3eW/Z/Q0qEUYazqAAbIW2Lngth3AEQCZ+TNgQ0RsAn4PsILVO2uBOxbcVv/fqKdeAPxTZv606UAGVUSMA9cCH8nMmyLiCIpWl8c3G5nUNQcbfyeBzwL/l+LD2XbgSWkbVa/cCZxNkZhvpmgLvhZ4YoMxDbSFY8CC+x4CXEnR+qgu2M8YfB3wyYj4IMXlZlcCCaxpMMy2WElcOvcC6xbcto5igKpl5t3AR4C/iQiT9N5o6/9GPfECive/uiAiRoBrKK7NekV581uAazLzlobCkrrtYMf43wUuo6gqrgCeD3ypXyaO6HeZeW9m3pCZM5l5O8Vx6QnlySstsQOMAdV9p1BU1v8wM/+pgfAG3v5e//LSjjdTnKy6pfyaBH7RSJAdMElcOj8ExiLiAS23PZT9l/THgKP4zUFN3XEjxf8FUF+TcjK2W/RURPwXiomb/rrpWAZRRATFpBxHAxdm5nR51/nAH0TEtojYBhxHcUH96xoKVVpqBxt/zwS+lJk/zMy5zLyOYvKm83ofpigqKODnzyV3kDGgutTjq8DbMvOahkIcaAd7/TPzfZn5gMw8miJZHAN+0Eyk7fOPdImU17l9DvjjiJgoPxA/HbgmIp4ZEadFxEhEHAm8B/hOWVXUEomIsYhYBYxSXIOyqqzWfh44IyIuLO+/Evi+k9YsrYO8/pUXAp/NTCu43fEB4EHA0zJzquX28ymufTiz/LoNeClF25fU9w42/gLfBp4SESdF4fEU1wot+w9o/eRAx//yWtDq889mismzrs/MHc1GPJD2OwZEseTaPwJ/npkfbCq4IXCg139VRJxRHn+Op5hp9n9n5j1NBdouk8SldQWwGvg1xfS2L8/MG4FjgOsoysv/BswBz2gqyAH2RoqJgV5P0VI0BbwxM+8ALgTeQTED3rnAc5sKcoDt9/WH4iAJXIStpl1RniV+KUUSuC3m1yO7JDPvysxt1RcwC9yTmfc2GbO0xA40/n4U+CRwPcV1i+8FXupJwiV3oOP/Scx//vkBsBe4uKEYB9bBxgDgcor/h7e03O7xfwkd4vVfBXycoi3+n4FvUizJtuy5BIYkSZIkqWYlUZIkSZJUM0mUJEmSJNVMEiVJkiRJNZNESZIkSVLNJFGSJEmSVDNJlCRJkiTVTBIlSZIkSTWTREmSJElSzSRRkiRJklQzSZQkSZIk1UwSJUmSJEk1k0RJkiRJUs0kUZIkSZJUM0mUJEmSJNVMEiVJkiRJNZNESZIkSVLNJFGSJEmSVDNJlCRJkiTVTBIlSZIkSTWTREmSJElSzSRRkiRJklQzSZQkSZIk1QYqSYyIWyLi1xEx0XLb5RFxfYNhSZIGTDneTEXEZERsj4hvRMTLImKgxlVJ0nAaxMFsFPjDpoOQJA28p2XmEcAJwLuA1wFXNRuSJEmHbxCTxD8FXhMRGxbeERHnRcS3I2JH+e955e3PiYgbFmz7qoj4296ELEnqV5m5IzP/FngO8MKIOCMiVkbE/4yIn0XE7RHxwYhYXe0TEU+PiO9GxM6IuDkifqe530CSpPsaxCTxBuB64DWtN0bEJuDLwHuBzcB7gC9HxGbgi8BpEfGAll2eB3y8FwFLkvpfZv4z8Avgtykqi6cCZwKnAMcAVwJExDnAR4E/AjYAjwZu6XW8kiQdyCAmiVAMxK+MiCNbbnsK8KPMvCYzZzLzE8BNFO1Cu4G/AS4GKJPFBwJWEiVJnbgN2AS8BHhVZt6dmZPAO4Hnltv8LvBXmfmVzJzLzF9m5k0NxStJ0m8YyCQxM38AfAl4fcvNW4FbF2x6K8XZXSiqhheX3z8P+EKZPEqS1K5jgDFgDfAv5aQ224HrgOrE5XHAzc2EJ0nSoQ1kklh6M/B7zCeBt1FMLtDqeOCX5fdfAY6MiDMpkkVbTSVJbYuIsynGnC8AU8CDM3ND+bU+M9eWm/4cOLmhMCVJOqSBTRIz88fAp4A/KG/6O+DUiHheRIxFxHOA0ykqjmTmNPAZiolvNlEkjZIkHVRErIuIpwKfBD6Wmd8DPgz8WUQcVW5zTEQ8sdzlKuCyiDg/IkbK+x7YTPSSJP2mgU0SS38MTABk5l3AU4FXA3cBrwWempl3tmz/ceAC4DOZOdPjWCVJ/eWLETFJURn87xQTol1W3vc64MfAtyJiJ/BV4DSoJ7i5DPgzYAfwdX6z00WSpMZEZjYdgyRJkiRpmRj0SqIkSZIkqQMmiZIkSZKkmkmiJEmSJKlmkihJkiRJqpkkSpIkSZJqfZ0kRsTKiLgqIm6NiMmI+G5EPKnl/vMj4qaI2B0RX4uIE1ruuygivlHed/1BnuMFEZERcXmXfx1JkiRJalxfJ4nAGMX6VI8B1gNvBD4dESdGxBbgc8CbgE3ADcCnWva9G/hfwLsO9OARsRF4A3BjN4KXJEmSpOVm4NZJjIjvA28FNgMvyszzytsngDuBszLzppbtLween5mP3c9jfRD4PnAR8LHM/Mvu/waSJEmS1Jx+ryTeR0QcDZxKUfl7MPC96r7M3AXcXN7ezmOdAzwC+ODSRypJkiRJy9PAJIkRMQ5cC3ykrBSuBXYs2GwHcEQbjzUKvB94RWbOLXWskiRJkrRcDUSSGBEjwDXAPuAV5c33AusWbLoOmGzjIa8Avp+Z31qyICVJkiSpD4w1HcDhiogArgKOBp6cmdPlXTcCL2zZbgI4mfYmoTkfeExEPLn8eRNwVkScmZmvOMh+kiRJktTX+j5JBD4APAi4IDOnWm7/PPCnEXEh8GXgSorq4E1Qt5SOU7wGIxGxCpgtk8wXAataHutzwF9TJKOSJEmSNLD6ut20XPfwpcCZwLaIuLf8uiQz7wAuBN4B3AOcCzy3ZfdLgSmKJPO3y+8/DJCZ2zNzW/VF0ca6MzMXXuMoSZIkSQNl4JbAkCRJkiQtXl9XEiVJkiRJS8skUZIkSZJUM0mUJEmSJNVMEiVJkiRJNZNESZIkSVLNJFGSJEmSVDNJlCQJiIjjy7V2R5uORZKkJpkkSpKGVkTcEhEXAGTmzzJzbWbO9vD5HxsRv+jV80mS1A6TREmSJElSzSRRkjSUIuIa4Hjgi2Wb6WsjIiNirLz/+oh4e0R8o7z/ixGxOSKujYidEfHtiDix5fEeGBFfiYi7I+I/IuKilvueHBH/HhGTEfHLiHhNREwAfw9sLR//3ojYGhHnRMQ3I2J7RPwqIv48Ila0PFZGxBUR8aPy8d4WESeXce6MiE9X21eVyoh4Q0TcWVZOL+nRSyxJ6lMmiZKkoZSZlwI/A56WmWuBT+9ns+cClwLHACcD3wSuBjYB/w94M0CZ8H0F+DhwVLnf+yPi9PJxrgJemplHAGcA/5iZu4AnAbeVba5rM/M2YBZ4FbAFeBRwPnDFgrieCDwceCTwWuBDwPOB48rHv7hl2/uVj3UM8ELgQxFxWkcvliRpqJgkSpJ0YFdn5s2ZuYOi6ndzZn41M2eAzwBnlds9FbglM6/OzJnM/A7wWeDZ5f3TwOkRsS4z78nMfz3QE2bmv2Tmt8rHuQX4C+AxCzZ7d2buzMwbgR8A/5CZP2mJ86wF278pM/dm5teBLwMXIUnSAZgkSpJ0YLe3fD+1n5/Xlt+fAJxbtohuj4jtwCUUVTyAC4EnA7dGxNcj4lEHesKIODUivhQR2yJiJ/BOikrgYuICuKesWlZuBbYe6PklSTJJlCQNs1yix/k58PXM3NDytTYzXw6Qmd/OzKdTtKJ+gfnW1v09/weAm4AHZOY64A1AHEZsG8t22MrxwG2H8XiSpAFnkihJGma3AyctweN8CTg1Ii6NiPHy6+yIeFBErIiISyJifWZOAzuBuZbn3xwR61se64hym3sj4oHAy5cgvreWcfw2RWvsZ5bgMSVJA8okUZI0zP4EeGPZHvqsxT5IZk4CT6CYsOY2YBvwP4CV5SaXAreU7aMvo2hFJTNvAj4B/KRsU90KvAZ4HjAJfBj41GLjKm0D7injuhZ4Wfm8kiTtV2QuVaeNJElaTiLiscDHMvPYhkORJPURK4mSJEmSpJpJoiRJkiSpZrupJEmSJKlmJVGSJEmSVDNJlCRJkiTVTBIlSZIkSTWTREmSJElSzSRRkiRJklQzSZQkSZIk1f4/WCe+dKm1/scAAAAASUVORK5CYII=\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \\\n", - " .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \\\n", - " .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "XbFTqBw6G1Ch" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora, precisa preparar os dados para treino, realizando a filtragem e a escalagem dos seus dados.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cYivRdQpHDj3", - "outputId": "a138f746-461c-4fd6-bfa6-0cee094c4aa1" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Training data shape: (1416, 1)\n", - "Test data shape: (48, 1)\n" - ] - } - ], - "source": [ - "train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']]\n", - "test = energy.copy()[energy.index >= test_start_dt][['load']]\n", - "\n", - "print('Training data shape: ', train.shape)\n", - "print('Test data shape: ', test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Escalone os dados para estarem no intervalo (0, 1).\n" - ] - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "3DNntGQnZX8G", - "outputId": "210046bc-7a66-4ccd-d70d-aa4a7309949c" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-11-01 00:00:000.101611
2014-11-01 01:00:000.065801
2014-11-01 02:00:000.046106
2014-11-01 03:00:000.042525
2014-11-01 04:00:000.059087
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-11-01 00:00:00 0.101611\n", - "2014-11-01 01:00:00 0.065801\n", - "2014-11-01 02:00:00 0.046106\n", - "2014-11-01 03:00:00 0.042525\n", - "2014-11-01 04:00:00 0.059087" - ] - }, - "execution_count": 8, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "scaler = MinMaxScaler()\n", - "train['load'] = scaler.fit_transform(train)\n", - "train.head(5)" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 206 - }, - "id": "26Yht-rzZexe", - "outputId": "20326077-a38a-4e78-cc5b-6fd7af95d301" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2014-12-30 00:00:000.329454
2014-12-30 01:00:000.290063
2014-12-30 02:00:000.273948
2014-12-30 03:00:000.268129
2014-12-30 04:00:000.302596
\n", - "
" - ], - "text/plain": [ - " load\n", - "2014-12-30 00:00:00 0.329454\n", - "2014-12-30 01:00:00 0.290063\n", - "2014-12-30 02:00:00 0.273948\n", - "2014-12-30 03:00:00 0.268129\n", - "2014-12-30 04:00:00 0.302596" - ] - }, - "execution_count": 9, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "test['load'] = scaler.transform(test)\n", - "test.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "x0n6jqxOQ41Z" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "fdmxTZtOQ8xs" - }, - "source": [ - "Para o nosso SVR, transformamos os dados de entrada para terem a forma `[batch, timesteps]`. Assim, remodelamos os dados existentes `train_data` e `test_data` de modo a que haja uma nova dimensão que se refere aos timesteps. No nosso exemplo, consideramos `timesteps = 5`. Assim, as entradas para o modelo são os dados dos primeiros 4 timesteps, e a saída será os dados do 5º timestep.\n" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": { - "id": "Rpju-Sc2HFm0" - }, - "outputs": [], - "source": [ - "# Converting to numpy arrays\n", - "\n", - "train_data = train.values\n", - "test_data = test.values" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [], - "source": [ - "# Selecting the timesteps\n", - "\n", - "timesteps=5" - ] - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "O-JrsrsVJhUQ", - "outputId": "c90dbe71-bacc-4ec4-b452-f82fe5aefaef" - }, - "outputs": [ - { - "data": { - "text/plain": [ - "(1412, 5)" - ] - }, - "execution_count": 12, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Converting data to 2D tensor\n", - "\n", - "train_data_timesteps=np.array([[j for j in train_data[i:i+timesteps]] for i in range(0,len(train_data)-timesteps+1)])[:,:,0]\n", - "train_data_timesteps.shape" - ] - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "exJD8AI7KE4g", - "outputId": "ce90260c-f327-427d-80f2-77307b5a6318" - }, - "outputs": [ - { - "data": { - "text/plain": [ - "(44, 5)" - ] - }, - "execution_count": 13, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Converting test data to 2D tensor\n", - "\n", - "test_data_timesteps=np.array([[j for j in test_data[i:i+timesteps]] for i in range(0,len(test_data)-timesteps+1)])[:,:,0]\n", - "test_data_timesteps.shape" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": { - "id": "2u0R2sIsLuq5" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(1412, 4) (1412, 1)\n", - "(44, 4) (44, 1)\n" - ] - } - ], - "source": [ - "x_train, y_train = train_data_timesteps[:,:timesteps-1],train_data_timesteps[:,[timesteps-1]]\n", - "x_test, y_test = test_data_timesteps[:,:timesteps-1],test_data_timesteps[:,[timesteps-1]]\n", - "\n", - "print(x_train.shape, y_train.shape)\n", - "print(x_test.shape, y_test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8wIPOtAGLZlh" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": { - "id": "EhA403BEPEiD" - }, - "outputs": [], - "source": [ - "# Create model using RBF kernel\n", - "\n", - "model = SVR(kernel='rbf',gamma=0.5, C=10, epsilon = 0.05)" - ] - }, - { - "cell_type": "code", - "execution_count": 16, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "GS0UA3csMbqp", - "outputId": "d86b6f05-5742-4c1d-c2db-c40510bd4f0d" - }, - "outputs": [ - { - "data": { - "text/plain": [ - "SVR(C=10, cache_size=200, coef0=0.0, degree=3, epsilon=0.05, gamma=0.5,\n", - " kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False)" - ] - }, - "execution_count": 16, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# Fit model on training data\n", - "\n", - "model.fit(x_train, y_train[:,0])" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Rz_x8S3UrlcF" - }, - "source": [ - "### Fazer previsão do modelo\n" - ] - }, - { - "cell_type": "code", - "execution_count": 17, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XR0gnt3MnuYS", - "outputId": "157e40ab-9a23-4b66-a885-0d52a24b2364" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "(1412, 1) (44, 1)\n" - ] - } - ], - "source": [ - "# Making predictions\n", - "\n", - "y_train_pred = model.predict(x_train).reshape(-1,1)\n", - "y_test_pred = model.predict(x_test).reshape(-1,1)\n", - "\n", - "print(y_train_pred.shape, y_test_pred.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "_2epncg-SGzr" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": 18, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "1412 44\n" - ] - } - ], - "source": [ - "# Scaling the predictions\n", - "\n", - "y_train_pred = scaler.inverse_transform(y_train_pred)\n", - "y_test_pred = scaler.inverse_transform(y_test_pred)\n", - "\n", - "print(len(y_train_pred), len(y_test_pred))" - ] - }, - { - "cell_type": "code", - "execution_count": 19, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xmm_YLXhq7gV", - "outputId": "18392f64-4029-49ac-c71a-a4e2411152a1" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "1412 44\n" - ] - } - ], - "source": [ - "# Scaling the original values\n", - "\n", - "y_train = scaler.inverse_transform(y_train)\n", - "y_test = scaler.inverse_transform(y_test)\n", - "\n", - "print(len(y_train), len(y_test))" - ] - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "u3LBj93coHEi", - "outputId": "d4fd49e8-8c6e-4bb0-8ef9-ca0b26d725b4" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "1412 44\n" - ] - } - ], - "source": [ - "# Extract the timesteps for x-axis\n", - "\n", - "train_timestamps = energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)].index[timesteps-1:]\n", - "test_timestamps = energy[test_start_dt:].index[timesteps-1:]\n", - "\n", - "print(len(train_timestamps), len(test_timestamps))" - ] - }, - { - "cell_type": "code", - "execution_count": 21, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.figure(figsize=(25,6))\n", - "plt.plot(train_timestamps, y_train, color = 'red', linewidth=2.0, alpha = 0.6)\n", - "plt.plot(train_timestamps, y_train_pred, color = 'blue', linewidth=0.8)\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.title(\"Training data prediction\")\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "LnhzcnYtXHCm", - "outputId": "f5f0d711-f18b-4788-ad21-d4470ea2c02b" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "MAPE for training data: 1.7195710200875551 %\n" - ] - } - ], - "source": [ - "print('MAPE for training data: ', mape(y_train_pred, y_train)*100, '%')" - ] - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 225 - }, - "id": "53Q02FoqQH4V", - "outputId": "53e2d59b-5075-4765-ad9e-aed56c966583" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.figure(figsize=(10,3))\n", - "plt.plot(test_timestamps, y_test, color = 'red', linewidth=2.0, alpha = 0.6)\n", - "plt.plot(test_timestamps, y_test_pred, color = 'blue', linewidth=0.8)\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 24, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "clOAUH-SXCJG", - "outputId": "a3aa85ff-126a-4a4a-cd9e-90b9cc465ef5" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "MAPE for testing data: 1.2623790187854018 %\n" - ] - } - ], - "source": [ - "print('MAPE for testing data: ', mape(y_test_pred, y_test)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "DHlKvVCId5ue" - }, - "source": [ - "## Previsão do conjunto de dados completo\n" - ] - }, - { - "cell_type": "code", - "execution_count": 25, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cOFJ45vreO0N", - "outputId": "35628e33-ecf9-4966-8036-f7ea86db6f16" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "Tensor shape: (26300, 5)\n", - "X shape: (26300, 4) \n", - "Y shape: (26300, 1)\n" - ] - } - ], - "source": [ - "# Extracting load values as numpy array\n", - "data = energy.copy().values\n", - "\n", - "# Scaling\n", - "data = scaler.transform(data)\n", - "\n", - "# Transforming to 2D tensor as per model input requirement\n", - "data_timesteps=np.array([[j for j in data[i:i+timesteps]] for i in range(0,len(data)-timesteps+1)])[:,:,0]\n", - "print(\"Tensor shape: \", data_timesteps.shape)\n", - "\n", - "# Selecting inputs and outputs from data\n", - "X, Y = data_timesteps[:,:timesteps-1],data_timesteps[:,[timesteps-1]]\n", - "print(\"X shape: \", X.shape,\"\\nY shape: \", Y.shape)" - ] - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": { - "id": "ESSAdQgwexIi" - }, - "outputs": [], - "source": [ - "# Make model predictions\n", - "Y_pred = model.predict(X).reshape(-1,1)\n", - "\n", - "# Inverse scale and reshape\n", - "Y_pred = scaler.inverse_transform(Y_pred)\n", - "Y = scaler.inverse_transform(Y)" - ] - }, - { - "cell_type": "code", - "execution_count": 27, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 328 - }, - "id": "M_qhihN0RVVX", - "outputId": "a89cb23e-1d35-437f-9d63-8b8907e12f80" - }, - "outputs": [ - { - "data": { - "image/png": "\n", - "text/plain": [ - "
" - ] - }, - "metadata": { - "needs_background": "light" - }, - "output_type": "display_data" - } - ], - "source": [ - "plt.figure(figsize=(30,8))\n", - "plt.plot(Y, color = 'red', linewidth=2.0, alpha = 0.6)\n", - "plt.plot(Y_pred, color = 'blue', linewidth=1)\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": 28, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "AcN7pMYXVGTK", - "outputId": "7e1c2161-47ce-496c-9d86-7ad9ae0df770" - }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "MAPE: 2.0572089029888656 %\n" - ] - } - ], - "source": [ - "print('MAPE: ', mape(Y_pred, Y)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "accelerator": "GPU", - "colab": { - "collapsed_sections": [], - "name": "Recurrent_Neural_Networks.ipynb", - "provenance": [] - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - }, - "coopTranslator": { - "original_hash": "f8f3967282314d3995245835bdaa8418", - "translation_date": "2025-09-03T19:58:23+00:00", - "source_file": "7-TimeSeries/3-SVR/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/3-SVR/working/notebook.ipynb b/translations/pt/7-TimeSeries/3-SVR/working/notebook.ipynb deleted file mode 100644 index d0c793358..000000000 --- a/translations/pt/7-TimeSeries/3-SVR/working/notebook.ipynb +++ /dev/null @@ -1,695 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "fv9OoQsMFk5A" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Neste caderno, demonstramos como:\n", - "\n", - "- preparar dados de séries temporais 2D para treinar um modelo de regressão SVM \n", - "- implementar SVR utilizando o kernel RBF \n", - "- avaliar o modelo utilizando gráficos e MAPE \n" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## Importar módulos\n" - ] - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import sys\n", - "sys.path.append('../../')" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": { - "id": "M687KNlQFp0-" - }, - "outputs": [], - "source": [ - "import os\n", - "import warnings\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import pandas as pd\n", - "import datetime as dt\n", - "import math\n", - "\n", - "from sklearn.svm import SVR\n", - "from sklearn.preprocessing import MinMaxScaler\n", - "from common.utils import load_data, mape" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Cj-kfVdMGjWP" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8fywSjC6GsRz" - }, - "source": [ - "### Carregar dados\n" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "aBDkEB11Fumg", - "outputId": "99cf7987-0509-4b73-8cc2-75d7da0d2740" - }, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
load
2012-01-01 00:00:002698.0
2012-01-01 01:00:002558.0
2012-01-01 02:00:002444.0
2012-01-01 03:00:002402.0
2012-01-01 04:00:002403.0
\n", - "
" - ], - "text/plain": [ - " load\n", - "2012-01-01 00:00:00 2698.0\n", - "2012-01-01 01:00:00 2558.0\n", - "2012-01-01 02:00:00 2444.0\n", - "2012-01-01 03:00:00 2402.0\n", - "2012-01-01 04:00:00 2403.0" - ] - }, - "execution_count": 3, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "energy = load_data('../../data')[['load']]\n", - "energy.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "O0BWP13rGnh4" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 486 - }, - "id": "hGaNPKu_Gidk", - "outputId": "7f89b326-9057-4f49-efbe-cb100ebdf76d" - }, - "outputs": [], - "source": [ - "energy.plot(y='load', subplots=True, figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "IPuNor4eGwYY" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "ysvsNyONGt0Q" - }, - "outputs": [], - "source": [ - "train_start_dt = '2014-11-01 00:00:00'\n", - "test_start_dt = '2014-12-30 00:00:00'" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 548 - }, - "id": "SsfdLoPyGy9w", - "outputId": "d6d6c25b-b1f4-47e5-91d1-707e043237d7" - }, - "outputs": [], - "source": [ - "energy[(energy.index < test_start_dt) & (energy.index >= train_start_dt)][['load']].rename(columns={'load':'train'}) \\\n", - " .join(energy[test_start_dt:][['load']].rename(columns={'load':'test'}), how='outer') \\\n", - " .plot(y=['train', 'test'], figsize=(15, 8), fontsize=12)\n", - "plt.xlabel('timestamp', fontsize=12)\n", - "plt.ylabel('load', fontsize=12)\n", - "plt.show()" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "XbFTqBw6G1Ch" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Agora, precisa preparar os dados para treino, realizando a filtragem e a escalagem dos seus dados.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cYivRdQpHDj3", - "outputId": "a138f746-461c-4fd6-bfa6-0cee094c4aa1" - }, - "outputs": [], - "source": [ - "train = energy.copy()[(energy.index >= train_start_dt) & (energy.index < test_start_dt)][['load']]\n", - "test = energy.copy()[energy.index >= test_start_dt][['load']]\n", - "\n", - "print('Training data shape: ', train.shape)\n", - "print('Test data shape: ', test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "Escalone os dados para estarem no intervalo (0, 1).\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 363 - }, - "id": "3DNntGQnZX8G", - "outputId": "210046bc-7a66-4ccd-d70d-aa4a7309949c" - }, - "outputs": [], - "source": [ - "scaler = MinMaxScaler()\n", - "train['load'] = scaler.fit_transform(train)\n", - "train.head(5)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 206 - }, - "id": "26Yht-rzZexe", - "outputId": "20326077-a38a-4e78-cc5b-6fd7af95d301" - }, - "outputs": [], - "source": [ - "test['load'] = scaler.transform(test)\n", - "test.head(5)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "x0n6jqxOQ41Z" - }, - "source": [] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "fdmxTZtOQ8xs" - }, - "source": [ - "Para o nosso SVR, transformamos os dados de entrada para terem a forma `[batch, timesteps]`. Assim, remodelamos os dados existentes `train_data` e `test_data` de modo a que haja uma nova dimensão que se refere aos timesteps. No nosso exemplo, consideramos `timesteps = 5`. Assim, as entradas para o modelo são os dados dos primeiros 4 timesteps, e a saída será os dados do 5º timestep.\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "Rpju-Sc2HFm0" - }, - "outputs": [], - "source": [ - "# Converting to numpy arrays\n", - "\n", - "train_data = train.values\n", - "test_data = test.values" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# Selecting the timesteps\n", - "\n", - "timesteps=None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "O-JrsrsVJhUQ", - "outputId": "c90dbe71-bacc-4ec4-b452-f82fe5aefaef" - }, - "outputs": [], - "source": [ - "# Converting data to 2D tensor\n", - "\n", - "train_data_timesteps=None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "exJD8AI7KE4g", - "outputId": "ce90260c-f327-427d-80f2-77307b5a6318" - }, - "outputs": [], - "source": [ - "# Converting test data to 2D tensor\n", - "\n", - "test_data_timesteps=None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "2u0R2sIsLuq5" - }, - "outputs": [], - "source": [ - "x_train, y_train = None\n", - "x_test, y_test = None\n", - "\n", - "print(x_train.shape, y_train.shape)\n", - "print(x_test.shape, y_test.shape)" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "8wIPOtAGLZlh" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "EhA403BEPEiD" - }, - "outputs": [], - "source": [ - "# Create model using RBF kernel\n", - "\n", - "model = None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "GS0UA3csMbqp", - "outputId": "d86b6f05-5742-4c1d-c2db-c40510bd4f0d" - }, - "outputs": [], - "source": [ - "# Fit model on training data" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "Rz_x8S3UrlcF" - }, - "source": [ - "### Fazer previsão do modelo\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XR0gnt3MnuYS", - "outputId": "157e40ab-9a23-4b66-a885-0d52a24b2364" - }, - "outputs": [], - "source": [ - "# Making predictions\n", - "\n", - "y_train_pred = None\n", - "y_test_pred = None" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "_2epncg-SGzr" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "# Scaling the predictions\n", - "\n", - "y_train_pred = scaler.inverse_transform(y_train_pred)\n", - "y_test_pred = scaler.inverse_transform(y_test_pred)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xmm_YLXhq7gV", - "outputId": "18392f64-4029-49ac-c71a-a4e2411152a1" - }, - "outputs": [], - "source": [ - "# Scaling the original values\n", - "\n", - "y_train = scaler.inverse_transform(y_train)\n", - "y_test = scaler.inverse_transform(y_test)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "u3LBj93coHEi", - "outputId": "d4fd49e8-8c6e-4bb0-8ef9-ca0b26d725b4" - }, - "outputs": [], - "source": [ - "# Extract the timesteps for x-axis\n", - "\n", - "train_timestamps = None\n", - "test_timestamps = None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "plt.figure(figsize=(25,6))\n", - "# plot original output\n", - "# plot predicted output\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.title(\"Training data prediction\")\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "LnhzcnYtXHCm", - "outputId": "f5f0d711-f18b-4788-ad21-d4470ea2c02b" - }, - "outputs": [], - "source": [ - "print('MAPE for training data: ', mape(y_train_pred, y_train)*100, '%')" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 225 - }, - "id": "53Q02FoqQH4V", - "outputId": "53e2d59b-5075-4765-ad9e-aed56c966583" - }, - "outputs": [], - "source": [ - "plt.figure(figsize=(10,3))\n", - "# plot original output\n", - "# plot predicted output\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "clOAUH-SXCJG", - "outputId": "a3aa85ff-126a-4a4a-cd9e-90b9cc465ef5" - }, - "outputs": [], - "source": [ - "print('MAPE for testing data: ', mape(y_test_pred, y_test)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": { - "id": "DHlKvVCId5ue" - }, - "source": [ - "## Previsão do conjunto de dados completo\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cOFJ45vreO0N", - "outputId": "35628e33-ecf9-4966-8036-f7ea86db6f16" - }, - "outputs": [], - "source": [ - "# Extracting load values as numpy array\n", - "data = None\n", - "\n", - "# Scaling\n", - "data = None\n", - "\n", - "# Transforming to 2D tensor as per model input requirement\n", - "data_timesteps=None\n", - "\n", - "# Selecting inputs and outputs from data\n", - "X, Y = None, None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "ESSAdQgwexIi" - }, - "outputs": [], - "source": [ - "# Make model predictions\n", - "\n", - "# Inverse scale and reshape\n", - "Y_pred = None\n", - "Y = None" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 328 - }, - "id": "M_qhihN0RVVX", - "outputId": "a89cb23e-1d35-437f-9d63-8b8907e12f80" - }, - "outputs": [], - "source": [ - "plt.figure(figsize=(30,8))\n", - "# plot original output\n", - "# plot predicted output\n", - "plt.legend(['Actual','Predicted'])\n", - "plt.xlabel('Timestamp')\n", - "plt.show()" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "AcN7pMYXVGTK", - "outputId": "7e1c2161-47ce-496c-9d86-7ad9ae0df770" - }, - "outputs": [], - "source": [ - "print('MAPE: ', mape(Y_pred, Y)*100, '%')" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ], - "metadata": { - "accelerator": "GPU", - "colab": { - "collapsed_sections": [], - "name": "Recurrent_Neural_Networks.ipynb", - "provenance": [] - }, - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.1" - }, - "coopTranslator": { - "original_hash": "e86ce102239a14c44585623b9b924a74", - "translation_date": "2025-09-03T20:00:30+00:00", - "source_file": "7-TimeSeries/3-SVR/working/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 1 -} \ No newline at end of file diff --git a/translations/pt/7-TimeSeries/README.md b/translations/pt/7-TimeSeries/README.md deleted file mode 100644 index 0d1720df9..000000000 --- a/translations/pt/7-TimeSeries/README.md +++ /dev/null @@ -1,37 +0,0 @@ - -# Introdução à previsão de séries temporais - -O que é previsão de séries temporais? Trata-se de prever eventos futuros analisando tendências do passado. - -## Tema regional: consumo mundial de eletricidade ✨ - -Nestes dois módulos, será introduzido o conceito de previsão de séries temporais, uma área um pouco menos conhecida do machine learning, mas que é extremamente valiosa para aplicações na indústria e nos negócios, entre outros campos. Embora redes neurais possam ser usadas para aumentar a utilidade desses modelos, vamos estudá-los no contexto do machine learning clássico, já que esses modelos ajudam a prever o desempenho futuro com base no passado. - -O nosso foco regional é o consumo de eletricidade no mundo, um conjunto de dados interessante para aprender a prever o consumo futuro de energia com base nos padrões de carga do passado. É possível perceber como este tipo de previsão pode ser extremamente útil em ambientes empresariais. - -![rede elétrica](../../../translated_images/pt-PT/electric-grid.0c21d5214db09ffa.webp) - -Foto de [Peddi Sai hrithik](https://unsplash.com/@shutter_log?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText) de torres elétricas numa estrada em Rajasthan no [Unsplash](https://unsplash.com/s/photos/electric-india?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText) - -## Módulos - -1. [Introdução à previsão de séries temporais](1-Introduction/README.md) -2. [Construção de modelos ARIMA para séries temporais](2-ARIMA/README.md) -3. [Construção de um Support Vector Regressor para previsão de séries temporais](3-SVR/README.md) - -## Créditos - -"A introdução à previsão de séries temporais" foi escrita com ⚡️ por [Francesca Lazzeri](https://twitter.com/frlazzeri) e [Jen Looper](https://twitter.com/jenlooper). Os notebooks foram publicados pela primeira vez online no [repositório "Deep Learning For Time Series" da Azure](https://github.com/Azure/DeepLearningForTimeSeriesForecasting), originalmente escrito por Francesca Lazzeri. O módulo sobre SVR foi escrito por [Anirban Mukherjee](https://github.com/AnirbanMukherjeeXD). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/README.md b/translations/pt/8-Reinforcement/1-QLearning/README.md deleted file mode 100644 index eb6eef2cd..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/README.md +++ /dev/null @@ -1,256 +0,0 @@ - -# Introdução ao Aprendizado por Reforço e Q-Learning - -![Resumo do reforço em aprendizagem de máquina em um sketchnote](../../../../sketchnotes/ml-reinforcement.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -O aprendizado por reforço envolve três conceitos importantes: o agente, alguns estados e um conjunto de ações por estado. Ao executar uma ação em um estado específico, o agente recebe uma recompensa. Imagine novamente o jogo de computador Super Mario. Você é o Mario, está em um nível do jogo, ao lado de um precipício. Acima de você há uma moeda. Você, sendo o Mario, em um nível do jogo, em uma posição específica... esse é o seu estado. Mover um passo para a direita (uma ação) fará com que você caia no precipício, o que lhe dará uma pontuação numérica baixa. No entanto, pressionar o botão de salto permitirá que você marque um ponto e continue vivo. Esse é um resultado positivo e deve lhe conceder uma pontuação numérica positiva. - -Usando aprendizado por reforço e um simulador (o jogo), você pode aprender a jogar para maximizar a recompensa, que é permanecer vivo e marcar o máximo de pontos possível. - -[![Introdução ao Aprendizado por Reforço](https://img.youtube.com/vi/lDq_en8RNOo/0.jpg)](https://www.youtube.com/watch?v=lDq_en8RNOo) - -> 🎥 Clique na imagem acima para ouvir Dmitry falar sobre Aprendizado por Reforço - -## [Quiz pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Pré-requisitos e Configuração - -Nesta lição, vamos experimentar algum código em Python. Você deve ser capaz de executar o código do Jupyter Notebook desta lição, seja no seu computador ou em algum lugar na nuvem. - -Você pode abrir [o notebook da lição](https://github.com/microsoft/ML-For-Beginners/blob/main/8-Reinforcement/1-QLearning/notebook.ipynb) e seguir esta lição para construir. - -> **Nota:** Se você estiver abrindo este código na nuvem, também precisará buscar o arquivo [`rlboard.py`](https://github.com/microsoft/ML-For-Beginners/blob/main/8-Reinforcement/1-QLearning/rlboard.py), que é usado no código do notebook. Adicione-o ao mesmo diretório que o notebook. - -## Introdução - -Nesta lição, vamos explorar o mundo de **[Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf)**, inspirado por um conto musical de fadas de um compositor russo, [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). Usaremos **Aprendizado por Reforço** para permitir que Pedro explore seu ambiente, recolha maçãs saborosas e evite encontrar o lobo. - -**Aprendizado por Reforço** (RL) é uma técnica de aprendizado que nos permite aprender um comportamento ideal de um **agente** em algum **ambiente** ao realizar muitos experimentos. Um agente nesse ambiente deve ter algum **objetivo**, definido por uma **função de recompensa**. - -## O ambiente - -Para simplificar, vamos considerar o mundo de Pedro como um tabuleiro quadrado de tamanho `largura` x `altura`, como este: - -![Ambiente de Pedro](../../../../8-Reinforcement/1-QLearning/images/environment.png) - -Cada célula neste tabuleiro pode ser: - -* **chão**, onde Pedro e outras criaturas podem caminhar. -* **água**, onde obviamente não se pode caminhar. -* uma **árvore** ou **grama**, um lugar onde se pode descansar. -* uma **maçã**, que representa algo que Pedro ficaria feliz em encontrar para se alimentar. -* um **lobo**, que é perigoso e deve ser evitado. - -Há um módulo Python separado, [`rlboard.py`](https://github.com/microsoft/ML-For-Beginners/blob/main/8-Reinforcement/1-QLearning/rlboard.py), que contém o código para trabalhar com este ambiente. Como este código não é importante para entender nossos conceitos, vamos importar o módulo e usá-lo para criar o tabuleiro de exemplo (bloco de código 1): - -```python -from rlboard import * - -width, height = 8,8 -m = Board(width,height) -m.randomize(seed=13) -m.plot() -``` - -Este código deve imprimir uma imagem do ambiente semelhante à acima. - -## Ações e política - -No nosso exemplo, o objetivo de Pedro seria encontrar uma maçã, enquanto evita o lobo e outros obstáculos. Para isso, ele pode essencialmente andar por aí até encontrar uma maçã. - -Portanto, em qualquer posição, ele pode escolher entre uma das seguintes ações: cima, baixo, esquerda e direita. - -Definiremos essas ações como um dicionário e as mapearemos para pares de mudanças de coordenadas correspondentes. Por exemplo, mover para a direita (`R`) corresponderia ao par `(1,0)`. (bloco de código 2): - -```python -actions = { "U" : (0,-1), "D" : (0,1), "L" : (-1,0), "R" : (1,0) } -action_idx = { a : i for i,a in enumerate(actions.keys()) } -``` - -Resumindo, a estratégia e o objetivo deste cenário são os seguintes: - -- **A estratégia**, do nosso agente (Pedro) é definida por uma chamada **política**. Uma política é uma função que retorna a ação em qualquer estado dado. No nosso caso, o estado do problema é representado pelo tabuleiro, incluindo a posição atual do jogador. - -- **O objetivo**, do aprendizado por reforço é eventualmente aprender uma boa política que nos permita resolver o problema de forma eficiente. No entanto, como base, vamos considerar a política mais simples chamada **caminhada aleatória**. - -## Caminhada aleatória - -Vamos primeiro resolver nosso problema implementando uma estratégia de caminhada aleatória. Com a caminhada aleatória, escolheremos aleatoriamente a próxima ação entre as ações permitidas, até chegarmos à maçã (bloco de código 3). - -1. Implemente a caminhada aleatória com o código abaixo: - - ```python - def random_policy(m): - return random.choice(list(actions)) - - def walk(m,policy,start_position=None): - n = 0 # number of steps - # set initial position - if start_position: - m.human = start_position - else: - m.random_start() - while True: - if m.at() == Board.Cell.apple: - return n # success! - if m.at() in [Board.Cell.wolf, Board.Cell.water]: - return -1 # eaten by wolf or drowned - while True: - a = actions[policy(m)] - new_pos = m.move_pos(m.human,a) - if m.is_valid(new_pos) and m.at(new_pos)!=Board.Cell.water: - m.move(a) # do the actual move - break - n+=1 - - walk(m,random_policy) - ``` - - A chamada para `walk` deve retornar o comprimento do caminho correspondente, que pode variar de uma execução para outra. - -1. Execute o experimento de caminhada várias vezes (digamos, 100) e imprima as estatísticas resultantes (bloco de código 4): - - ```python - def print_statistics(policy): - s,w,n = 0,0,0 - for _ in range(100): - z = walk(m,policy) - if z<0: - w+=1 - else: - s += z - n += 1 - print(f"Average path length = {s/n}, eaten by wolf: {w} times") - - print_statistics(random_policy) - ``` - - Note que o comprimento médio de um caminho é em torno de 30-40 passos, o que é bastante, dado que a distância média até a maçã mais próxima é em torno de 5-6 passos. - - Você também pode ver como é o movimento de Pedro durante a caminhada aleatória: - - ![Caminhada Aleatória de Pedro](../../../../8-Reinforcement/1-QLearning/images/random_walk.gif) - -## Função de recompensa - -Para tornar nossa política mais inteligente, precisamos entender quais movimentos são "melhores" que outros. Para isso, precisamos definir nosso objetivo. - -O objetivo pode ser definido em termos de uma **função de recompensa**, que retornará algum valor de pontuação para cada estado. Quanto maior o número, melhor a função de recompensa. (bloco de código 5) - -```python -move_reward = -0.1 -goal_reward = 10 -end_reward = -10 - -def reward(m,pos=None): - pos = pos or m.human - if not m.is_valid(pos): - return end_reward - x = m.at(pos) - if x==Board.Cell.water or x == Board.Cell.wolf: - return end_reward - if x==Board.Cell.apple: - return goal_reward - return move_reward -``` - -Uma coisa interessante sobre funções de recompensa é que, na maioria dos casos, *só recebemos uma recompensa substancial no final do jogo*. Isso significa que nosso algoritmo deve, de alguma forma, lembrar os "bons" passos que levam a uma recompensa positiva no final e aumentar sua importância. Da mesma forma, todos os movimentos que levam a resultados ruins devem ser desencorajados. - -## Q-Learning - -O algoritmo que discutiremos aqui é chamado **Q-Learning**. Neste algoritmo, a política é definida por uma função (ou uma estrutura de dados) chamada **Q-Table**. Ela registra a "qualidade" de cada uma das ações em um estado dado. - -É chamada de Q-Table porque muitas vezes é conveniente representá-la como uma tabela ou matriz multidimensional. Como nosso tabuleiro tem dimensões `largura` x `altura`, podemos representar a Q-Table usando um array numpy com formato `largura` x `altura` x `len(actions)`: (bloco de código 6) - -```python -Q = np.ones((width,height,len(actions)),dtype=np.float)*1.0/len(actions) -``` - -Observe que inicializamos todos os valores da Q-Table com um valor igual, no nosso caso - 0.25. Isso corresponde à política de "caminhada aleatória", porque todos os movimentos em cada estado são igualmente bons. Podemos passar a Q-Table para a função `plot` para visualizar a tabela no tabuleiro: `m.plot(Q)`. - -![Ambiente de Pedro](../../../../8-Reinforcement/1-QLearning/images/env_init.png) - -No centro de cada célula há uma "seta" que indica a direção preferida de movimento. Como todas as direções são iguais, um ponto é exibido. - -Agora precisamos executar a simulação, explorar nosso ambiente e aprender uma melhor distribuição de valores da Q-Table, o que nos permitirá encontrar o caminho para a maçã muito mais rapidamente. - -## Essência do Q-Learning: Equação de Bellman - -Uma vez que começamos a nos mover, cada ação terá uma recompensa correspondente, ou seja, teoricamente podemos selecionar a próxima ação com base na maior recompensa imediata. No entanto, na maioria dos estados, o movimento não alcançará nosso objetivo de chegar à maçã, e assim não podemos decidir imediatamente qual direção é melhor. - -> Lembre-se de que não é o resultado imediato que importa, mas sim o resultado final, que obteremos no final da simulação. - -Para levar em conta essa recompensa atrasada, precisamos usar os princípios de **[programação dinâmica](https://en.wikipedia.org/wiki/Dynamic_programming)**, que nos permitem pensar sobre nosso problema de forma recursiva. - -Suponha que estamos agora no estado *s*, e queremos nos mover para o próximo estado *s'*. Ao fazer isso, receberemos a recompensa imediata *r(s,a)*, definida pela função de recompensa, mais alguma recompensa futura. Se supusermos que nossa Q-Table reflete corretamente a "atratividade" de cada ação, então no estado *s'* escolheremos uma ação *a* que corresponda ao valor máximo de *Q(s',a')*. Assim, a melhor recompensa futura possível que poderíamos obter no estado *s* será definida como `max` - -## Verificar a política - -Como a Q-Table lista a "atratividade" de cada ação em cada estado, é bastante fácil utilizá-la para definir a navegação eficiente no nosso mundo. No caso mais simples, podemos selecionar a ação correspondente ao valor mais alto da Q-Table: (bloco de código 9) - -```python -def qpolicy_strict(m): - x,y = m.human - v = probs(Q[x,y]) - a = list(actions)[np.argmax(v)] - return a - -walk(m,qpolicy_strict) -``` - -> Se experimentares o código acima várias vezes, podes notar que, por vezes, ele "fica preso", e precisas de pressionar o botão STOP no notebook para o interromper. Isto acontece porque podem existir situações em que dois estados "apontam" um para o outro em termos de valor ótimo de Q-Value, caso em que o agente acaba por se mover entre esses estados indefinidamente. - -## 🚀Desafio - -> **Tarefa 1:** Modifica a função `walk` para limitar o comprimento máximo do caminho a um certo número de passos (por exemplo, 100), e observa o código acima retornar este valor ocasionalmente. - -> **Tarefa 2:** Modifica a função `walk` para que não volte aos locais onde já esteve anteriormente. Isto evitará que o `walk` entre em loop, no entanto, o agente ainda pode acabar "preso" num local do qual não consegue escapar. - -## Navegação - -Uma política de navegação melhor seria aquela que utilizámos durante o treino, que combina exploração e aproveitamento. Nesta política, selecionamos cada ação com uma certa probabilidade, proporcional aos valores na Q-Table. Esta estratégia pode ainda resultar no agente voltar a uma posição que já explorou, mas, como podes ver no código abaixo, resulta num caminho médio muito curto até ao local desejado (lembra-te que `print_statistics` executa a simulação 100 vezes): (bloco de código 10) - -```python -def qpolicy(m): - x,y = m.human - v = probs(Q[x,y]) - a = random.choices(list(actions),weights=v)[0] - return a - -print_statistics(qpolicy) -``` - -Depois de executar este código, deverás obter um comprimento médio de caminho muito menor do que antes, na faixa de 3-6. - -## Investigar o processo de aprendizagem - -Como mencionámos, o processo de aprendizagem é um equilíbrio entre exploração e aproveitamento do conhecimento adquirido sobre a estrutura do espaço do problema. Vimos que os resultados da aprendizagem (a capacidade de ajudar um agente a encontrar um caminho curto até ao objetivo) melhoraram, mas também é interessante observar como o comprimento médio do caminho se comporta durante o processo de aprendizagem: - -## Resumo das aprendizagens: - -- **O comprimento médio do caminho aumenta**. O que vemos aqui é que, inicialmente, o comprimento médio do caminho aumenta. Isto provavelmente deve-se ao facto de que, quando não sabemos nada sobre o ambiente, é mais provável ficarmos presos em estados desfavoráveis, como água ou lobos. À medida que aprendemos mais e começamos a usar esse conhecimento, conseguimos explorar o ambiente por mais tempo, mas ainda não sabemos muito bem onde estão as maçãs. - -- **O comprimento do caminho diminui, à medida que aprendemos mais**. Quando aprendemos o suficiente, torna-se mais fácil para o agente alcançar o objetivo, e o comprimento do caminho começa a diminuir. No entanto, ainda estamos abertos à exploração, por isso frequentemente desviamos do melhor caminho e exploramos novas opções, tornando o caminho mais longo do que o ideal. - -- **O comprimento aumenta abruptamente**. O que também observamos neste gráfico é que, em determinado momento, o comprimento aumentou abruptamente. Isto indica a natureza estocástica do processo, e que podemos, em algum momento, "estragar" os coeficientes da Q-Table ao sobrescrevê-los com novos valores. Isto idealmente deve ser minimizado ao diminuir a taxa de aprendizagem (por exemplo, no final do treino, ajustamos os valores da Q-Table apenas por um valor pequeno). - -No geral, é importante lembrar que o sucesso e a qualidade do processo de aprendizagem dependem significativamente de parâmetros, como a taxa de aprendizagem, a diminuição da taxa de aprendizagem e o fator de desconto. Estes são frequentemente chamados de **hiperparâmetros**, para distingui-los dos **parâmetros**, que otimizamos durante o treino (por exemplo, os coeficientes da Q-Table). O processo de encontrar os melhores valores de hiperparâmetros é chamado de **otimização de hiperparâmetros**, e merece um tópico à parte. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Trabalho -[Um Mundo Mais Realista](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/assignment.md b/translations/pt/8-Reinforcement/1-QLearning/assignment.md deleted file mode 100644 index 72a0f0c3e..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/assignment.md +++ /dev/null @@ -1,41 +0,0 @@ - -# Um Mundo Mais Realista - -Na nossa situação, Peter conseguia mover-se quase sem se cansar ou sentir fome. Num mundo mais realista, ele teria de sentar-se e descansar de vez em quando, além de alimentar-se. Vamos tornar o nosso mundo mais realista, implementando as seguintes regras: - -1. Ao mover-se de um lugar para outro, Peter perde **energia** e ganha **fadiga**. -2. Peter pode recuperar energia ao comer maçãs. -3. Peter pode livrar-se da fadiga descansando debaixo de uma árvore ou na relva (ou seja, ao caminhar para uma localização no tabuleiro com uma árvore ou relva - campo verde). -4. Peter precisa encontrar e matar o lobo. -5. Para matar o lobo, Peter precisa ter certos níveis de energia e fadiga; caso contrário, ele perde a batalha. - -## Instruções - -Use o [notebook.ipynb](notebook.ipynb) original como ponto de partida para a sua solução. - -Modifique a função de recompensa acima de acordo com as regras do jogo, execute o algoritmo de aprendizagem por reforço para aprender a melhor estratégia para vencer o jogo e compare os resultados da caminhada aleatória com o seu algoritmo em termos de número de jogos ganhos e perdidos. - -> **Note**: No seu novo mundo, o estado é mais complexo e, além da posição do humano, também inclui os níveis de fadiga e energia. Pode optar por representar o estado como uma tupla (Tabuleiro, energia, fadiga), ou definir uma classe para o estado (também pode derivá-la de `Board`), ou até modificar a classe original `Board` dentro de [rlboard.py](../../../../8-Reinforcement/1-QLearning/rlboard.py). - -Na sua solução, mantenha o código responsável pela estratégia de caminhada aleatória e compare os resultados do seu algoritmo com a caminhada aleatória no final. - -> **Note**: Pode ser necessário ajustar os hiperparâmetros para que funcione, especialmente o número de épocas. Como o sucesso no jogo (lutar contra o lobo) é um evento raro, pode esperar um tempo de treino muito mais longo. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita Melhorar | -| --------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------ | -| | Um notebook é apresentado com a definição das novas regras do mundo, o algoritmo de Q-Learning e algumas explicações textuais. O Q-Learning consegue melhorar significativamente os resultados em comparação com a caminhada aleatória. | Um notebook é apresentado, o Q-Learning é implementado e melhora os resultados em comparação com a caminhada aleatória, mas não significativamente; ou o notebook está mal documentado e o código não está bem estruturado. | Alguma tentativa de redefinir as regras do mundo foi feita, mas o algoritmo de Q-Learning não funciona, ou a função de recompensa não está totalmente definida. | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/notebook.ipynb b/translations/pt/8-Reinforcement/1-QLearning/notebook.ipynb deleted file mode 100644 index 21f7f0804..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/notebook.ipynb +++ /dev/null @@ -1,412 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "17e5a668646eabf5aabd0e9bfcf17876", - "translation_date": "2025-09-03T20:44:28+00:00", - "source_file": "8-Reinforcement/1-QLearning/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Pedro e o Lobo: Introdução ao Aprendizado por Reforço\n", - "\n", - "Neste tutorial, vamos aprender como aplicar aprendizado por reforço a um problema de busca de caminhos. O cenário é inspirado no conto musical [Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf) do compositor russo [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). É uma história sobre o jovem pioneiro Pedro, que corajosamente sai de casa para a clareira da floresta para perseguir um lobo. Vamos treinar algoritmos de aprendizado de máquina que ajudarão Pedro a explorar a área ao redor e construir um mapa de navegação otimizado.\n", - "\n", - "Primeiro, vamos importar um conjunto de bibliotecas úteis:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random\n", - "import math" - ] - }, - { - "source": [ - "## Visão Geral do Aprendizagem por Reforço\n", - "\n", - "**Aprendizagem por Reforço** (RL) é uma técnica de aprendizagem que nos permite aprender o comportamento ideal de um **agente** em um determinado **ambiente** através da realização de muitos experimentos. Um agente neste ambiente deve ter algum **objetivo**, definido por uma **função de recompensa**.\n", - "\n", - "## O Ambiente\n", - "\n", - "Para simplificar, vamos considerar o mundo de Peter como um tabuleiro quadrado de tamanho `width` x `height`. Cada célula neste tabuleiro pode ser:\n", - "* **chão**, onde Peter e outras criaturas podem caminhar\n", - "* **água**, onde obviamente não se pode caminhar\n", - "* **uma árvore** ou **relva** - um lugar onde se pode descansar\n", - "* **uma maçã**, que representa algo que Peter ficaria feliz em encontrar para se alimentar\n", - "* **um lobo**, que é perigoso e deve ser evitado\n", - "\n", - "Para trabalhar com o ambiente, vamos definir uma classe chamada `Board`. Para não sobrecarregar demasiado este notebook, movemos todo o código relacionado ao funcionamento do tabuleiro para um módulo separado chamado `rlboard`, que iremos importar agora. Pode consultar este módulo para obter mais detalhes sobre os aspectos internos da implementação.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "Vamos agora criar um tabuleiro aleatório e ver como fica:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 1" - ] - }, - { - "source": [ - "## Ações e Política\n", - "\n", - "No nosso exemplo, o objetivo de Peter seria encontrar uma maçã, enquanto evita o lobo e outros obstáculos. Defina essas ações como um dicionário e associe-as a pares de alterações correspondentes de coordenadas.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 2" - ] - }, - { - "source": [ - "A estratégia do nosso agente (Peter) é definida por uma chamada **política**. Vamos considerar a política mais simples chamada **caminhada aleatória**.\n", - "\n", - "## Caminhada aleatória\n", - "\n", - "Vamos primeiro resolver o nosso problema implementando uma estratégia de caminhada aleatória.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "# Let's run a random walk experiment several times and see the average number of steps taken: code block 3" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 4" - ] - }, - { - "source": [ - "## Função de Recompensa\n", - "\n", - "Para tornar a nossa política mais inteligente, precisamos compreender quais movimentos são \"melhores\" do que outros.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 5" - ] - }, - { - "source": [ - "## Q-Learning\n", - "\n", - "Construa uma Q-Table, ou matriz multidimensional. Como o nosso tabuleiro tem dimensões `width` x `height`, podemos representar a Q-Table por um array numpy com a forma `width` x `height` x `len(actions)`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 6" - ] - }, - { - "source": [ - "Passe a Q-Table para a função `plot` para visualizar a tabela no tabuleiro:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "error", - "ename": "NameError", - "evalue": "name 'm' is not defined", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mm\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mplot\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mQ\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", - "\u001b[0;31mNameError\u001b[0m: name 'm' is not defined" - ] - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Essência do Q-Learning: Equação de Bellman e Algoritmo de Aprendizagem\n", - "\n", - "Escreva um pseudocódigo para o nosso algoritmo de aprendizagem:\n", - "\n", - "* Inicializar a Q-Table Q com números iguais para todos os estados e ações\n", - "* Definir a taxa de aprendizagem $\\alpha\\leftarrow 1$\n", - "* Repetir a simulação várias vezes\n", - " 1. Começar numa posição aleatória\n", - " 1. Repetir\n", - " 1. Selecionar uma ação $a$ no estado $s$\n", - " 2. Executar a ação, movendo-se para um novo estado $s'$\n", - " 3. Se encontrarmos uma condição de fim de jogo ou se o total de recompensas for muito baixo - sair da simulação \n", - " 4. Calcular a recompensa $r$ no novo estado\n", - " 5. Atualizar a Função Q de acordo com a equação de Bellman: $Q(s,a)\\leftarrow (1-\\alpha)Q(s,a)+\\alpha(r+\\gamma\\max_{a'}Q(s',a'))$\n", - " 6. $s\\leftarrow s'$\n", - " 7. Atualizar a recompensa total e diminuir $\\alpha$.\n", - "\n", - "## Explorar vs. Explorar\n", - "\n", - "A melhor abordagem é equilibrar entre exploração e exploração. À medida que aprendemos mais sobre o nosso ambiente, estaremos mais propensos a seguir o caminho ótimo, no entanto, escolhendo o caminho inexplorado de vez em quando.\n", - "\n", - "## Implementação em Python\n", - "\n", - "Agora estamos prontos para implementar o algoritmo de aprendizagem. Antes disso, também precisamos de uma função que converta números arbitrários na Q-Table num vetor de probabilidades para as ações correspondentes:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 7" - ] - }, - { - "source": [ - "Adicionamos uma pequena quantidade de `eps` ao vetor original para evitar divisão por 0 no caso inicial, quando todos os componentes do vetor são idênticos.\n", - "\n", - "O algoritmo de aprendizagem que iremos executar durante 5000 experiências, também chamadas de **épocas**:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 56, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "" - ] - } - ], - "source": [ - "\n", - "from IPython.display import clear_output\n", - "\n", - "lpath = []\n", - "\n", - "# code block 8" - ] - }, - { - "source": [ - "Após executar este algoritmo, a Q-Table deverá ser atualizada com valores que definem a atratividade de diferentes ações em cada etapa. Visualize a tabela aqui:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 43, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Verificar a Política\n", - "\n", - "Como a Q-Table lista a \"atratividade\" de cada ação em cada estado, é bastante fácil utilizá-la para definir a navegação eficiente no nosso mundo. No caso mais simples, podemos simplesmente selecionar a ação correspondente ao valor mais alto na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ], - "source": [ - "# code block 9" - ] - }, - { - "source": [ - "Se tentar o código acima várias vezes, pode notar que, por vezes, ele simplesmente \"fica preso\", e é necessário pressionar o botão STOP no notebook para interrompê-lo.\n", - "\n", - "> **Tarefa 1:** Modifique a função `walk` para limitar o comprimento máximo do caminho a um certo número de passos (por exemplo, 100), e observe o código acima retornar este valor ocasionalmente.\n", - "\n", - "> **Tarefa 2:** Modifique a função `walk` para que não volte aos locais onde já esteve anteriormente. Isto evitará que o `walk` entre em ciclos, no entanto, o agente ainda pode acabar \"encurralado\" num local do qual não consegue escapar.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 58, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Average path length = 5.31, eaten by wolf: 0 times\n" - ] - } - ], - "source": [ - "\n", - "# code block 10" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 57, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 57 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(lpath)" - ] - }, - { - "source": [ - "## Exercício\n", - "## Um mundo mais realista de Pedro e o Lobo\n", - "\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/solution/Julia/README.md b/translations/pt/8-Reinforcement/1-QLearning/solution/Julia/README.md deleted file mode 100644 index 1db067e08..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/solution/R/README.md b/translations/pt/8-Reinforcement/1-QLearning/solution/R/README.md deleted file mode 100644 index aec96b5d1..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb b/translations/pt/8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb deleted file mode 100644 index 2f7c52361..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb +++ /dev/null @@ -1,478 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "eadbd20d2a075efb602615ad90b1e97a", - "translation_date": "2025-09-03T20:51:58+00:00", - "source_file": "8-Reinforcement/1-QLearning/solution/assignment-solution.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Pedro e o Lobo: Ambiente Realista\n", - "\n", - "Na nossa situação, Pedro conseguia deslocar-se quase sem se cansar ou sentir fome. Num mundo mais realista, ele teria de sentar-se e descansar de vez em quando, além de alimentar-se. Vamos tornar o nosso mundo mais realista, implementando as seguintes regras:\n", - "\n", - "1. Ao deslocar-se de um lugar para outro, Pedro perde **energia** e ganha algum **cansaço**.\n", - "2. Pedro pode recuperar energia ao comer maçãs.\n", - "3. Pedro pode livrar-se do cansaço descansando debaixo de uma árvore ou na relva (ou seja, ao caminhar para uma localização no tabuleiro com uma árvore ou relva - campo verde).\n", - "4. Pedro precisa encontrar e matar o lobo.\n", - "5. Para matar o lobo, Pedro precisa ter certos níveis de energia e cansaço; caso contrário, ele perde a batalha.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random\n", - "import math\n", - "from rlboard import *" - ] - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAW4AAAFpCAYAAAC8p8I3AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nOzdeZxcVZ3//9fn1l7V3dV7J2QjIexBwhaIC6MgyKACg47iyogzqD9QZ8YZdUZnXJDBr8vgMF8V40hEXFBHWYavy2AGR1lEQCEkbAkkgSSdpbu6u/a6yzm/P+p209F09k5VJZ8nj3pU1b23qj65Tb9zcu45p8Rai1JKqdbhNLoApZRSe0eDWymlWowGt1JKtRgNbqWUajEa3Eop1WI0uJVSqsVMW3CLyAUi8rSIrBWRj07X5yil1OFGpmMct4hEgGeA84CNwEPAW6y1TxzwD1NKqcPMdLW4lwBrrbXPWWtd4Fbg4mn6LKWUOqxMV3DPAl6Y9HxjuE0ppdR+ijbqg0XkSuBKgFgsdtpLXvKS/Xq/kZERPM+b/P709fXt13uOq9VqFAoFent7D8j7TYfR0VFisRiZTKbRpUxpcHCQ/v5+IpFIo0uZ0vPPP8/cuXMbXcaUfN9n+/btzJw5s9GlTKlYLOL7Pp2dnY0uZUrbt2+no6ODRCLR6FKmtHr1aiqViux0p7X2gN+ApcDPJz3/B+Afpjq+v7/f7o9bbrnF9vT0WGDiFo1G7T/90z/t1/uOW7NmjV22bNkBea/pctttt9n777+/0WXs0jXXXGNzuVyjy5iSMcZeffXVjS5jl4aHh+21117b6DJ26d5777W33357o8vYpRtvvNGuWbOm0WXsUpiLO83M6WpxPwQcLSLzgU3AZcBbD/SH+L7P97//fT7wgQ8wMjLyR/u+8IUvAPCRj3yEdDqNyM7/8lJKqVYyLX3c1lofuBr4OfAk8ANr7eoD/TmbNm3iHe94xx+F9rhKpcJnPvMZfvGLXxzoj1ZKqYaZtj5ua+1PgJ9M1/sDbN68GcdxCIJgymNEhK1btxIEAdFow7r0lVLqgGnpmZMPPvjgLkMbwBjD73//+x0uXCqlVCtr6eB+wxvesNsRCo7jcOGFF5JMJg9SVUopNb1aOrhjsRiLFy/e5THz58+np6fnIFWklFLTr6WDu6+vj6uuumqXx1x44YWceuqpOqJEKXXIaOngdhyHiy++mDvvvJNjjz12h32ZTIbvfe97fPjDH27qQfZKKbW3Wjq4oT5q5Ic//CHPPPPMDttLpRKf//znxycATdwrpVSra+ngXrt2LR/60Ie45ZZbdhrMv/vd77jiiit48MEHMcY0oEKllDrwWjK4jTE8/fTTfPCDH2T58uW7PPYXv/gF733ve/nNb36z26GDSinVCloquK21VKtVPvvZz/Lyl7+cn//853v0uscee4yLLrqIt7/97eTz+clrqiilVMtpqamErutyww038LGPfWyvX5vL5bj11ltJpVJ87nOf0yGCSqmW1VLB/bnPfY5PfOIT+/Uey5cvJxaL8eUvf1mnwCulWlJLdJVYa7nuuuu47rrrDkgXx/Lly/mLv/gLvWCplGpJTR/cruvyb//2b3zyk5+kUqnssO/kk0/eoynvxx9//A6ta8/zuPXWW7nyyivJ5/PTUrdSSk2Xpg5uay1f/vKX+fCHP4zrujvsO+ecc/jhD3+4R8H9pS99ife9730sWbJkYnsQBHzzm9/kox/9KMVicVrqV0qp6dDUwf2///u/fPzjH99hZb+5c+dy3XXX8fWvf51sNrvH73X99ddz/fXXc9ZZZ01Mfw+CgBtvvJFbb71VR5kopVpG0wa3MYbvfve7VKvViW19fX3ccMMN/O3f/i3z58/fq/dzHIclS5bwxS9+kcnfb2mtZfny5drfrZRqGU0b3CLCW97yFhYtWgTAMcccw3/8x3/w+te/nng8vteLRokI0WiUpUuXsnz5cpYsWYKIMHfuXK688kocp2lPhVJK7aBpx8OJCK985StZtmwZd9xxB5deeimnn376Hx23t10cIsIpp5zCHXfcwb//+7+zdOlSzj//fF09UCnVMpo2uMctWbKEM844Y6fBWi6X8X1/l68PgoByuYy1dof3GBgY4JprrtHAVkq1nKbuHxARRATHcXYasDNnzuTTn/70Lt/jLW95Cy9/+ct3+t7j76vhrZRqJU0d3LsTiUTo6ura5TFtbW0kk0kNZ6XUIaOlg1sppQ5HGtxKKdViNLiVUqrFaHArpVSL0eBWSqkWo8GtlFItRoNbKaVajAa3Ukq1mJYObmvtbqe8G2N05T+l1CFlv4JbRNaLyOMi8qiIPBxu6xaRu0VkTXi/66mN+yEajTJv3ryJWZHJZJJFixbtMJuyv7+f9vb26SpBKaUOugOxyNSrrLVDk55/FFhhrf2siHw0fP6RA/A5O3XkkUdy+eWXU6vVWLBgAZ/5zGe46aabWLFiBZFIhDPOOGO6PloppRpiOlYHvBh4Zfj4ZuCXTFNwiwiLFy9m+fLlO2y/4ooruOKKK6bjI5VSquH2t4/bAv8tIo+IyJXhtgFr7WD4eAswsJ+foZRSapL9bXG/3Fq7SUT6gbtF5KnJO621VkR2+k0HYdBfCfUV/NasWbOfpUyfjRs3Mjo62tQ1Dg0NYYxp6hpLpRLr1q1jaGho9wc3iOu6TX0O8/k8pVKpqWvcsmVL0/++jI6O8sILLzT1d83ualDFfgW3tXZTeL9NRG4DlgBbRWSmtXZQRGYC26Z47TJgGUBPT4/95S9/uT+lTKvR0VE2btxIM9f47LPPkk6nGR4ebnQpUxoaGuL+++8nkUg0upQpFYvFpv45V6tVHtj+AHf88o5GlzKl9GCacyvnNvVork2bNvHII4+wdu3aRpcypV2eP2vtPt2ADNA+6fH9wAXA54GPhts/Cnxud+/V399vm9maNWvssmXLGl3GLt122232/vvvb3QZu3TNNdfYXC7X6DKmZIyxV199daPL2KXh4WF72rWnWZr4vxn3zrC33357o0/VLt144412zZo1jS5jl8Jc3Glm7k+LewC4LRyKFwW+a639mYg8BPxARN4NbADetB+foZRS6g/sc3Bba58DTt7J9mHg3P0pSiml1NRaeuakUkodjjS4lVKqxWhwK6VUi9HgVkqpFqPBrZRSLUaDWymlWowGt1JKtRgNbqWUajEa3Eop1WI0uJVSqsVocCulVIvR4FZKqRajwa2UUi1Gg1sppVqMBrdSSrUYDW6llGoxGtxKKdViNLiVUqrFaHArpVSL0eBWSqkWo8GtlFItRoNbKaVajAa3Ukq1GA1upZRqMRrcSinVYjS4lVKqxWhwK6VUi9HgVkqpFqPBrZRSLUaDWymlWsxug1tEbhKRbSKyatK2bhG5W0TWhPdd4XYRkRtEZK2IrBSRU6ezeKWUOhztSYv7m8AFf7Dto8AKa+3RwIrwOcCfAkeHtyuBrx6YMpVSrUREGl3CIW23wW2t/RWQ+4PNFwM3h49vBi6ZtP1btu43QKeIzDxQxSqlWoO1ttElHNL2tY97wFo7GD7eAgyEj2cBL0w6bmO4TSml1AGy3xcnbf2v1r3+61VErhSRh0Xk4Uqlsr9lKKXUYWNfg3vreBdIeL8t3L4JmDPpuNnhtj9irV1mrT3dWnt6KpXaxzKUUurwE93H190JXA58Nry/Y9L2q0XkVuBMYGxSl8qUgiDg9ttv38dSpt/Q0BDPPvtsU9e4atUqNmzYwNatWxtdypS2bNnCz372M5r5L+p8Pt/UP+dyuUxmMMOC2xc0upQpta9vZ1VpVVP3cz/33HNEo1FWrVq1+4MbJAiCKfftNrhF5HvAK4FeEdkIfIJ6YP9ARN4NbADeFB7+E+BCYC1QBt61JwW6rvC+9w3s/sAGSacNl1+eZmCgeWvcsGEDN96YZXS0eWtcuDDBJZf0kclkGl3KlKLRaFP/nIvFImckzuCzA59tdClTemrkKQpOoanPYzqd5l+6/4XyQLnRpUzJFXfKfbsNbmvtW6bYde5OjrXAVXtc2cTrHLZsWbq3Lztostm1zJw5zNKlzVvj1q1bGR0daOrzOHv2Ck477TTi8TiFQoGu7k62jmymPZMl723jv0e+xXPl1ThelIS0ISbCYGEzZ3VdwPnzL8Mt15jdN5d8Pk8mk2FkZIR0Oo3neQRBQCaTwVpLKpUil8vR1tZGoVAgm81OPK/VamSzWWq1GtZakskkjuMgIlhr+e53v9vUP+dcLsdDDz3U1DUaYxgaGmrqGleuXMnwScOMLRxrdClTanPapty3r10lSu0Taw3D3maeK63GwXDn4FdYmDkV17jESXFM/Ew2155nrDLKcZ2nMK/nJXTEuvj7e95Ge6yHq075OH3xmcS9OI7jYIwBwHEcgiDAWkutVkNECIIAEcHzvIn9IoLruhP/DPV9n3g83shTotRe0+BWB5XF8vttD/Jvv7+WgcwAc7PzGPM9Hlv3BOs3v8AJC+cQ8+I889xaho4ZZX72eISNJGwHKenge4/exLHdJ/Gaha8nGU8hIkQiEYwxE32qnucRi8UIgoBoNEoQBCQSCUSEaDSK7/v1WqzF8zwNbtVyNLjVQeVIhNN7z2Gm9zMef3olo5k02ViNYiFOojyD0gtpSvkyqx/fzpZSjvLcIrnRKn39M1m98QFO6j+Ve576MmfMWUp7pZOOjg6MMVQqFTo7OzEmIJlMksvlaG/vIJ/P09XVxdDQEO3t7dRqNbq6uiiXy0QiEZLJZKNPiVJ7TYNbHVTGGDKRNDe8/gauuO1d/HTVTzA1SNkkcRvnd2sD/nzJG3j3eWcwVholXomzsfxTqvlhhnIjrAmexfciXPzV13P3++8BIB6Pk0wmqVbKrFrxWdY+9G18P+D4pZdz2us+TaFQoKenh2q1SiqVYmhoiEQige/7lMtlenp6GnxWlNo7ujqgOqgcxyGRSFAtVvjaG27kwuNeSzQSYUHfAs5aeBYvOXIRG7ZvYPWmVQwXcgwOD5IZnkfp6SwndRxPZWwITJVgTPjLG/4SEaFarZLLDVPYuppnV9/LSL7KrEUX0XnEYgr5PG1tbWzfvh0RoVQq0dvbSzQaJRqN0tnZ2ehTotRe0xa3OqistbiuS1dXF57n8dU3fIWPp/6JHz/yY0aLo2QiGdKSoiYu24afYmxkjPZYBxcvvZhioUiKboa3b8Pp2oy71SMIfGKxGPfc9iW2rb+PkcEXOOWcv+EVF/0Nvl/fV6lU6OrqIggC0uk0Y2NjRCIRrLUUi0Wy2WyjT4tSe0WDWx10juPgOA7WWrpS3Xz6NZ8mJgl++NsfsDW3DTwQDyQQTpl9CqlIiucGnyMVTdEe6+Goucfxvf++mQXnb2H57f/BO193OQ/98kcMzJzNxe+5iYEjXzLx/uPD/CKRyMSokskTQ3QVO9WKNLjVQec4DsVikUwmQ6lUoiPRwWdf+y98+k8/wZ99+VJG8iOsfeE5+tt7yRWHaYu1Uy1XwbNs3z5MWyzDeaddxMaNz/Brexu/ed9yugLLBa96O/OOX0osFqNcLpNIJKjVaiSTSYrFIvF4HNd1SafTBEGAMYZYLNbo06HUXtPgVgfV+Djrnp4ecrkcnZ2dlEol4rE4btHlrqvuYn1uPf/1yH9RqpZwfIdMPE1+NA9WqJSrJCJx3vzqN3P6yafzq5X/zdfv/2f+5LVv5uSzXkcQBBSLRbq7u8nn82SzWUZHR+nt7aVQKJBKpRgeHiadTmOtpVQqNfUMP6V2RoNbHVQiQiKRIJfLkUqlGBsbIxaL4fs+bW1tWGtZ2L+Q95/3fqy1xKMRttz7C7b89sekE0l6XvWndC49l1giwcjICN4Wn8qo8LJXv4F4PI61ls7OTobWr+ehb/xfchufp+uo4znt8r+is79vor/bGIMxpqnXTVFqKhrc6qAab3Fns1nGxsbo6OigXC4TjUapVCpEo1Fwqzi1Kk/98/uxbpXZf/Y2Tv+H6zDiEIs4rFv2fxh+7BH8wLB2aJTE9m3UVj3Ew/f9im0rf4cXBBz/5is45dLLcGtVgmqN7135Dor5Ihf986fomH8UA3Pm4jgOpVKJRCLR6NOi1F7R4FYHXSQSwfO8iVmM4xcSI5EIQWGMzcs+T+n5tRz/t58m1t6BNzpC9bk1IFCzMOvStzPvnVfhlwrM+t8VnP7Mkwzf9yuOfMU5nPTWv8T3XUojI7iFMQILBstFH/skfmD49Xe+xcp77+U9//FNFpx6GpFIpNGnQ6m9psGtDioR2WEdkfE1Q6y14Pts+Op1BFs3s+Bt78XdvgV/+xYEy/jgD7HgPr+OqrUYoOPY4+lcfBqB61MZHSa/4VkCawksBNZirCUwYKzFN5ZTX3cRnjF85+/+lsuu+xxHn3lm406GUvtIg1sdVNZafN+nq6trh4uT0WiUF277NpW1TzL/7e8Fr4oYEAlvO7xHPcDBEpRLuNbWwzoM6MBYjGUivP3AEliDHx6z6OxXUau63Pi+9/A33/8hx596aoPOhlL7RoNbHVSO45BMJhkcHKSnp4ehoSEymQy1concL+7k2LddRVAewzqACE7YQnfC5LbW1lvnlnqCj4e0sRhj8a0hMJYgAD8Mbs8YfAu+MQRGCIzh+Je+jG0bN1IZGmrk6VBqn2hwq4NqvMWdSqXwPG/iwuDwvb8gnmmjOrSJiCM4kfpqDBKByKTgNrbeqrZGIDAYa7AWrAlb2mY8oC2eqXeP+MbiW+oBburdKJ5v6Jk9j6988AN8ffUTiPZ1qxaiwa0OuvHZiuP31loKv7uf9JELCSolxBGs49RX0nEEcYRImNzWWMRarAEb2HBYH+F9PbwDUw/pF4Pb4JkXg9sL6q3wI44+iqceerBRp0GpfabBrQ6q8fWzC4UC6XSaUqlEOp0mEnGwgUtQKeE4gnEcrEM9wCP18AbCJjdgDGY8uC34QT2U/aDe4vbDFrdnLJ4f4FuLayxeIHhBEIY4E1/EoFQr0eBWB5UxhlqtRmdnJ+VymY6ODlzXxa252OGtJMJ1TCQiOI4gEUEch3rz2+IDgTH1cA5sGND1x54NW9NBPbBdvx7O+fwYkXQGNxgP73B/OAlHqVajwa0OKsdxiMfjDA8P09fXx8jICO3t7SQ7sgz+78+IOw50dkIY3jj1ISW+W0MSKQzj3R9QKxUoD23HDQw13+AaSy0w1HxL4ESJ9g7gIYxt3kh6xixcY/ACqAUBvoHtg1twq9VGnxKl9poGtzqojDG4rktfX9/Et9a4rsvMS9/J9vtWMPr04wSz5pLp7cc4gnEEX8B/4Vlic47CApWtm/HyY1RrNarFIlU/wA0sFd9S8wOqgcFFMC88j0uE1Jy5jA0OIpkMXgDVwDCWy/Hc6idY/LpLQFcIVC1Gg1sddMaYie+JHF9mNXHEXEw0jlcqw7o1EATE29rwbEAEcPNjyMrf1sdqBwFeYHADgxu82D3iWxOO3QYvCKiO5qj5huGhISpegIvQMedIRkZG2LZpC1XX53Xve58u7apajga3OqhEhHg8TqFQIJFIUKlUJkI8SKRwjcV6AZH8GH7gEWx+IRwOKAgQYCcm2bjG4AeCayb3XZuJPm8/HGHiBx5BAJ4fUCkWyQ1uxVhAHFJtmUafEqX2mn51mTqoxr8Bp7Ozk0qlQnt7O8YYotEoR77tL6mF/dSlXI5ysUAtMFQDQyUwlAND1TdU/PpzN4Ba2OreoeVtTH3GpLETo0v8cPRJPjdS/0Z4x+GMN1yKJHV1QNV6tMWtDqrxZV2HhoZoa2tjdHSUeDyO53kc8bLz+L0BYw3GephCGXxTvz4p9TaGtSachAN+ONnGDS9WumZ8tIjFDer7vfEAtxZJJqlWavVjAp/Fr3wlcxcsaPAZUWrvaYtbHVTWWjzPo7e3l3K5TDabnfgmmkKpTPsZZ9db2X5AsVCk7NVb2GXPhI9tvcXtGyp+QCUcUVL1A2p+QC0IcH2LGwS4gZk0lttQKpZxay7tfX285r3vIZJMkcvlGn1KlNprGtzqoBqfgFMul4nFYlSr1YlVAlPt7Rzz1ndT9W0Y0AHVcLRI1Q+o+sGk0K53oVR9O9G9UgsstbC7xA0E14Ab2B3Ge3vWMnD00eRzIyx9/UX6RQqqJWlwq4POWjuxrOv4BBhrLdFolK6FxzL7/IvCoA5b1X69b/vF/m1Lxavvr4XH1cJRJl4Y3vXukqAe4sbimvrsyhPOfiWBRHnpG95INBrV75xULUmDWx1U46GdTqfxPI9UKjXxJQqVSgUn00bPosW4OPVWd1DvGin7AeWJEPfrFysnntdb49WgPoa7ZixVvz7ZxjUBtbC1bcSha9YsCoU8J519NkEQUCqVGn1KlNprenFSHVTjy7pu27aNnp4ehoeHaWtrw/M8Ojs7CYKAY978Tp6995ds+NUKBJlYkxvA2vq4bwDfvjg00LP1dUq8cP1tL+w+8YzFCww2GmfR2a/ioRW/5MsP3Ec8mcRaS0dHRwPPhlL7Rlvc6qAavzjZ1tZGrVYjk8lMTMipVqu4rosjwvEXvZEglqQShH3bXkDFe7F1XZ7c5x1Yqr6tt7bDbpPJwwR9HOa85BQ8hFe88Q0EsTi+7+P7PsVisdGnRKm9ttvgFpGbRGSbiKyatO2TIrJJRB4NbxdO2vcPIrJWRJ4WkddMV+GqdUUiEYIgIBaL4XnexOzJaDQ68R2Qc895DenjTqTqW8q+pewbypMvTIbbx/u/a169v7s2cdHyxX7v/oXHkO7qZv3qJzjpVa8i09aGEy5mFY3qPzpV69mTFvc3gQt2sv16a+3i8PYTABE5AbgMODF8zVdERFeoVxPGv3PSdd0dvnvSWjsRplCfFv/aa76A09UzKbCDMMAtpfCiZNV7McwrAVTC0K4GASYao2P2PKJt7Yzlclz6wQ9w7JIlRCKRiTr04qRqRbsNbmvtr4A9Hex6MXCrtbZmrV0HrAWW7Ed96hDzh10l6XQaYwyO41CpVPA8D4B4PM4RC4/msq/cRPvcI6l4JrzVu0hq4+O7x2dTBmZiJErNt9R8i2uFquuRz41wyqvP49XvehfJVIpCoUAQBHpxUrWs/enjvlpEVoZdKV3htlnAC5OO2Rhu+yMicqWIPCwiD3teZT/KUK1kfObk6OgoyWSSfD4PgO/7ZDIZEokE1lqq1SqFQoGFS87idZ++jlMufRM1KxOjTNxIlPmveOXEEMGqH5Ds7adtxhFUg6A+Hb7mEU+n+bP3v5/zrrgCEaFardLZ2UkkEiEajdLe3t7gM6LU3tvXDr6vAtdQ/8rWa4AvAlfszRtYa5cBywDa2wdsrbaPlaiWE4/H6e/vJxKJ0NfXN7E633g3STQaJZ1OT2w77bwLWLT05bz+7z8KhN/y7gjpzk6Kk2Y+RuMJENlhje14Mkn/3LmYcMhhKpVCRCYm3ujKgKoV7VNwW2u3jj8Wka8Dd4VPNwFzJh06O9ym1ITJfdnj95NF/uCLex3HIdbVRVtX1x8d2zUwY48+c/wdxz9PA1u1sn3qKhGRmZOe/hkwPuLkTuAyEUmIyHzgaOC3+1eiUkqpyWR8MsOUB4h8D3gl0AtsBT4RPl9MvatkPfAea+1gePzHqHeb+MBfW2t/ursistlue8wxf7uvf4ZpF4uVOPHEIebNm9foUqa0ZcsWHnssQbX6x63SZtHV9QxLl85v6pEcjz/+OCeddFKjy5iS53msX7+eo48+utGlTCmXy+G6LjNm7Nm/hhph/fr1PNH3BF7Ga3QpU3rmX59hLDe2038a7ja4D4b29n7ruk83uowpdXSs54gj7uOpp97W6FKmNG/ez/jKV/o47bTTGl3KlL70pS/xrne9i2w22+hSpvSxj32Ma6+9ttFlTGl0dJRvfetbfOADH2h0KVN6+OGHGR4e5jWvad5pHLfccgtnn312UzfGjj32WLZt27bT4G6S2QeC6zZvS9HzhgmCRFPXGAQpMpkMXTvpB24WsViMbDbbtDWOr5nSrPVBvcZYLNbUNabTacrlclPXmEgkaGtra+oad3UdRqe8K6VUi9HgVkqpFqPBrZRSLUaDWymlWowGt1JKtRgNbqWUajEa3Eop1WI0uJVSqsVocCulVIvR4FZKqRajwa2UUi1Gg1sppVqMBrdSSrUYDW6llGoxGtxKKdViNLiVUqrFaHArpVSL0eBWSqkWo8GtlFItRoNbKaVajAa3Ukq1GA1upZRqMRrcSinVYjS4lVKqxWhwK6VUi9HgVkqpFqPBrZRSLUaDWymlWowGt1JKtZjdBreIzBGRe0TkCRFZLSIfDLd3i8jdIrImvO8Kt4uI3CAia0VkpYicOt1/CKWUOpzsSYvbBz5krT0BOAu4SkROAD4KrLDWHg2sCJ8D/ClwdHi7EvjqAa9aKaUOY7sNbmvtoLX2d+HjAvAkMAu4GLg5POxm4JLw8cXAt2zdb4BOEZl5wCtXSqnD1F71cYvIkcApwIPAgLV2MNy1BRgIH88CXpj0so3htj98rytF5GERedjzKntZtlJKHb72OLhFpA34EfDX1tr85H3WWgvYvflga+0ya+3p1trTY7HU3rxUKaUOa3sU3CISox7a37HW/jjcvHW8CyS83xZu3wTMmfTy2eE2pZRSB8CejCoR4BvAk9baf520607g8vDx5cAdk7a/MxxdchYwNqlLRSml1H6K7sExLwPeATwuIo+G2/4R+CzwAxF5N7ABeFO47yfAhcBaoAy864BWrJRSh7ndBre19l5Apth97k6Ot8BVe1/KXnWRN0jz11g//c2t2Wts9vpAazxQWqHGnZFmKDyb7bKLF7+90WVMKRJxyWaLxOPdjS5lSr6fp7MzSjqdbnQpU9q2bRs9PT1EIpFGlzKljRs3E40e0egydiHAczYT6481upApmbKhzW+jo6Oj0aVMKZfL0dbWRjweb3QpU/r2t7/NyMjIThvNTRHc7e0Dtljc2ugyppTNruXzn7+Hv/qrv2p0KVO6/fbbGRgY4Mwzz6RWqxGLxTDG1Hc6hi21DYz4W7HGEiUOCBWvTDrSwVEdJyImQjweIwgCRATf9xERHMfB933i8fjE/fj7+75PJBLZ4VgRmXh9LFYPl/plEvjMZzWBPQ4AACAASURBVD7DVVddRVdXV4PO0q5Za3nTmz7Af/7nvze6lCklEjkW/fP5PPKPjzS6lCnNuG8GNw7dyMUXX9zoUqb0ta99jXPPPZeFCxc2upQpDQwMsHXr1p0G9570casWEgQBw8PDJNvj/HbkLvqT8/CdKs8WH2PQ3UChWqRQHeOI1FFU3Ar9sdmsST7JuuG1XH3mx3BrHiJCsVhEREgkEhSLRXp7eykWi3R3dzM2NkZ3dzf5fJ5MJsPo6CixWIx4PE48HicajVIsFps2oJVqdRrch5i1o4/xo5HrkTFhS20DMZvE9y0ZuuhNzKKTLkbLJSrGozsxG0yMnz77Y1LRdq75nw9z2aJ3c0R6Du3t7Vhr8X2fnp4eSqUSiUSCoaEh2trayOfzpFIparUanZ2dWGsJgoByuQxAPB5neHiYzs5OolH930ypA0l/ow4xfel53Lri93Qnu3lJ30tY0H8cz21ez833fo+Fx2Tpy7SxZuUgkVk+LzvhbCJ+klS0k1xhiES6nZt++1Vee/wlnNh1MtFojFgsxvbt2+nv76dUKtHd00NueJhsNsvY2BiZTIZ8Pk8sVj82k8ngOA6lUomuri4cRxegVOpA0+A+xKRIs+y1N/Hh//57/t8TP+Xnq35BwsQZ6JqBuz1BrdDL0f3z2Dy6jmDU8MCjDzB7UTdrt2xmYY/LaHmMai3gqD85js5oChGhra0N13WpFQZ55qk7KeQLdPcfQe+CcwmCgGQyOdGP7bouAI7jUK1WSaVSE/uUUgeGNocOMY7jcEz3Qj5+zsdwosKzw88yUhmhLZmh7JYpeyXm9M/h+N7FdFQWcmTHCRSesYhriFDj+W2b+fnjK7j2rs8A9Qt2xhiwAZue+Dm/vPWveeQnH+eR//4iEl7XNsZgjJkYWuU4Dtbalh1qpVSz0+A+xMRiMTzXY+nspfzorT+it60HJxJhtDpGLB6lFrg8sXE12wvbefr5p/j1ww8wL72IiwbewWMrnuaM4+aQLkT44U9/iOd7ABTyo2zb8BC/+n//zmg5wRlv/AbnXfEdvKA+qsR13YkRLOMXKY0x2tpWappoV8khZmxsbKI/+vgZJ3DfB+7l0v94I4PDgyRsnLhNkCTB9uHtWNcw0DWDwAZs3TbERae+mdEnR8kmRqllUzz7wjMcN/9E/ve2L/DUI3cxZ/7xvPzVV7JoyevI5/O0pdNUq1W6u7sJggDP8ygWi1hrSafTDA0N0dPToxcnlTrA9DfqEDN+sTAajVKtVhlIz+Cmt9zEfz3+X3z1f77K5twguJb2aDsnzDqBuMTZNrqNdDRFIV9AAmgfO5JCxyifuuOv+fOj3szaJ1fSOeMEXv/uL9EzMI9qtUo6ncZ1XWKxGOVyeWL8dipVX+kxCALa29v14qRS00CD+xAzfkHQ87yJSTjH9h3DMa/6G5bMOoOtpa38y3/+C5uGNvPc1mfpTvYQJ87w0BC1ske1WOF9l7yP97/0asbSG/nm9f+Hrm0BH7rm63T1zaFcLpNKpahWqyQSiYlJOeP93OMXJ8cDPZFINPiMKHXo0eA+xBhjiEajuK67w0VCa2HpgqUkU0kuOOECYvEYxUKReETY9Nwz9GV7qFlId/eRjCfp6uwinx/h6fmP8qorXsuRRy9GRAiCAMdxKA5tx4tG8AJDzxGzcBxnIryBiWP1AqVSB54G9yEmmUxOjKuu1WoAE2uDJBIJXNelPdnO0MP3k/QqFLZtpX3zBvKjI3SedAodi8+iuH4t6yoVXtiyjcd/fR9nnfpyvE3Ps3nNUyRTKfJtXWz49QqeX/UYbX0zSS84hraeXmadeCIDRx87MQ0+m81qV4lS00CD+xBTKpXo6emhWCySTCYxxlCr1RARKpUKyUqBdd+5kUxXD24qTbZvBh0v/ROsCAJUNm7AjuVIGJ/Mumd4aa2MXXEXmzetR5woI55Lqn8Wx5x7AUed+xpsYHj6vl+xZdVjPP/7RyhUqlzyj/9EV28vY2Nj9PT0aHgrdYBpcB9iOjo66muVJJOUy2UcxyEWi2GtJROL8Oj7/4rsgqPpOvt8nEgUbIC76fn6wr3WEolEyS48DmMtmTlHsfDSywgCQ62cJ5pqI7AGz/OpjOUwFgJjmb3oZGZay9jwMHf+27/yjf/vPVz9zW/T2dnZ1CsBKtWqtCl0iMnn8/T29k4MyYvFYnieR3VkmAf/8hLSR8xi5p++AVMYw4zlsIUxpFpEKkWolrClPEFuO35uO6ZUwB8bJiiMIK6LO5rDGxnBL+TxSyX8cgmvXMItFqgV690zF//1hyhuGeT//sU7eeHZZwmCoNGnRKlDjra4DzHJZJJSqYSI4Hke1loikQiD//UDuuccxRGvuQhvaJBIOHzPkfBbMkQQazHWghUEC8ZgLQTW4hsIjMFYi7GEzy2BsXjWEliDbwRjLC+97K3cvfwmVt/zP8w/9thGnxKlDjka3IeYdDrN4OAg2WyWSqVCPB7H8WoUnlnJwPGL8Ye24DhSD2oHnDC8qUc11hiwEoZ2OCIlqE99rwe1wRjwjCEw4FtLED73rSWwFgc48qSTefCOO3jFG95I94wZjT0pSh1iNLgPMWNjYwwMDFCpVGhra8MYw6a774Saiwk8gkoJcRwQkEg9tCNO/cJkYKm3qA1YAzYwGFNvhQc2wAQStr4tfmDwDfjG4FnwgoDAgmfqj2csXMiGNWsojoxocCt1gGlwH2Ky2Sxbt26lvb2dUqlEJBIhnYhRiEcwbhXjg3UccMA6Ao7gRBxE6mEtxoKxWGMxQYCZ6BIJW9hBvWvENRY/sPXgDlvcXvjcNWG3ie+BjuNW6oDT4D7EVCoV2tvbASZmLVarVUytiqmUCByIOBGMAyYiGMfBOIKDYGwY2MYQGIsJXuwe8Y0NW9NmosXtGXADE4a1xQvAMzYMcUPgeY08FUodsjS4DzGRSGTi22mCICASiRCNxCiseZJUexZJpfAjDhKpt7rFEZAIAhjqoVu/8BjgBbZ+MxbPGjwf3CDAt/XAdgPYtmEd6f4ZeE4EL6DeEjfg+vVFp5RSB54G9yFmfNy0iEyspZ3o7YNYnPyTjyNHHY1NJLCOg40IVixuqYAk0hCLEfg+nutTq5YZfWo1ru9T9S01Y6n6AdXAUAug/ehFBPE4sXSaaqmML4IXWGpBvctk8/MbGNu+HdFx3IclXc53emlwH2LGl3UtFApkMhl834eXLKFn6Tls/el/ElRKdB55FEE6TeAIEbEEWzch0QTE47iFMWpD23CDej92LTD4gcX1LV4Q4PsWLzBsWvkQNR+ivQPUPB8ybRBP4lphdCjHhjVreOUVf0X3zJmNPiWqAXSNmumlwX2ISafTjI2NEYlEqFarQL0VXqm5+MZSK5cobN1Muq+fymiOiDVQLYNbw1C/EGlsGNgGvMDihhcdfVMfURLYFy9YljZvohZYKoEh0dNHqeYyvHU7xsCCk15Cqq2tsSdEqUOQBvchxnVd2traJsZwB0FAEASkZs3Cj8TA95BCARuPY4e3E7EGEac+4x0IbP3CpDfeV20sbjhixDPgWROOLAkn4VhLQP0iZq1apVKsYERItHVQrdUwxuhaJUodYPobdQga/2fq5H+uLnj7/4fTO4NyEFAuVymNjVHxAiqeoeIZyr6h7AWUfUPFt9R8qPmGmm9wfcJRI/XRIp6xBP6LrXA3MBiEUr5EpVLB9w0nv/YCzn7bWxt1CpQ6pGmL+xATj8epVCo4jlPv3+bFL+91Ovvwn1+HtQFBsYwTGCJi63Mmxy9mUp+EE4xPrglb3rUwtF1Tv1DphRNvXBMeCwTUu1COe9nZRHBIJ1Pa2lZqGuhv1SGmWq3S0dEB1NctiUaj9XHZQcCR73wftUCo+oZK1a23tv3w5gVUfVMfOeKF94GlFliqgcH1DbXw3vctbtj/7Zv6kEHX86lWq0SSCZxEjAuufA/5fF4XmVJqGmiL+xDT3t7O0NAQyWSSYrGIiBCLxYhEIsw/82U8mG7DLYzhCEQdwTGCiB1f1fXFae/UW9zj65G4YUDXx2qDawJqAXhB/Tg3sNhojJf++WU8/ftHmbdoEZlMRr8oWKlpsNsWt4jMEZF7ROQJEVktIh8Mt39SRDaJyKPh7cJJr/kHEVkrIk+LyGum8w+gdlQsFslms1hrSSaTxGIxgiDAGEPZ8zjn35ZPjMcuB/W+7YpnKIf93JUgoOIHk1rghqoX4PpBfdJNOETQ9centwfUDPiB4biXvpxH7rmHq7+2jHg8TrFYnPgqM6XUgbMnzSEf+JC19nci0g48IiJ3h/uut9Z+YfLBInICcBlwInAE8AsROcZaq/9mPgji8TjVanWH73wc72eOx+Mk+geY8bJzeP7XK3DCpV2Fej+3xcFiJ5ZyDcKlXP1wYan6miR2Yoigawy1oN7fnejIUqm6nHnhhcyYN48gCIjFYjoRQ6lpsNsWt7V20Fr7u/BxAXgSmLWLl1wM3GqtrVlr1wFrgSUHoli1e8lkkkKhgIjgui7GGCKRSH2xqXSaaGc3Ryx5KTXfhqNK6i3rim/r9+Eok4pvqAX1fu5qQHirt7ZrQf0CZb2rxGAkyonnvJqK6/LSiy6hvaODIAjIZDIa3EpNg726OCkiRwKnAA+Gm64WkZUicpOIdIXbZgEvTHrZRnYd9OoAyufz9PX1YYypB3U0iud5eJ7HyMgImXSaEy+7nNmvOp+KqXeFlLyAkhtQDocHlsOuklIY4FUvoOr71LyA2viFS9/gBoYgEuPYl/8JuaFhTn31ecxatIjR0VFisRhDQ0N6cVKpabDHwS0ibcCPgL+21uaBrwJHAYuBQeCLe/PBInKliDwsIg97XmVvXqp2oaOjg1wuh+M4lMtlPM8jFosRi8Xo7OykXC4TicWYe96F+LHUxLjtSmDrY7mD8LlvXxxx4huqvqUaWCrjfdzGQjJJ/1ELsdEI5fwYs447jo5sls7OTjzPo7u7W79zUqlpsEeX/EUkRj20v2Ot/TGAtXbrpP1fB+4Kn24C5kx6+exw2w6stcuAZQDt7QO2VtuX8tUfKpfLdIRdFePf8j4+ntt1XZLJJEEQsOTP/pxKbpi7PvlxduzNeHE8d336OxNT3H0bToM3BisR2jq6IJ5gcN16rvz85znxFa+gUqkgIkSjUQqFAh0dHRreSh1gezKqRIBvAE9aa/910vbJqwf9GbAqfHwncJmIJERkPnA08NsDV7LalVQqRT6fx1pLtVrF930cx8FxHDKZDNVqFWst+XyeP7niPZz/8U/iR2L11nQ4nrviG1yJUJm0rRoYXOtQ9QNqvqWGUK5U2bL+ed7xiU9x9Jln1lciTCRIJpP4vq993EpNkz1pcb8MeAfwuIg8Gm77R+AtIrKY+hIX64H3AFhrV4vID4AnqI9IuUpHlBw8kUiEaDRKNBqdmPI+/njyvmg0SjyRYOnb/oKFp53F3V/9v+SHtgP1H+jSt76NX3/n21gLxliiqTRzTjqJJx94AGPBInTPnMHb/vEf6Z4zh2gsNvG+458ZjUY1uJWaBrsNbmvtvYRfBP4HfrKL11wLXLsfdal95DgOvb29U+7PZrMAZDIZAPr7++nv7+fEs8/+o2PPf9df7nMdsVhsn1+rlNo1nfKulFItpknmI1sSiVyji5hSPJ6nWq2SyzVvjeVymWKx2NQ1ep7H6Ohoky+yHzT1/4uJxCgRL0Iil2h0KVOKF+OUy+Wm/n+xWq2Sz+ebusZd/Z5IM/wSdXd327/7u79rdBlTKpVKbN++nSOPPLLRpUxpcHCQRCJBd3d3o0uZ0tNPP82CBQuauhvlscce4+STT250GVPyPI97732OkZFjG13KlJLJHKecUmNmE3/70bp16+jv75/oMmxGX/jCF8jlcju/SGStbfitv7/fNrM1a9bYZcuWNbqMXbrtttvs/fff3+gydumaa66xuVyu0WVMyRhjr7766kaXsUvDw8P2tNOutfUlwZrzNmPGvfb2229v9KnapRtvvNGuWbOm0WXsUpiLO81M7eNWSqkWo8GtlFItRoNbKaVajAa3Ukq1GA1upZRqMRrcSinVYjS4lVKqxWhwK6VUi9HgVkqpFqPBrZRSLUaDWymlWowGt1JKtRgNbqWUajEa3Eop1WI0uJVSqsVocCulVIvR4FZKqRajwa2UUi1Gg1sppVqMBrdSSrUYDW6llGoxGtxKKdViNLiVUqrFaHArpVSL0eBWSqkWo8GtlFItZrfBLSJJEfmtiDwmIqtF5FPh9vki8qCIrBWR74tIPNyeCJ+vDfcfOb1/BKWUOrzsSYu7BpxjrT0ZWAxcICJnAf8HuN5auxAYAd4dHv9uYCTcfn14nFJKqQNkt8Ft64rh01h4s8A5wH+G228GLgkfXxw+J9x/rojIAatYKaUOc3vUxy0iERF5FNgG3A08C4xaa/3wkI3ArPDxLOAFgHD/GNBzIItWSqnD2R4Ft7U2sNYuBmYDS4Dj9veDReRKEXlYRB6uVCr7+3ZKKXXY2KtRJdbaUeAeYCnQKSLRcNdsYFP4eBMwByDcnwWGd/Jey6y1p1trT0+lUvtYvlJKHX72ZFRJn4h0ho9TwHnAk9QD/I3hYZcDd4SP7wyfE+7/H2utPZBFK6XU4Sy6+0OYCdwsIhHqQf8Da+1dIvIEcKuIfAb4PfCN8PhvALeIyFogB1w2DXUrpdRha7fBba1dCZyyk+3PUe/v/sPtVeDPD0h1Siml/ojOnFRKqRajwa2UUi1Gg1sppVrMnlycnHbGGO67775GlzGlLVu2MDg42NQ1rl+/npGREYwxjS5lSrlcjoceeohMJtPoUqZULpeb+udcLBZJJnPMmNG8NXZ1Pc369YWmPo+Dg4OsXLmSrVu3NrqUKe3qd7kpgttay/DwHw31bhpjY2NUKpWmrrFUKrF8uUOh0Lw1zp3rcuaZI1Sr1UaXMqWREZ93vKN5z2E0WmbmBQ+R+vCPG13KlOLrOiiV3tTUvy/VapWPj36carR5/1+s2dqU+5oiuCORCBdddFGjy5jS2rVrCYKgqWs0xrBt2wBbtixtdClT6ulZyfnnn09XV1ejS9kpay233HI369Y17885kcjRMeMLrLtoXaNLmdKM+2Zw4tCJTf37Mjg4yOazNzO2cKzRpUypLdI25T7t41ZKqRajwa2UUi1Gg1sppVqMBrdSSrUYDW6llGoxGtxKKdViNLiVUqrFaHArpVSL0eBWSqkWo8GtlFItRoNbKaVajAa3Ukq1GA1upZRqMRrcSinVYjS4lVKqxWhwK6VUi9HgVkqpFqPBrZRSLUaDWymlWowGt1JKtRgNbqWUajEa3Eop1WI0uJVSqsVocCulVIvZbXCLSFJEfisij4nIahH5VLj9myKyTkQeDW+Lw+0iIjeIyFoRWSkip073H0IppQ4n0T04pgacY60tikgMuFdEfhru+3tr7X/+wfF/Chwd3s4EvhreK6WUOgB22+K2dcXwaSy82V285GLgW+HrfgN0isjM/S9VKaUU7GEft4hERORRYBtwt7X2wXDXtWF3yPUikgi3zQJemPTyjeE2pZRSB8AeBbe1NrDWLgZmA0tEZBHwD8BxwBlAN/CRvflgEblSRB4WkYcrlcpelq2UUoevvRpVYq0dBe4BLrDWDobdITVgObAkPGwTMGfSy2aH2/7wvZZZa0+31p6eSqX2rXqllDoM7cmokj4R6Qwfp4DzgKfG+61FRIBLgFXhS+4E3hmOLjkLGLPWDk5L9UopdRjak1ElM4GbRSRCPeh/YK29S0T+R0T6AAEeBd4bHv8T4EJgLVAG3nXgy1ZKqcPXboPbWrsSOGUn28+Z4ngLXLX/pSmllNoZnTmplFItRoNbKaVajAa3Ukq1GA1upZRqMRrcSinVYvZkOOC0832fr33ta40uY0pjY2Ns3LixqWt87rnnmDs3TW/vykaXMqWOjvXccsstJBKJ3R/cIL6fY9Gi5v05RyJVsuuyLPraokaXMqX0YJoHqg+wZcuWRpcypVWrVnHU2FG4WbfRpUzpef/5Kfc1RXBHIhHOPffcRpcxpY0bN+I4TlPXGI1GOeusbk466aRGlzKlb3xjPddc8wo8r73RpUzpvPN+x223Ne/POZ/P86MfbeNd5+58eoTFYjFYaxFkYhuAI5GJbdNp5cqVjI6OcvbZZ0/7Z+2rsbExvrjki8yePbvRpUxpqbN0yn1NEdwiwsKFCxtdxi6tWbOmqWtctWoVAwMDTV1jJpOhUDiSWq2r0aVMweI48aY+h7lcjkwmw/z58xkeHq5vTHnkS6Nks508tu0e7ivfRaE6gvGFjNNNqVaiXCvx7gWfIhlLMbNtNl2ZHsbGxojFYhSLRXp7exkaGqKjo4NyuUxvby+lUolIJILneQRBQCQSoVQqTezLZrNs376d3t5eAByn3vO6detWIpFIU5/HbDbL7NmzmTNnDsVikVQqRalUIhaLEY1GqVQqtLe3T+yr1WqICLFYjHK5TEdHB4VCgVQqhed5JBIJ6lNYIB6PUywWaWtro1QqkU6n8X0fYwyJRIJCoUB7ezvlcplkMokxBt/3iUajJJNJ6pPRXzyfO9MUwa2U2jsVv8jjlV9S9MfYmF/NcHULyVw7YqL0O/OZlTqJJ4YeIhppZ1H7Ypy2CI/lHuCutd/nNfP+nHPnvY6B5CystSSTSWq12kSIjIeTMWYijMZDZPxYEaFcLhOPxyfu4/F4I0/JPikWi2SzWYrFIl1dXfi+j+d5dHd3MzIyQldX10QIW2up1Wr09vYyMjJCd3c35XKZdDpNpVJBRDDGTLzn8PAw2WyWsbExotEojuOQy+Xo7OxkeHiYjo4O8vk8IkIikaBSqZBIJCaCe1c0uJVqQY443PDbL+MFNWZ3zGZB1wISkQzf/J9b6GiPc8y8mQxvKDFcW83Ji0bpjvfjBYaZqaNYvWUl+FH6EgO85piLACZCZ/yx4zgYY3AcB9/3d/hsEZk4Buqhvidh04xSqRTFYpFoNEo+nycSieA4DmNjY7z//e/n9NNP5z3veQ/lcnnizzw6OkoymSSfzxONRqlWq0Sj9Sh1HGfiL7dsNovrumQyGYwx3HzzzaxYsYKvfe1rZLNZPM+b2Get3ePQBg1upVpSIpLmM2d8hUu+fzHb4gFroznSkqZb5pGuJiivb2NoU4WntmwjkX6c5HA3I91DZKLdRJ04Y/kqVdflrNlnE7UxMpkMpVIJEan/0z9mcaslYtEISBJjLZFIhFqtRiaTwfd9YrEYpVKJ9vb2lg3uUqlEV1cX+XyetrY2giDA8zw6Ojr4yU9+wh133EEQBLzzne+ks7OTWq1GR0fHRIu7WCwSj8epVqsAEy3uzs5ORkdHyWazbNq0iRUrVvCRj3yEWq3G8uXLGR0dpaOjg2Kx/h0142GfSqW0xa3UoaparbKg70h+8KYf8JYfvplH1j9CzI/SE+/GumBcw3Vv+Sy/efwB5nbM5eerf86sOV2sf347ifY2BrcPU3V9rrv7X/jE6z5FqVSio6ODWq1GzFb59j+dhvGrIJZL//73pDpnYIyh8/9v79zD5KqqRP/b59Srux5d/cibQAJpJciVVxInQBhINBDlOYPDQ5GryPgKdxQYAp9fAJ07d3iYBMVHZABhYBCUUQGZUVBUvntnBEMCJBEijSTk2d3pR3VXnao6j73vH+eR6pBHJ2NSXbh/31dfnbPP6Torq1LrrLP22mvl85RKJWKxGIVCgebmZgYGBmhubqa5ubneajlg4vE4rutimiae5/mTusETBUC5XGbJkiUsXbqUZ555hpNOOimKR7uui2EYKKWip44w7KGUIpFI8Oqrr3LOOedQKBQAP4nANM0orBSPx4FdTzna49Zo3sU0NzfT29vLlPRkvvNXK7nmB9fQM9DDjPZOTGUibY8f/r/HSJtpyhWLRCxO94sxjj1qFtt63mSovYcOZyrf//ljLJx2Dh/+wIfp7e0llYCXfv51CkWH8UfOovPEDyLizVSrVUzTpL+/P5qcbGtro7e3l/b29ob1uGOxGI7jYBgGjuNE/477778/8qIBbNvm8ssv54orruCiiy5i2rRp3H777Sil8DwvMsDxeJyrr76a7u5uHnnkER599NHIaAN4nsc999zD1VdfjZSSWCwWzSOYpjl6uf8U/3iNRnN4sSyLTCYDwKzULL5/xSNc8M8X8nrPBrKxLE2iiaqo0lvdyY7e7fTv7Ocjs8+lIzEZicn7M7N45pX/oC0ZI2nEGR4eptDTxVNP3kXPplWMn3Iy8/5mGfnx0zCEwDRNpJS0t7dHHndfXx/ZbLahPe5yuUxbWxtDQ0Pkcjlc18W2bR555BFse2SO97Zt27j99tt5+umnSafTrFq1Cs/zRpxjGAZPP/00SinWrFnzjusppbjnnnu49NJLyefzFItFhBCkUils2448/v2hV05qNA1I6J0ppTCEwYy2Tn752V8yY+J7GKoMsWHHH1i1aTWvbn6VbCbH7PfNpuyUebt7EyJmMLTV5sxjFpFpjrH04cW8ta2Lt7vW8fral5h3/k389eKHaJ94NAL/MT40KGFaoBCCWCyGlBLTNN/hLTaKBx7eeJLJJP39/ViWBYDjONE5y5cvH7GGY926dbzwwgvvMNrgx7hXr149wmhPmDCBBx98MNqPxWKMGzcOx3FoaWkhnU4D/lOUDpVoNO9iDMOgUqkgAm/YcRwmtkzkZ5/5KU+vfZqfrv13/mv9f7KjrxvLLtEnTaqmjbQluPDaht+zcPbZnNFxMePnCq5Zfhnv7TU5cdYC3nPKIpozLZGRDrMehBDYtk08HsfzPBKJRDRJubvBCR//xzphGuDQ0BBtbW2Rxx2GPsA34j/+8Y9pbW3do7HeHwsWLBhxI3Bdl507d5LP5ykUCpHHrdMBNZp3OZVKJQpNlMtl0uk0g4ODZLNZ5s9YwF/Pvpifrf4ZO4Z3YFdssqkM9DO91QAAGQdJREFUZatMtWyDErhnuRw5YSrz58ynrbWN3I42Nv/nK3zor75Ax/jJ9PX1kU6ncRyHWCwWGekwPzmVSjE4OBgt3Mlmsw2Zxx2mA8bjfrgonCCsNdBNTU0cbEPzT33qU9xxxx0888wz0ZhpmuRyuRHpgOAv3NEet0bzLqa5uZmhoSHA/8GHq/HCmG2pVOLsk86mMDhIcyJBebCPtx/8JpWu10hNmsKxX/oH7HgcE9i5Yzs71mwjmR7P1CNnMNTfT2s2i+04dD31I1764UOIeIpjz/8bjjlzPq3t7XieR0dHB8Vikfb29iiPudGoVqtkMhksy6KpqSlaxZhKpaJzbNsmmUxGmScHwgUXXAAwYqJTKUWpVCKdTkfjiURihFe+PxpT2xrNnzmlUilazVcul8lkMlHecPjeveYFxJa32Pj0D4g3pXn/V1aAEUeYBt7OHby29EY8YSArEvnaWsa//2Q2Pv4Am5//FdbwEJmp03nvhZdx3leXIV2H3z/3LA9/8jISLa3M/1/Xkpk4maM6OykUCjQ1NUWTpY1EbfxeKRWFeH7yk58wceJEhoeH2bRpE6tXr37HQqTR0NXVxSmnnEJXV1d0vYsuuiiaE6hNPTyQeQFtuDWaBiSZTI6Icdu2TSqVwnEcUqkUO5//OZuWLWXqpZ/mfTf8H4SA0obXCG2DEoLjly5HCajs2E7rb/8vtm1jCoNZi2+AWJxq2cIuW1h9PUilOOqU2Rx5yhwK/f38281fJjf1SK782l005XIN63HH43Gq1SqGYURL+YUQIzzku+++m7vvvvugPv+6665j27ZtLFu2DPDnJr74xS+STCaRUpJIJKKbxYHoUGeVaDQNSJjNUbsAREqJEILeX/+MN+66lWmXf4bc0e+hunUj1S2bEJUSolKCSgnKJcpvvo71xmu4w4OMnzOXyaf/JS1HTqfcu4PS1s1U+nbilkq4ZQvHsqgOF6kMFTBNk7+84hMMbd7MvZ//XJTG1oiEaZVhvDk0pMuWLTvouPbuhEYb/O9t6dKlFAq+HovFIuVyOaqDMlo9NuZtUqP5MyfM6hBCRCv5LMtC9HXT/ZOHOfLCj5Fs60AW+jAwECJYEQgIQKJA+ttIhW0V8ZTCleBJhVQKqfxtN3yXCg+J40Ei2cTpl3+cJ76+gm9+6pNc/8j366uQgyRcvp5KpRgYGEApxbe+9S2+9rWvjQiNtLa2YprmiLTIgYGBPX5mS0sL8Xg8upFKKaNzlVLce++9mKbJLbfcEmWqeJ53QOmA2uPWaBqQMKYdVp4rFArkW1rYsXYNuY6JpPPtyOIgVCxEtYhRtTCrJYyq5b9C77tcgkoRyiWkVUJZRTyriGsVcUvD2KUiTnEYuziMXRqmOuy/V4pDSNfhQ1d9moEtWxju6am3Sg6K4eFh8vk8tm2TzWb57ne/y1e/+tURi2+OO+44Vq9ezZYtW3jzzTfp6elh1apVzJ49+x2fN3PmTJ577jm2bNnC2rVr2bJlCy+++CInnHBCdI7neXz729/mjjvuYNu2bZRKJcD3/kfrcWvDrdE0IGFBomQyied5flpbYZDB3/wMoymFMzwAFQtVtqDiG2qjahGrljCrFqJiQdWKzvGsEqpsIcslZNlCWhauZeFaRRyrhB2+l0rYpSJ2qUi1VMSp2MTTGX79aGN63E1NTViWRSwWo7u7m5tvvnnE8fe9732sXLmStra2KBY+NDTEuHHjWLZsGZ2dndG5yWSS66+/ns7OTqrVKtlsFsdxmDBhAvfddx9z5swZ8dnLli2jVCpFHaF0OqBG8y4nDI2A/4O3bZukIaj88fe0LzgXWS7hGQamIXz3zADTMDEMkAqEVCAVSiqUlChPISV4UiIluFLhSIWjJI7nh1BcKf0xqXC9YFvBxGlH4fyJ4sGHG8dxaG5uplKp8NnPfjbKLgnZvn07N9xwA57nceyxx/LNb36TVCqFZVmcdNJJLFy4kDfeeAOAhQsXctZZZ2HbdnRDuPXWW1mzZg1SSjZt2jTi2kIIvvCFL/CjH/2IRCJxQKmG2nBrNA1IbfpalNJmCJT0kBUL1wDDMJGGQBkCDIEyBYSGSYKSCikl0vPfXQmuJ3EVOK7EVX5c2/akb8g9iSslthQ4nsKREseTVErFeqvjoAkbGMRiMe677z5+85vfcPnll0fH+/v7+e1vf8sxxxzDbbfdhmmaWJZFMpmkWq2OyATJZrOMGzcuyvJJp9PcfPPNLFq0iNWrV7/j2t/4xje47LLLRjSwGC3acGs0DYht29FKRc/zSKVSVAqDeCWLSvc2mnIteIaJYQqEAcIUIAwkBhKFqxSe9A2y64VetcJVEtsDJ/SoPX8yslwuU3UcSDZhSxUYbnCkR9WyaMycEkYUdTJNk+eff/4d58ycOZPHHnuMTCZDLBbj2Wefpaenh3w+zwknnMCVV16J67p84AMf4IUXXmDjxo00NTVx4YUXkkqleOKJJzj33HN55ZVXRnzu7373Oz760Y9GHv6BZOZow63RNCCpVIqenh6EEKTTab8PYjaDVDD0+nrMzmMRTSkwjMDTDjJJHBeRTOEp6Rte16W0bTOVUomKJ7E9RdVVVKVH1YV4+wTI5qhYZaq2jXA97OA8Ryps12PTunXMmD1n/0KPUcJOP8VikZUrV3L++eezYcMGNmzYABClB955550IIejr6+Paa6/l1FNP5fHHH+eiiy6KyrN+5jOf4fHHH2f58uWAX5dk6dKlI4zylClTWLBgAQ8//DBLliyhubl51FUBQ7Th1mgakLBZb7hYJJvNMlwc5rgl/8j6r3wRb22Jjvcej0om8AyBJ0BULeTgAOaEyUjXY7hrPZ6rqFSrVB2HqiepulB2PaqupOJJnB3bcDBR6RbMljzKquCaMRwPbE/StfZVjEQzx50+r94qOSjCxr6pVIpUKsWLL75IR0cHH//4x6NzXn/9dTZs2MDzzz/PJZdcwlVXXUVbW1uU7ud5XtQ8wfM8MpkM5513Hvfffz8rVqxg48aNUT0SgHw+z4oVK7jmmmuYPn161HXoQBbgaMOt0TQonudFfR99r9FEZFtxXIlRKtH/+5dpmXEshudiSg/hVHF6t8L2LX6utgRHSmzpe9C263vRHkHutgK7alNxPCqFYaqbN1PxJG48SXriZLZt3MTwsMW0Oe/h+DPOqLM2Do6wsW+1WqWtrY3W1lY2b95MpVKJFjWB73W/9dZb3Hbbbaxfv54nn3yS733veyilaGpqitIHjz/+eK6//npuvPFGHnvssXeEPwzDoFwus337dmbOnBkt8onH41QqlSjDZH+M2nALIUxgFbBVKXWuEGI68CjQDrwEXKGUsoUQSeBfgFOAPuASpdTG0V5Ho9Hsn3Cpdmi8w/KqRUCmUtjVCjgupcEBKA0hisMYhsBAoFB4SiKVb7hdSRCz3hW7dsP4t/Tj4VIqPKXwJHiOQ3FgkIpVxkymUKpx6m/vTiaTibqxDw4OkkgkePPNNzn11FM5++yzGRoaiiYwV65ciVKKp556irlz57JkyZKo2306nUYpxXXXXcdDDz00wmgvXrw48sjD4mBdXV1MnjyZXC6H53lRJspoORCP+++A14BcsH87sEIp9agQYiVwFfCd4H1AKTVDCHFpcN4lB3AdjUazH6rValTBzrIsmpub/TKrM/8HracvpPvnP0Hiovr6iAmJ4UqEIRCB4ZaqxhAr5ce2PTXCgLs1k5eu8icsPaVwHUV1oIBUYKZSnHfD30c1UhqNMORk2zYtLS0opZg3bx7z58+nUqlEnWkMw6Czs5Nrr70WgLvuuosvfelLUTqhbdvRKsnly5dHRvuWW27hc5/7HKlUKlrlmkqlqFQqUVVHIOoWP9rSuKNagCOEOAL4CHBvsC+A+cDjwSkPAhcG2xcE+wTHF4hGvR1rNGOUdDpNsVgcUUu6paWFqjDJHTUDV0LVkZStMuWyjeVJyq7Ecv33siupuL6xLjvKn5iUEjtI/3OUoioVrqdwlcAOPG5HSox0xg8lJJpwXJe5Hzq7IduWgV8et1aHYchjaGiIpqYmhoaGou72M2fOjP7Odd2ol2SlUiEej49oAhzS2dlJa2sr8XgcwzDI5XKUy2VaWlqi+iihp30g9cxH63HfBdwAZIP9dmBQKRUu5t8CTAm2pwCbAZRSrhCiEJy/c9RSaTSafWJZFtlsdsR2oVAgm81iTOvEGDeZyo4tOMrGRGAaBJUBfV9NqZFed7i4JsoW8TwczzfetgzzuRWuB5WBQaSA9y84i1RbO729veTz+UieRiKs8xLmUYdzBrFYLGoCrJTCNM0Rk4dCiCjvOqxhUvsKCbvBh2OO40R53mGIK4yj105g7o/9etxCiHOBHqXUS6P+1FEghPhbIcQqIcSqP1UVLo3mz4Uw7loul6MJr/Cx/qjTziQ15UjKnqQSZIf4Hrak4rpUXJey61F2vV3HIyMdTFR6ys/nDo15kOftSD+E0jFtOn9ct55zP7+YXC7XkN1vYFcqYGica3O6wwqMYfXF6dOnj2iM8Itf/AIgCpGE8e++vj7Ab1l2/PHHR8fCrBPDMPA8b8TfwZ8+j/s04HwhxIeBFH6M++tAXggRC7zuI4CtwflbganAFiFEDGjBn6QcgVLqHuAegAkTJjRq/r5GUxfCH3744w8zIEKDM+vvv8pTHz+PcrmIKYQ/Mal8r1sBEpBhFUAUrutnkvjGWeJ6YEvfmDtSBtknvgFPZnOMn/Fexs2YQdukSVG7r0YkbBKcy+UoFAokEgni8XjUSai/v59sNotlWeTzeebNm8cTTzxBqVRi8eLFTJ06NTLsAFu2bIkqAZ5yyilMmjQpqpMe1pQZGBiIOsuHrcts2/7TpgMqpW4CbgIQQpwJXK+U+pgQ4ofAxfiZJVcCTwR/8mSw/1/B8edUoxbr1WjGKJ7nRT/08JHesiwSiQTlcpn80cfQfOR0eta/jCEMzKikq0RhoETgAQaTk55UQQnXsB6JiDxtR0oqnh8ysaVHNpfHSCSYfsIJZPN5hoaGMAyjIb3usDpgpVIhn88jpcTzPNra2qK2bOVymWw2i1Iqqg8D0NvbS29v714/O3wKCmtvG4bBwMAA6XSa/v7+KIYehl3CZsGj4b9THXAJcK0Qogs/hn1fMH4f0B6MXwvc+N+4hkaj2QPpdJrh4WGKxSKxWCzKR7Ysi/b2dizLYtG3vkfVkVRdj7LjBeER5b/bkrLjh0+qYRjFU5Q9qLiCiiuxPUnV88cdT2K7Hq1TjqTztHmkmtMsvPRShoeH6ejoaNjJyWw2y8DAAIlEgoGBgSivOmyAvHPnTkzTZGhoCMuymD17NlOnTt3v506cOJGzzjoruiEkk0kMw4j6gXZ0dESZLOl0GuCAdHhAhlsp9Wul1LnB9h+VUnOUUjOUUh9VSlWD8UqwPyM4/scDuYZGo9k/5XKZ5uZmmpqaoiL84QrAQqFAKpVCxRKccMWnfUPt+YbbcnbFtv3sEs+Pf3uqxoj7y9qrrqQaxbsVuYlTOHrWHLZt3MgHP/lJCsNFmpqaGBwcHNHqq5GwLCvquJ7L5aKUxnw+H4VHPM8jnU6TSqU47bTTePDBB8nn83v9zEQiwb333suZZ55JMplkeHgYx3FQSkXZKgMDA37efdABBzggHep63BpNA5JMJnEcJ8pSKJfL0Qq+TCbjNwZobaNj7hkY4yZRdhWWK7E8PyVwV1qg2rXtSSqO53vZrp8iWPU8bKlI5FoYP6OTvp5urOEiR594Itlslmq1SjqdPqDKdmOJVCpFqVQiFotRKpWidMDwJjg8PIxpmlQqlagn5cyZM1mzZg0PPPAAuVyObDZLLpcjl8uxYsUKNmzYwNy5c8lms9i2TXNzM7FYLKorE5YocF2X5ubmEfW4R4te8q7RNCC1S7HDjIja2hnhpOX0OXOZ9YlP89yKO3GsUvT3KliIo5Q/SekRxrvxy7lGC3AkqbYOMhMmYZXLJJMpbn/2mUiG2knRRqS2vVhIbXuy2mNh+VzDMBg/fjyLFi3i7bffxnXdaGUkEM03hPW1pZRR9kjtdwT+/ERt1slo0YZbo2lAPM+LUtVCw+m6LoZh4DhO9J5IJJh31WfxlOKn//srqBEGys8w8RR+Tne4rF3tqsvtKoHhKQoDA0ybNIlP33knRlAJr1qtRjnJQoiG7PRea3TD1Y3ge+JhuVwY6Q2Hx2oXztSm9DmOQzwejzJFHMeJ/ta27ehY+J3V3ihGiw6VaDQNSJizXalUouL+4VjYtTx81DcMgzmXf4KLv/YNjjhpth/PDl5TZs0hNWEiFU8GL0XnGWdSlfhL4CVUrDInf+iDfPKf/onm1laSySRSSjKZDNVqlUwm05AZJUBkWMPFMKHxrDW64VL10AMPK/mFYZUwN1sIgWEYxOPxqJmzlJJYLBYdj8fjuK474lh4wzuQp5bGu0VqNBoA2traAP8RvqmpCSFENNba2ooQgsmTJ0fH53/ifzLvo5fg1XiAZjyOlB7S2+WJxxIJnJpmuQCJVIpEKhV5h7lcDiEE7e3tDZvDDf4NMJlMjtAh7AqXhMdqCbux7+lYyL7i1gcT094dbbg1mgYlXPQBu6rz7e/dzGRG9dmpIEVtd/b2uY1KuIgp3K4d331sNMcOFzpUotFoNA2GGAuLGltbW9UVV1xRbzH2SrVajVZRjVUKhQKxWCxK5h+LdHd3093dgVJjNwMhn9/KUUdN2f+JdcLzPPr6+hg/fny9RdkrpVIJz/PI5XL7P7lO9PX1kclkRr1SsR489NBDDAwM7NGtHxOGWwjRC5QYuxUEO9CyHQxatoNDy3ZwvNtkO0opNW5PB8aE4QYQQqxSSs2qtxx7Qst2cGjZDg4t28Hx5ySbjnFrNBpNg6ENt0aj0TQYY8lw31NvAfaBlu3g0LIdHFq2g+PPRrYxE+PWaDQazegYSx63RqPRaEZB3Q23EOIcIcQGIUSXEKLuTReEEBuFEGuFEC8LIVYFY21CiGeFEG8E762HSZb7hRA9Qoh1NWN7lEX4fCPQ46tCiJPrJN+tQoitgf5eDlrehcduCuTbIIQ4+xDKNVUI8SshxO+FEOuFEH8XjNddd/uQre56C66VEkK8KIR4JZDvK8H4dCHEC4EcjwkhEsF4MtjvCo5Pq4NsDwgh3qrR3YnBeD1+E6YQYo0Q4qfB/qHR2+7diQ/nCzCBN4GjgQTwCnBcnWXaCHTsNnYHcGOwfSNw+2GS5QzgZGDd/mQBPgz8ByCAvwBeqJN8t+K3t9v93OOC7zcJTA++d/MQyTUJODnYzgJ/CK5fd93tQ7a66y24ngAywXYceCHQyQ+AS4PxlcDngu3PAyuD7UuBx+og2wPAxXs4vx6/iWuBR4CfBvuHRG/19rjnAF3K76Zj4/evvKDOMu2JC4AHg+0HgQsPx0WVUs8D/aOU5QLgX5TPb/GbOU+qg3x74wLgUaVUVSn1FtCF//0fCrm2K6VWB9vDwGvAFMaA7vYh2944bHoLZFJKqWKwGw9eCpgPPB6M7667UKePAwuEODRFPPYh2944rL8JIcQRwEeAe4N9wSHSW70N9xRgc83+Fvb9n/hwoIBnhBAvCSH+NhiboJTaHmzvACbUR7R9yjKWdLk4eDS9vyasVBf5gkfQk/C9szGlu91kgzGit+Bx/2WgB3gW38sfVEq5e5Ahki84XsDvQXtYZFNKhbr7x0B3K4QQ4Tr2w627u4AbgLDUYjuHSG/1NtxjkdOVUicDi4AvCCHOqD2o/GebMZGKM5ZkqeE7wDHAicB2YFm9BBFCZIB/A76olBqqPVZv3e1BtjGjN6WUp5Q6ETgC37s/tl6y7M7usgkhjgduwpdxNtCG38j8sCKEOBfoUUq9dDiuV2/DvRWobZl8RDBWN5RSW4P3HuDH+P9xu8NHrOC9p34S7lWWMaFLpVR38OOSwD+z67H+sMonhIjjG8Z/VUr9KBgeE7rbk2xjRW+1KKUGgV8Bc/HDDGEZ6FoZIvmC4y1A32GU7Zwg/KSU37D8e9RHd6cB5wshNuKHfOcDX+cQ6a3ehvt3QGcw85rAD9I/WS9hhBBpIUQ23AYWAusCma4MTrsSeKI+EsI+ZHkS+EQwk/4XQKEmLHDY2C2GeBG+/kL5Lg1m06cDncCLh0gGAdwHvKaUWl5zqO6625tsY0FvgRzjhBD5YLsJ+BB+HP5XwMXBabvrLtTpxcBzwdPM4ZLt9ZqbscCPIdfq7rB8r0qpm5RSRyilpuHbseeUUh/jUOntUMysHsgLf+b3D/hxtC/XWZaj8WfwXwHWh/Lgx55+CbwB/AJoO0zyfB//sdnBj49dtTdZ8GfOvxXocS0wq07yPRRc/9XgP+ekmvO/HMi3AVh0COU6HT8M8irwcvD68FjQ3T5kq7vegmu9H1gTyLEOuLnmt/Ei/uToD4FkMJ4K9ruC40fXQbbnAt2tAx5mV+bJYf9NBNc9k11ZJYdEb3rlpEaj0TQY9Q6VaDQajeYA0YZbo9FoGgxtuDUajabB0IZbo9FoGgxtuDUajabB0IZbo9FoGgxtuDUajabB0IZbo9FoGoz/D3T+NYP8qlB8AAAAAElFTkSuQmCC\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "width, height = 8,8\n", - "m = Board(width,height)\n", - "m.randomize(seed=13)\n", - "m.plot()" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [], - "source": [ - "actions = { \"U\" : (0,-1), \"D\" : (0,1), \"L\" : (-1,0), \"R\" : (1,0) }\n", - "action_idx = { a : i for i,a in enumerate(actions.keys()) }" - ] - }, - { - "source": [ - "## Definir estado\n", - "\n", - "Nas novas regras do jogo, precisamos acompanhar a energia e a fadiga em cada estado do tabuleiro. Assim, iremos criar um objeto `state` que irá conter todas as informações necessárias sobre o estado atual do problema, incluindo o estado do tabuleiro, os níveis atuais de energia e fadiga, e se podemos derrotar o lobo enquanto estamos no estado terminal:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "class state:\n", - " def __init__(self,board,energy=10,fatigue=0,init=True):\n", - " self.board = board\n", - " self.energy = energy\n", - " self.fatigue = fatigue\n", - " self.dead = False\n", - " if init:\n", - " self.board.random_start()\n", - " self.update()\n", - "\n", - " def at(self):\n", - " return self.board.at()\n", - "\n", - " def update(self):\n", - " if self.at() == Board.Cell.water:\n", - " self.dead = True\n", - " return\n", - " if self.at() == Board.Cell.tree:\n", - " self.fatigue = 0\n", - " if self.at() == Board.Cell.apple:\n", - " self.energy = 10\n", - "\n", - " def move(self,a):\n", - " self.board.move(a)\n", - " self.energy -= 1\n", - " self.fatigue += 1\n", - " self.update()\n", - "\n", - " def is_winning(self):\n", - " return self.energy > self.fatigue" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "tags": [] - }, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ], - "source": [ - "def random_policy(state):\n", - " return random.choice(list(actions))\n", - "\n", - "def walk(board,policy):\n", - " n = 0 # number of steps\n", - " s = state(board)\n", - " while True:\n", - " if s.at() == Board.Cell.wolf:\n", - " if s.is_winning():\n", - " return n # success!\n", - " else:\n", - " return -n # failure!\n", - " if s.at() == Board.Cell.water:\n", - " return 0 # died\n", - " a = actions[policy(m)]\n", - " s.move(a)\n", - " n+=1\n", - "\n", - "walk(m,random_policy)" - ] - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Killed by wolf = 5, won: 1 times, drown: 94 times\n" - ] - } - ], - "source": [ - "def print_statistics(policy):\n", - " s,w,n = 0,0,0\n", - " for _ in range(100):\n", - " z = walk(m,policy)\n", - " if z<0:\n", - " w+=1\n", - " elif z==0:\n", - " n+=1\n", - " else:\n", - " s+=1\n", - " print(f\"Killed by wolf = {w}, won: {s} times, drown: {n} times\")\n", - "\n", - "print_statistics(random_policy)" - ] - }, - { - "source": [ - "## Função de Recompensa\n", - "\n", - "A função de recompensa é uma parte essencial do sistema de aprendizagem por reforço. Ela define como o agente avalia as suas ações e orienta o comportamento em direção ao objetivo desejado.\n", - "\n", - "### Objetivo da Função de Recompensa\n", - "\n", - "O objetivo principal da função de recompensa é incentivar o agente a tomar ações que maximizem o retorno total ao longo do tempo. Isto é feito atribuindo valores positivos ou negativos às ações, dependendo do impacto que elas têm no progresso em direção ao objetivo.\n", - "\n", - "### Estrutura da Função de Recompensa\n", - "\n", - "A função de recompensa pode ser definida de várias formas, dependendo do problema específico. Aqui estão alguns exemplos comuns:\n", - "\n", - "- **Recompensa baseada em desempenho**: O agente recebe uma recompensa proporcional ao sucesso de uma ação. Por exemplo, em um jogo, o agente pode ganhar pontos por atingir um objetivo.\n", - "- **Recompensa baseada em penalidades**: Penalidades são aplicadas para desencorajar comportamentos indesejados. Por exemplo, o agente pode perder pontos por cometer erros.\n", - "- **Recompensa combinada**: Combina recompensas e penalidades para criar um equilíbrio entre incentivo e correção.\n", - "\n", - "### Considerações ao Projetar a Função de Recompensa\n", - "\n", - "- **Clareza**: Certifique-se de que a função de recompensa seja fácil de entender e interpretar pelo agente.\n", - "- **Equilíbrio**: Evite recompensas excessivamente altas ou baixas, pois isso pode levar a comportamentos extremos ou apatia.\n", - "- **Alinhamento com o objetivo**: A função de recompensa deve refletir diretamente os objetivos do sistema.\n", - "\n", - "### Exemplos de Funções de Recompensa\n", - "\n", - "Aqui estão alguns exemplos de como uma função de recompensa pode ser implementada:\n", - "\n", - "#### Exemplo 1: Recompensa Simples\n", - "\n", - "```python\n", - "def reward_function(action):\n", - " if action == \"success\":\n", - " return 10\n", - " elif action == \"failure\":\n", - " return -5\n", - " else:\n", - " return 0\n", - "```\n", - "\n", - "#### Exemplo 2: Recompensa Baseada em Distância\n", - "\n", - "```python\n", - "def reward_function(distance_to_goal):\n", - " if distance_to_goal == 0:\n", - " return 100\n", - " else:\n", - " return -distance_to_goal\n", - "```\n", - "\n", - "### Melhoria da Função de Recompensa\n", - "\n", - "A função de recompensa pode ser ajustada e melhorada com base no desempenho do agente. Monitorar o comportamento do agente e realizar testes pode ajudar a identificar áreas onde a função de recompensa pode ser refinada.\n", - "\n", - "### Conclusão\n", - "\n", - "A função de recompensa é um componente crítico para orientar o comportamento do agente em sistemas de aprendizagem por reforço. Um design cuidadoso e iterativo pode garantir que o agente aprenda de forma eficaz e alcance os objetivos desejados.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "def reward(s):\n", - " r = s.energy-s.fatigue\n", - " if s.at()==Board.Cell.wolf:\n", - " return 100 if s.is_winning() else -100\n", - " if s.at()==Board.Cell.water:\n", - " return -100\n", - " return r" - ] - }, - { - "source": [ - "## Algoritmo Q-Learning\n", - "\n", - "O algoritmo de aprendizagem em si permanece praticamente inalterado, apenas usamos `state` em vez de apenas a posição do tabuleiro.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "Q = np.ones((width,height,len(actions)),dtype=np.float)*1.0/len(actions)" - ] - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "def probs(v,eps=1e-4):\n", - " v = v-v.min()+eps\n", - " v = v/v.sum()\n", - " return v" - ] - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "" - ] - } - ], - "source": [ - "\n", - "from IPython.display import clear_output\n", - "\n", - "lpath = []\n", - "\n", - "for epoch in range(10000):\n", - " clear_output(wait=True)\n", - " print(f\"Epoch = {epoch}\",end='')\n", - "\n", - " # Pick initial point\n", - " s = state(m)\n", - " \n", - " # Start travelling\n", - " n=0\n", - " cum_reward = 0\n", - " while True:\n", - " x,y = s.board.human\n", - " v = probs(Q[x,y])\n", - " while True:\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " dpos = actions[a]\n", - " if s.board.is_valid(s.board.move_pos(s.board.human,dpos)):\n", - " break \n", - " s.move(dpos)\n", - " r = reward(s)\n", - " if abs(r)==100: # end of game\n", - " print(f\" {n} steps\",end='\\r')\n", - " lpath.append(n)\n", - " break\n", - " alpha = np.exp(-n / 3000)\n", - " gamma = 0.5\n", - " ai = action_idx[a]\n", - " Q[x,y,ai] = (1 - alpha) * Q[x,y,ai] + alpha * (r + gamma * Q[x+dpos[0], y+dpos[1]].max())\n", - " n+=1" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Resultados\n", - "\n", - "Vamos ver se conseguimos treinar o Peter para enfrentar o lobo!\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Killed by wolf = 1, won: 9 times, drown: 90 times\n" - ] - } - ], - "source": [ - "def qpolicy(m):\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " return a\n", - "\n", - "print_statistics(qpolicy)" - ] - }, - { - "source": [ - "Agora vemos muito menos casos de afogamento, mas o Peter ainda não consegue sempre matar o lobo. Tente experimentar e veja se consegue melhorar este resultado ajustando os hiperparâmetros.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 13 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(lpath)" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/1-QLearning/solution/notebook.ipynb b/translations/pt/8-Reinforcement/1-QLearning/solution/notebook.ipynb deleted file mode 100644 index a816338d3..000000000 --- a/translations/pt/8-Reinforcement/1-QLearning/solution/notebook.ipynb +++ /dev/null @@ -1,577 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 2, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "488431336543f71f14d4aaf0399e3381", - "translation_date": "2025-09-03T20:48:36+00:00", - "source_file": "8-Reinforcement/1-QLearning/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "# Pedro e o Lobo: Introdução ao Aprendizado por Reforço\n", - "\n", - "Neste tutorial, vamos aprender como aplicar aprendizado por reforço a um problema de busca de caminhos. O cenário é inspirado no conto musical [Pedro e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf) do compositor russo [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). É uma história sobre o jovem pioneiro Pedro, que corajosamente sai de casa para a clareira da floresta para perseguir o lobo. Vamos treinar algoritmos de aprendizado de máquina que ajudarão Pedro a explorar a área ao redor e construir um mapa de navegação ideal.\n", - "\n", - "Primeiro, vamos importar algumas bibliotecas úteis:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random\n", - "import math" - ] - }, - { - "source": [ - "## Visão Geral do Aprendizado por Reforço\n", - "\n", - "**Aprendizado por Reforço** (RL) é uma técnica de aprendizado que nos permite aprender o comportamento ideal de um **agente** em um determinado **ambiente** através da realização de muitos experimentos. Um agente nesse ambiente deve ter algum **objetivo**, definido por uma **função de recompensa**.\n", - "\n", - "## O Ambiente\n", - "\n", - "Para simplificar, vamos considerar o mundo de Peter como um tabuleiro quadrado de tamanho `width` x `height`. Cada célula nesse tabuleiro pode ser:\n", - "* **terra**, onde Peter e outras criaturas podem caminhar\n", - "* **água**, onde obviamente não se pode caminhar\n", - "* **uma árvore** ou **relva** - um lugar onde se pode descansar\n", - "* **uma maçã**, que representa algo que Peter ficaria feliz em encontrar para se alimentar\n", - "* **um lobo**, que é perigoso e deve ser evitado\n", - "\n", - "Para trabalhar com o ambiente, vamos definir uma classe chamada `Board`. Para não sobrecarregar este notebook, movemos todo o código relacionado ao tabuleiro para um módulo separado chamado `rlboard`, que agora vamos importar. Você pode olhar dentro desse módulo para obter mais detalhes sobre os aspectos internos da implementação.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 2, - "metadata": {}, - "outputs": [], - "source": [ - "from rlboard import *" - ] - }, - { - "source": [ - "Vamos agora criar um tabuleiro aleatório e ver como fica:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "width, height = 8,8\n", - "m = Board(width,height)\n", - "m.randomize(seed=13)\n", - "m.plot()" - ] - }, - { - "source": [ - "## Ações e Política\n", - "\n", - "No nosso exemplo, o objetivo de Peter seria encontrar uma maçã, enquanto evita o lobo e outros obstáculos. Para isso, ele pode essencialmente andar até encontrar uma maçã. Assim, em qualquer posição, ele pode escolher entre uma das seguintes ações: cima, baixo, esquerda e direita. Vamos definir essas ações como um dicionário e mapeá-las para pares de alterações correspondentes nas coordenadas. Por exemplo, mover para a direita (`R`) corresponderia ao par `(1,0)`.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 4, - "metadata": {}, - "outputs": [], - "source": [ - "actions = { \"U\" : (0,-1), \"D\" : (0,1), \"L\" : (-1,0), \"R\" : (1,0) }\n", - "action_idx = { a : i for i,a in enumerate(actions.keys()) }" - ] - }, - { - "source": [ - "A estratégia do nosso agente (Peter) é definida por uma chamada **política**. Vamos considerar a política mais simples chamada **caminhada aleatória**.\n", - "\n", - "## Caminhada aleatória\n", - "\n", - "Vamos começar por resolver o nosso problema implementando uma estratégia de caminhada aleatória.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": { - "tags": [] - }, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "18" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ], - "source": [ - "def random_policy(m):\n", - " return random.choice(list(actions))\n", - "\n", - "def walk(m,policy,start_position=None):\n", - " n = 0 # number of steps\n", - " # set initial position\n", - " if start_position:\n", - " m.human = start_position \n", - " else:\n", - " m.random_start()\n", - " while True:\n", - " if m.at() == Board.Cell.apple:\n", - " return n # success!\n", - " if m.at() in [Board.Cell.wolf, Board.Cell.water]:\n", - " return -1 # eaten by wolf or drowned\n", - " while True:\n", - " a = actions[policy(m)]\n", - " new_pos = m.move_pos(m.human,a)\n", - " if m.is_valid(new_pos) and m.at(new_pos)!=Board.Cell.water:\n", - " m.move(a) # do the actual move\n", - " break\n", - " n+=1\n", - "\n", - "walk(m,random_policy)" - ] - }, - { - "source": [ - "Vamos realizar a experiência de passeio aleatório várias vezes e ver o número médio de passos dados:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Average path length = 32.87096774193548, eaten by wolf: 7 times\n" - ] - } - ], - "source": [ - "def print_statistics(policy):\n", - " s,w,n = 0,0,0\n", - " for _ in range(100):\n", - " z = walk(m,policy)\n", - " if z<0:\n", - " w+=1\n", - " else:\n", - " s += z\n", - " n += 1\n", - " print(f\"Average path length = {s/n}, eaten by wolf: {w} times\")\n", - "\n", - "print_statistics(random_policy)" - ] - }, - { - "source": [ - "## Função de Recompensa\n", - "\n", - "Para tornar a nossa política mais inteligente, precisamos compreender quais movimentos são \"melhores\" do que outros.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [], - "source": [ - "move_reward = -0.1\n", - "goal_reward = 10\n", - "end_reward = -10\n", - "\n", - "def reward(m,pos=None):\n", - " pos = pos or m.human\n", - " if not m.is_valid(pos):\n", - " return end_reward\n", - " x = m.at(pos)\n", - " if x==Board.Cell.water or x == Board.Cell.wolf:\n", - " return end_reward\n", - " if x==Board.Cell.apple:\n", - " return goal_reward\n", - " return move_reward" - ] - }, - { - "source": [ - "## Aprendizagem Q\n", - "\n", - "Construa uma Q-Table, ou uma matriz multidimensional. Como o nosso tabuleiro tem dimensões `width` x `height`, podemos representar a Q-Table por um array numpy com a forma `width` x `height` x `len(actions)`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [], - "source": [ - "Q = np.ones((width,height,len(actions)),dtype=np.float)*1.0/len(actions)" - ] - }, - { - "source": [ - "Passe a Q-Table para a função de plotagem para visualizar a tabela no tabuleiro:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Essência do Q-Learning: Equação de Bellman e Algoritmo de Aprendizagem\n", - "\n", - "Escreva um pseudo-código para o nosso algoritmo de aprendizagem:\n", - "\n", - "* Inicializar a Tabela Q (Q-Table) com valores iguais para todos os estados e ações\n", - "* Definir a taxa de aprendizagem $\\alpha\\leftarrow 1$\n", - "* Repetir a simulação várias vezes\n", - " 1. Começar numa posição aleatória\n", - " 1. Repetir\n", - " 1. Selecionar uma ação $a$ no estado $s$\n", - " 2. Executar a ação movendo-se para um novo estado $s'$\n", - " 3. Se encontrarmos uma condição de fim de jogo ou se o total de recompensas for muito baixo - sair da simulação \n", - " 4. Calcular a recompensa $r$ no novo estado\n", - " 5. Atualizar a Função Q de acordo com a equação de Bellman: $Q(s,a)\\leftarrow (1-\\alpha)Q(s,a)+\\alpha(r+\\gamma\\max_{a'}Q(s',a'))$\n", - " 6. $s\\leftarrow s'$\n", - " 7. Atualizar a recompensa total e diminuir $\\alpha$.\n", - "\n", - "## Explorar vs. Explorar\n", - "\n", - "A melhor abordagem é equilibrar entre exploração e exploração. À medida que aprendemos mais sobre o nosso ambiente, estaremos mais inclinados a seguir o caminho ótimo, no entanto, escolher o caminho inexplorado de vez em quando.\n", - "\n", - "## Implementação em Python\n", - "\n", - "Agora estamos prontos para implementar o algoritmo de aprendizagem. Antes disso, também precisamos de uma função que converta números arbitrários na Tabela Q (Q-Table) num vetor de probabilidades para as ações correspondentes:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "def probs(v,eps=1e-4):\n", - " v = v-v.min()+eps\n", - " v = v/v.sum()\n", - " return v" - ] - }, - { - "source": [ - "Adicionamos uma pequena quantidade de `eps` ao vetor original para evitar divisão por 0 no caso inicial, quando todos os componentes do vetor são idênticos.\n", - "\n", - "O algoritmo de aprendizagem que iremos executar durante 5000 experiências, também chamadas de **épocas**:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "" - ] - } - ], - "source": [ - "\n", - "from IPython.display import clear_output\n", - "\n", - "lpath = []\n", - "\n", - "for epoch in range(10000):\n", - " clear_output(wait=True)\n", - " print(f\"Epoch = {epoch}\",end='')\n", - "\n", - " # Pick initial point\n", - " m.random_start()\n", - " \n", - " # Start travelling\n", - " n=0\n", - " cum_reward = 0\n", - " while True:\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " dpos = actions[a]\n", - " m.move(dpos,check_correctness=False) # we allow player to move outside the board, which terminates episode\n", - " r = reward(m)\n", - " cum_reward += r\n", - " if r==end_reward or cum_reward < -1000:\n", - " print(f\" {n} steps\",end='\\r')\n", - " lpath.append(n)\n", - " break\n", - " alpha = np.exp(-n / 3000)\n", - " gamma = 0.5\n", - " ai = action_idx[a]\n", - " Q[x,y,ai] = (1 - alpha) * Q[x,y,ai] + alpha * (r + gamma * Q[x+dpos[0], y+dpos[1]].max())\n", - " n+=1" - ] - }, - { - "source": [ - "Após executar este algoritmo, a Q-Table deverá ser atualizada com valores que definem a atratividade de diferentes ações em cada etapa. Visualize a tabela aqui:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "m.plot(Q)" - ] - }, - { - "source": [ - "## Verificar a Política\n", - "\n", - "Como a Q-Table lista a \"atratividade\" de cada ação em cada estado, é bastante fácil utilizá-la para definir a navegação eficiente no nosso mundo. No caso mais simples, podemos simplesmente selecionar a ação correspondente ao valor mais alto na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ], - "source": [ - "def qpolicy_strict(m):\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = list(actions)[np.argmax(v)]\n", - " return a\n", - "\n", - "walk(m,qpolicy_strict)" - ] - }, - { - "source": [ - "Se tentar o código acima várias vezes, pode notar que, por vezes, ele simplesmente \"fica preso\", e é necessário pressionar o botão STOP no notebook para interrompê-lo.\n", - "\n", - "> **Tarefa 1:** Modifique a função `walk` para limitar o comprimento máximo do caminho a um certo número de passos (por exemplo, 100), e observe o código acima retornar este valor ocasionalmente.\n", - "\n", - "> **Tarefa 2:** Modifique a função `walk` para que não volte aos locais onde já esteve anteriormente. Isto evitará que o `walk` entre em ciclos, no entanto, o agente ainda pode acabar \"encurralado\" num local do qual não consegue escapar.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Average path length = 3.45, eaten by wolf: 0 times\n" - ] - } - ], - "source": [ - "\n", - "def qpolicy(m):\n", - " x,y = m.human\n", - " v = probs(Q[x,y])\n", - " a = random.choices(list(actions),weights=v)[0]\n", - " return a\n", - "\n", - "print_statistics(qpolicy)" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 15, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 15 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\n\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(lpath)" - ] - }, - { - "source": [ - "O que observamos aqui é que, inicialmente, o comprimento médio do percurso aumentou. Isto provavelmente deve-se ao facto de, quando não sabemos nada sobre o ambiente, é mais provável que fiquemos presos em estados desfavoráveis, como água ou lobos. À medida que aprendemos mais e começamos a usar esse conhecimento, conseguimos explorar o ambiente por mais tempo, mas ainda não sabemos bem onde estão as maçãs.\n", - "\n", - "Quando aprendemos o suficiente, torna-se mais fácil para o agente alcançar o objetivo, e o comprimento do percurso começa a diminuir. No entanto, ainda estamos abertos à exploração, o que significa que frequentemente nos desviamos do melhor caminho e exploramos novas opções, tornando o percurso mais longo do que o ideal.\n", - "\n", - "O que também observamos neste gráfico é que, em determinado momento, o comprimento aumentou abruptamente. Isto indica a natureza estocástica do processo e que, em algum momento, podemos \"estragar\" os coeficientes da Q-Table ao substituí-los por novos valores. Idealmente, isto deve ser minimizado ao reduzir a taxa de aprendizagem (ou seja, no final do treino ajustamos os valores da Q-Table apenas por um valor pequeno).\n", - "\n", - "De forma geral, é importante lembrar que o sucesso e a qualidade do processo de aprendizagem dependem significativamente de parâmetros como a taxa de aprendizagem, a redução da taxa de aprendizagem e o fator de desconto. Estes são frequentemente chamados de **hiperparâmetros**, para distingui-los dos **parâmetros** que otimizamos durante o treino (por exemplo, os coeficientes da Q-Table). O processo de encontrar os melhores valores para os hiperparâmetros é chamado de **otimização de hiperparâmetros**, e merece um tópico à parte.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "## Exercício\n", - "#### Um Mundo Mais Realista de Pedro e o Lobo\n", - "\n", - "Na nossa situação, Pedro conseguia deslocar-se quase sem se cansar ou sentir fome. Num mundo mais realista, ele precisa de se sentar e descansar de vez em quando, além de se alimentar. Vamos tornar o nosso mundo mais realista implementando as seguintes regras:\n", - "\n", - "1. Ao mover-se de um lugar para outro, Pedro perde **energia** e ganha alguma **fadiga**.\n", - "2. Pedro pode ganhar mais energia ao comer maçãs.\n", - "3. Pedro pode livrar-se da fadiga descansando debaixo da árvore ou na relva (ou seja, ao caminhar para uma localização no tabuleiro com uma árvore ou relva - campo verde).\n", - "4. Pedro precisa encontrar e matar o lobo.\n", - "5. Para matar o lobo, Pedro precisa ter certos níveis de energia e fadiga, caso contrário, perde a batalha.\n", - "\n", - "Modifique a função de recompensa acima de acordo com as regras do jogo, execute o algoritmo de aprendizagem por reforço para aprender a melhor estratégia para vencer o jogo e compare os resultados da caminhada aleatória com o seu algoritmo em termos de número de jogos ganhos e perdidos.\n", - "\n", - "> **Note**: Pode ser necessário ajustar os hiperparâmetros para que funcione, especialmente o número de épocas. Como o sucesso do jogo (lutar contra o lobo) é um evento raro, pode esperar um tempo de treino muito mais longo.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/2-Gym/README.md b/translations/pt/8-Reinforcement/2-Gym/README.md deleted file mode 100644 index e89d9782f..000000000 --- a/translations/pt/8-Reinforcement/2-Gym/README.md +++ /dev/null @@ -1,333 +0,0 @@ - -## Pré-requisitos - -Nesta lição, utilizaremos uma biblioteca chamada **OpenAI Gym** para simular diferentes **ambientes**. Pode executar o código desta lição localmente (por exemplo, no Visual Studio Code), caso em que a simulação será aberta numa nova janela. Ao executar o código online, poderá precisar de fazer alguns ajustes, conforme descrito [aqui](https://towardsdatascience.com/rendering-openai-gym-envs-on-binder-and-google-colab-536f99391cc7). - -## OpenAI Gym - -Na lição anterior, as regras do jogo e o estado foram definidos pela classe `Board`, que criámos nós mesmos. Aqui, utilizaremos um **ambiente de simulação** especial, que simulará a física por trás do equilíbrio do poste. Um dos ambientes de simulação mais populares para treinar algoritmos de aprendizagem por reforço é chamado de [Gym](https://gym.openai.com/), mantido pela [OpenAI](https://openai.com/). Com este Gym, podemos criar diferentes **ambientes**, desde simulações de CartPole até jogos de Atari. - -> **Nota**: Pode ver outros ambientes disponíveis no OpenAI Gym [aqui](https://gym.openai.com/envs/#classic_control). - -Primeiro, vamos instalar o Gym e importar as bibliotecas necessárias (bloco de código 1): - -```python -import sys -!{sys.executable} -m pip install gym - -import gym -import matplotlib.pyplot as plt -import numpy as np -import random -``` - -## Exercício - inicializar um ambiente de CartPole - -Para trabalhar com o problema de equilíbrio do CartPole, precisamos de inicializar o ambiente correspondente. Cada ambiente está associado a: - -- **Espaço de observação**, que define a estrutura da informação que recebemos do ambiente. No problema do CartPole, recebemos a posição do poste, a velocidade e outros valores. - -- **Espaço de ação**, que define as ações possíveis. No nosso caso, o espaço de ação é discreto e consiste em duas ações: **esquerda** e **direita**. (bloco de código 2) - -1. Para inicializar, escreva o seguinte código: - - ```python - env = gym.make("CartPole-v1") - print(env.action_space) - print(env.observation_space) - print(env.action_space.sample()) - ``` - -Para ver como o ambiente funciona, vamos executar uma simulação curta de 100 passos. Em cada passo, fornecemos uma das ações a serem realizadas - nesta simulação, selecionamos aleatoriamente uma ação do `action_space`. - -1. Execute o código abaixo e veja o resultado. - - ✅ Lembre-se de que é preferível executar este código numa instalação local de Python! (bloco de código 3) - - ```python - env.reset() - - for i in range(100): - env.render() - env.step(env.action_space.sample()) - env.close() - ``` - - Deve ver algo semelhante a esta imagem: - - ![CartPole sem equilíbrio](../../../../8-Reinforcement/2-Gym/images/cartpole-nobalance.gif) - -1. Durante a simulação, precisamos de obter observações para decidir como agir. Na verdade, a função step retorna as observações atuais, uma função de recompensa e um indicador `done` que indica se faz sentido continuar a simulação ou não: (bloco de código 4) - - ```python - env.reset() - - done = False - while not done: - env.render() - obs, rew, done, info = env.step(env.action_space.sample()) - print(f"{obs} -> {rew}") - env.close() - ``` - - No notebook, verá algo semelhante a isto: - - ```text - [ 0.03403272 -0.24301182 0.02669811 0.2895829 ] -> 1.0 - [ 0.02917248 -0.04828055 0.03248977 0.00543839] -> 1.0 - [ 0.02820687 0.14636075 0.03259854 -0.27681916] -> 1.0 - [ 0.03113408 0.34100283 0.02706215 -0.55904489] -> 1.0 - [ 0.03795414 0.53573468 0.01588125 -0.84308041] -> 1.0 - ... - [ 0.17299878 0.15868546 -0.20754175 -0.55975453] -> 1.0 - [ 0.17617249 0.35602306 -0.21873684 -0.90998894] -> 1.0 - ``` - - O vetor de observação retornado em cada passo da simulação contém os seguintes valores: - - Posição do carrinho - - Velocidade do carrinho - - Ângulo do poste - - Taxa de rotação do poste - -1. Obtenha os valores mínimos e máximos desses números: (bloco de código 5) - - ```python - print(env.observation_space.low) - print(env.observation_space.high) - ``` - - Também pode notar que o valor de recompensa em cada passo da simulação é sempre 1. Isto acontece porque o nosso objetivo é sobreviver o maior tempo possível, ou seja, manter o poste numa posição razoavelmente vertical pelo maior período de tempo. - - ✅ Na verdade, a simulação do CartPole é considerada resolvida se conseguirmos obter uma recompensa média de 195 ao longo de 100 tentativas consecutivas. - -## Discretização do estado - -No Q-Learning, precisamos de construir uma Q-Table que define o que fazer em cada estado. Para isso, o estado precisa de ser **discreto**, ou seja, deve conter um número finito de valores discretos. Assim, precisamos de alguma forma **discretizar** as nossas observações, mapeando-as para um conjunto finito de estados. - -Existem algumas formas de fazer isto: - -- **Dividir em intervalos**. Se conhecemos o intervalo de um determinado valor, podemos dividir este intervalo em vários **bins** e substituir o valor pelo número do bin ao qual pertence. Isto pode ser feito usando o método [`digitize`](https://numpy.org/doc/stable/reference/generated/numpy.digitize.html) do numpy. Neste caso, saberemos exatamente o tamanho do estado, pois dependerá do número de bins que selecionarmos para a digitalização. - -✅ Podemos usar interpolação linear para trazer os valores para um intervalo finito (por exemplo, de -20 a 20) e, em seguida, converter os números em inteiros arredondando-os. Isto dá-nos um pouco menos de controlo sobre o tamanho do estado, especialmente se não conhecermos os intervalos exatos dos valores de entrada. Por exemplo, no nosso caso, 2 dos 4 valores não têm limites superiores/inferiores, o que pode resultar num número infinito de estados. - -No nosso exemplo, utilizaremos a segunda abordagem. Como poderá notar mais tarde, apesar de os limites superiores/inferiores não estarem definidos, esses valores raramente assumem valores fora de certos intervalos finitos, tornando os estados com valores extremos muito raros. - -1. Aqui está a função que irá receber a observação do nosso modelo e produzir um tuplo de 4 valores inteiros: (bloco de código 6) - - ```python - def discretize(x): - return tuple((x/np.array([0.25, 0.25, 0.01, 0.1])).astype(np.int)) - ``` - -1. Vamos também explorar outro método de discretização usando bins: (bloco de código 7) - - ```python - def create_bins(i,num): - return np.arange(num+1)*(i[1]-i[0])/num+i[0] - - print("Sample bins for interval (-5,5) with 10 bins\n",create_bins((-5,5),10)) - - ints = [(-5,5),(-2,2),(-0.5,0.5),(-2,2)] # intervals of values for each parameter - nbins = [20,20,10,10] # number of bins for each parameter - bins = [create_bins(ints[i],nbins[i]) for i in range(4)] - - def discretize_bins(x): - return tuple(np.digitize(x[i],bins[i]) for i in range(4)) - ``` - -1. Agora, execute uma simulação curta e observe esses valores discretos do ambiente. Sinta-se à vontade para experimentar tanto `discretize` quanto `discretize_bins` e veja se há alguma diferença. - - ✅ `discretize_bins` retorna o número do bin, que é baseado em 0. Assim, para valores da variável de entrada próximos de 0, retorna o número do meio do intervalo (10). Em `discretize`, não nos preocupámos com o intervalo dos valores de saída, permitindo que sejam negativos, e assim os valores do estado não são deslocados, e 0 corresponde a 0. (bloco de código 8) - - ```python - env.reset() - - done = False - while not done: - #env.render() - obs, rew, done, info = env.step(env.action_space.sample()) - #print(discretize_bins(obs)) - print(discretize(obs)) - env.close() - ``` - - ✅ Descomente a linha que começa com `env.render` se quiser ver como o ambiente é executado. Caso contrário, pode executá-lo em segundo plano, o que é mais rápido. Utilizaremos esta execução "invisível" durante o nosso processo de Q-Learning. - -## Estrutura da Q-Table - -Na lição anterior, o estado era um simples par de números de 0 a 8, e assim era conveniente representar a Q-Table por um tensor numpy com uma forma de 8x8x2. Se utilizarmos a discretização por bins, o tamanho do nosso vetor de estado também será conhecido, então podemos usar a mesma abordagem e representar o estado por um array com a forma 20x20x10x10x2 (aqui 2 é a dimensão do espaço de ação, e as primeiras dimensões correspondem ao número de bins que selecionámos para cada um dos parâmetros no espaço de observação). - -No entanto, às vezes as dimensões precisas do espaço de observação não são conhecidas. No caso da função `discretize`, nunca podemos ter certeza de que o nosso estado permanece dentro de certos limites, porque alguns dos valores originais não têm limites. Assim, utilizaremos uma abordagem ligeiramente diferente e representaremos a Q-Table por um dicionário. - -1. Use o par *(state,action)* como chave do dicionário, e o valor corresponderá ao valor da entrada na Q-Table. (bloco de código 9) - - ```python - Q = {} - actions = (0,1) - - def qvalues(state): - return [Q.get((state,a),0) for a in actions] - ``` - - Aqui também definimos uma função `qvalues()`, que retorna uma lista de valores da Q-Table para um determinado estado que corresponde a todas as ações possíveis. Se a entrada não estiver presente na Q-Table, retornaremos 0 como padrão. - -## Vamos começar o Q-Learning - -Agora estamos prontos para ensinar o Peter a equilibrar! - -1. Primeiro, vamos definir alguns hiperparâmetros: (bloco de código 10) - - ```python - # hyperparameters - alpha = 0.3 - gamma = 0.9 - epsilon = 0.90 - ``` - - Aqui, `alpha` é a **taxa de aprendizagem**, que define até que ponto devemos ajustar os valores atuais da Q-Table em cada passo. Na lição anterior, começámos com 1 e depois reduzimos `alpha` para valores mais baixos durante o treino. Neste exemplo, manteremos constante apenas por simplicidade, e pode experimentar ajustar os valores de `alpha` mais tarde. - - `gamma` é o **fator de desconto**, que mostra até que ponto devemos priorizar a recompensa futura em relação à recompensa atual. - - `epsilon` é o **fator de exploração/exploração**, que determina se devemos preferir explorar ou explorar. No nosso algoritmo, em `epsilon` por cento dos casos, selecionaremos a próxima ação de acordo com os valores da Q-Table, e no restante dos casos executaremos uma ação aleatória. Isto permitirá explorar áreas do espaço de busca que nunca vimos antes. - - ✅ Em termos de equilíbrio - escolher uma ação aleatória (exploração) seria como um empurrão aleatório na direção errada, e o poste teria de aprender a recuperar o equilíbrio desses "erros". - -### Melhorar o algoritmo - -Podemos também fazer duas melhorias ao nosso algoritmo da lição anterior: - -- **Calcular a recompensa cumulativa média**, ao longo de várias simulações. Iremos imprimir o progresso a cada 5000 iterações e calcularemos a média da recompensa cumulativa nesse período de tempo. Isto significa que, se obtivermos mais de 195 pontos, podemos considerar o problema resolvido, com qualidade ainda maior do que o necessário. - -- **Calcular o resultado cumulativo médio máximo**, `Qmax`, e armazenaremos a Q-Table correspondente a esse resultado. Quando executar o treino, notará que, às vezes, o resultado cumulativo médio começa a cair, e queremos manter os valores da Q-Table que correspondem ao melhor modelo observado durante o treino. - -1. Colete todas as recompensas cumulativas em cada simulação no vetor `rewards` para posterior plotagem. (bloco de código 11) - - ```python - def probs(v,eps=1e-4): - v = v-v.min()+eps - v = v/v.sum() - return v - - Qmax = 0 - cum_rewards = [] - rewards = [] - for epoch in range(100000): - obs = env.reset() - done = False - cum_reward=0 - # == do the simulation == - while not done: - s = discretize(obs) - if random.random() Qmax: - Qmax = np.average(cum_rewards) - Qbest = Q - cum_rewards=[] - ``` - -O que pode notar a partir desses resultados: - -- **Perto do nosso objetivo**. Estamos muito próximos de alcançar o objetivo de obter 195 recompensas cumulativas ao longo de 100+ execuções consecutivas da simulação, ou podemos até ter alcançado! Mesmo que obtenhamos números menores, ainda não sabemos, porque calculamos a média ao longo de 5000 execuções, e apenas 100 execuções são necessárias no critério formal. - -- **Recompensa começa a cair**. Às vezes, a recompensa começa a cair, o que significa que podemos "destruir" valores já aprendidos na Q-Table com os que pioram a situação. - -Esta observação é mais claramente visível se plotarmos o progresso do treino. - -## Plotar o progresso do treino - -Durante o treino, coletámos o valor da recompensa cumulativa em cada uma das iterações no vetor `rewards`. Aqui está como fica quando o plotamos contra o número de iterações: - -```python -plt.plot(rewards) -``` - -![progresso bruto](../../../../8-Reinforcement/2-Gym/images/train_progress_raw.png) - -A partir deste gráfico, não é possível dizer nada, porque, devido à natureza do processo de treino estocástico, a duração das sessões de treino varia muito. Para dar mais sentido a este gráfico, podemos calcular a **média móvel** ao longo de uma série de experimentos, digamos 100. Isto pode ser feito convenientemente usando `np.convolve`: (bloco de código 12) - -```python -def running_average(x,window): - return np.convolve(x,np.ones(window)/window,mode='valid') - -plt.plot(running_average(rewards,100)) -``` - -![progresso do treino](../../../../8-Reinforcement/2-Gym/images/train_progress_runav.png) - -## Variar os hiperparâmetros - -Para tornar o treino mais estável, faz sentido ajustar alguns dos nossos hiperparâmetros durante o treino. Em particular: - -- **Para a taxa de aprendizagem**, `alpha`, podemos começar com valores próximos de 1 e depois ir reduzindo o parâmetro. Com o tempo, obteremos boas probabilidades na Q-Table e, assim, devemos ajustá-las ligeiramente, e não sobrescrever completamente com novos valores. - -- **Aumentar epsilon**. Podemos querer aumentar o `epsilon` lentamente, para explorar menos e explorar mais. Provavelmente faz sentido começar com um valor mais baixo de `epsilon` e aumentar até quase 1. -> **Tarefa 1**: Experimente alterar os valores dos hiperparâmetros e veja se consegue obter uma recompensa cumulativa mais alta. Está a conseguir ultrapassar 195? -> **Tarefa 2**: Para resolver formalmente o problema, é necessário alcançar uma recompensa média de 195 ao longo de 100 execuções consecutivas. Meça isso durante o treino e certifique-se de que o problema foi resolvido formalmente! - -## Ver o resultado em ação - -Seria interessante ver como o modelo treinado se comporta. Vamos executar a simulação e seguir a mesma estratégia de seleção de ações usada durante o treino, amostrando de acordo com a distribuição de probabilidade na Q-Table: (bloco de código 13) - -```python -obs = env.reset() -done = False -while not done: - s = discretize(obs) - env.render() - v = probs(np.array(qvalues(s))) - a = random.choices(actions,weights=v)[0] - obs,_,done,_ = env.step(a) -env.close() -``` - -Deverá aparecer algo como isto: - -![um cartpole equilibrado](../../../../8-Reinforcement/2-Gym/images/cartpole-balance.gif) - ---- - -## 🚀Desafio - -> **Tarefa 3**: Aqui, estávamos a usar a cópia final da Q-Table, que pode não ser a melhor. Lembre-se de que armazenámos a Q-Table com melhor desempenho na variável `Qbest`! Experimente o mesmo exemplo com a Q-Table de melhor desempenho, copiando `Qbest` para `Q`, e veja se nota alguma diferença. - -> **Tarefa 4**: Aqui, não estávamos a selecionar a melhor ação em cada passo, mas sim a amostrar com a correspondente distribuição de probabilidade. Faria mais sentido selecionar sempre a melhor ação, com o valor mais alto na Q-Table? Isto pode ser feito utilizando a função `np.argmax` para descobrir o número da ação correspondente ao maior valor na Q-Table. Implemente esta estratégia e veja se melhora o equilíbrio. - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Tarefa -[Treinar um Mountain Car](assignment.md) - -## Conclusão - -Aprendemos agora como treinar agentes para alcançar bons resultados apenas fornecendo-lhes uma função de recompensa que define o estado desejado do jogo e dando-lhes a oportunidade de explorar inteligentemente o espaço de busca. Aplicámos com sucesso o algoritmo de Q-Learning em casos de ambientes discretos e contínuos, mas com ações discretas. - -É importante também estudar situações em que o estado das ações é contínuo e quando o espaço de observação é muito mais complexo, como a imagem do ecrã de um jogo Atari. Nestes problemas, muitas vezes é necessário usar técnicas de aprendizagem automática mais avançadas, como redes neuronais, para alcançar bons resultados. Esses tópicos mais avançados serão abordados no nosso próximo curso de IA mais avançado. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/2-Gym/assignment.md b/translations/pt/8-Reinforcement/2-Gym/assignment.md deleted file mode 100644 index 0d1fb562d..000000000 --- a/translations/pt/8-Reinforcement/2-Gym/assignment.md +++ /dev/null @@ -1,57 +0,0 @@ - -# Treinar Carro na Montanha - -[OpenAI Gym](http://gym.openai.com) foi projetado de forma que todos os ambientes fornecem a mesma API - ou seja, os mesmos métodos `reset`, `step` e `render`, e as mesmas abstrações de **espaço de ação** e **espaço de observação**. Assim, deve ser possível adaptar os mesmos algoritmos de aprendizagem por reforço a diferentes ambientes com mudanças mínimas no código. - -## Um Ambiente de Carro na Montanha - -O [ambiente Mountain Car](https://gym.openai.com/envs/MountainCar-v0/) contém um carro preso num vale: - -O objetivo é sair do vale e capturar a bandeira, realizando em cada passo uma das seguintes ações: - -| Valor | Significado | -|---|---| -| 0 | Acelerar para a esquerda | -| 1 | Não acelerar | -| 2 | Acelerar para a direita | - -O principal truque deste problema, no entanto, é que o motor do carro não é forte o suficiente para escalar a montanha numa única tentativa. Portanto, a única maneira de ter sucesso é dirigir para frente e para trás para ganhar impulso. - -O espaço de observação consiste em apenas dois valores: - -| Num | Observação | Min | Max | -|-----|--------------|-----|-----| -| 0 | Posição do carro | -1.2| 0.6 | -| 1 | Velocidade do carro | -0.07 | 0.07 | - -O sistema de recompensa para o carro na montanha é bastante peculiar: - - * Uma recompensa de 0 é atribuída se o agente alcançar a bandeira (posição = 0.5) no topo da montanha. - * Uma recompensa de -1 é atribuída se a posição do agente for menor que 0.5. - -O episódio termina se a posição do carro for maior que 0.5 ou se o comprimento do episódio for superior a 200. - -## Instruções - -Adapte o nosso algoritmo de aprendizagem por reforço para resolver o problema do carro na montanha. Comece com o código existente no [notebook.ipynb](notebook.ipynb), substitua o ambiente, altere as funções de discretização de estado e tente fazer o algoritmo existente treinar com modificações mínimas no código. Otimize o resultado ajustando os hiperparâmetros. - -> **Nota**: É provável que seja necessário ajustar os hiperparâmetros para que o algoritmo converja. - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita Melhorias | -| -------- | --------- | -------- | ------------------- | -| | O algoritmo de Q-Learning foi adaptado com sucesso a partir do exemplo CartPole, com modificações mínimas no código, sendo capaz de resolver o problema de capturar a bandeira em menos de 200 passos. | Um novo algoritmo de Q-Learning foi adotado da Internet, mas está bem documentado; ou o algoritmo existente foi adotado, mas não alcança os resultados desejados. | O estudante não conseguiu adotar nenhum algoritmo com sucesso, mas deu passos substanciais em direção à solução (implementou discretização de estado, estrutura de dados da Q-Table, etc.) | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/2-Gym/notebook.ipynb b/translations/pt/8-Reinforcement/2-Gym/notebook.ipynb deleted file mode 100644 index 8fa068a78..000000000 --- a/translations/pt/8-Reinforcement/2-Gym/notebook.ipynb +++ /dev/null @@ -1,392 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.4" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.4 64-bit ('base': conda)" - }, - "interpreter": { - "hash": "86193a1ab0ba47eac1c69c1756090baa3b420b3eea7d4aafab8b85f8b312f0c5" - }, - "coopTranslator": { - "original_hash": "f22f8f3daed4b6d34648d1254763105b", - "translation_date": "2025-09-03T20:54:11+00:00", - "source_file": "8-Reinforcement/2-Gym/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "## Patinagem no CartPole\n", - "\n", - "> **Problema**: Se o Pedro quer escapar do lobo, ele precisa ser capaz de se mover mais rápido do que ele. Vamos ver como o Pedro pode aprender a patinar, em particular, a manter o equilíbrio, utilizando Q-Learning.\n", - "\n", - "Primeiro, vamos instalar o gym e importar as bibliotecas necessárias:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 1" - ] - }, - { - "source": [ - "## Criar um ambiente cartpole\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "#code block 2" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "source": [ - "Para ver como o ambiente funciona, vamos executar uma simulação curta de 100 passos.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "#code block 3" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "source": [ - "Durante a simulação, precisamos obter observações para decidir como agir. Na verdade, a função `step` devolve-nos as observações atuais, a função de recompensa e a bandeira `done` que indica se faz sentido continuar a simulação ou não:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "#code block 4" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": null, - "outputs": [] - }, - { - "source": [ - "Podemos obter o valor mínimo e máximo desses números:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[-4.8000002e+00 -3.4028235e+38 -4.1887903e-01 -3.4028235e+38]\n[4.8000002e+00 3.4028235e+38 4.1887903e-01 3.4028235e+38]\n" - ] - } - ], - "source": [ - "#code block 5" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 6" - ] - }, - { - "source": [ - "Vamos também explorar outro método de discretização usando intervalos:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Sample bins for interval (-5,5) with 10 bins\n [-5. -4. -3. -2. -1. 0. 1. 2. 3. 4. 5.]\n" - ] - } - ], - "source": [ - "#code block 7" - ] - }, - { - "source": [ - "Vamos agora executar uma breve simulação e observar esses valores discretos do ambiente.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "(0, 0, -2, -2)\n(0, 1, -2, -5)\n(0, 2, -3, -8)\n(0, 3, -5, -11)\n(0, 3, -7, -14)\n(0, 4, -10, -17)\n(0, 3, -14, -15)\n(0, 3, -17, -12)\n(0, 3, -20, -16)\n(0, 4, -23, -19)\n" - ] - } - ], - "source": [ - "#code block 8" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 9" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 13, - "metadata": {}, - "outputs": [], - "source": [ - "#code block 10" - ] - }, - { - "cell_type": "code", - "execution_count": 14, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "0: 22.0, alpha=0.3, epsilon=0.9\n", - "5000: 70.1384, alpha=0.3, epsilon=0.9\n", - "10000: 121.8586, alpha=0.3, epsilon=0.9\n", - "15000: 149.6368, alpha=0.3, epsilon=0.9\n", - "20000: 168.2782, alpha=0.3, epsilon=0.9\n", - "25000: 196.7356, alpha=0.3, epsilon=0.9\n", - "30000: 220.7614, alpha=0.3, epsilon=0.9\n", - "35000: 233.2138, alpha=0.3, epsilon=0.9\n", - "40000: 248.22, alpha=0.3, epsilon=0.9\n", - "45000: 264.636, alpha=0.3, epsilon=0.9\n", - "50000: 276.926, alpha=0.3, epsilon=0.9\n", - "55000: 277.9438, alpha=0.3, epsilon=0.9\n", - "60000: 248.881, alpha=0.3, epsilon=0.9\n", - "65000: 272.529, alpha=0.3, epsilon=0.9\n", - "70000: 281.7972, alpha=0.3, epsilon=0.9\n", - "75000: 284.2844, alpha=0.3, epsilon=0.9\n", - "80000: 269.667, alpha=0.3, epsilon=0.9\n", - "85000: 273.8652, alpha=0.3, epsilon=0.9\n", - "90000: 278.2466, alpha=0.3, epsilon=0.9\n", - "95000: 269.1736, alpha=0.3, epsilon=0.9\n" - ] - } - ], - "source": [ - "#code block 11" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 20 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(rewards)" - ] - }, - { - "source": [ - "A partir deste gráfico, não é possível determinar nada, porque devido à natureza do processo de treino estocástico, a duração das sessões de treino varia bastante. Para dar mais sentido a este gráfico, podemos calcular a **média móvel** ao longo de uma série de experiências, digamos 100. Isto pode ser feito convenientemente usando `np.convolve`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 22 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "#code block 12" - ] - }, - { - "source": [ - "## Variando os Hiperparâmetros e Observando o Resultado na Prática\n", - "\n", - "Agora seria interessante ver como o modelo treinado se comporta. Vamos executar a simulação, seguindo a mesma estratégia de seleção de ações utilizada durante o treino: amostragem de acordo com a distribuição de probabilidades na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [], - "source": [ - "# code block 13" - ] - }, - { - "source": [ - "## Guardar o resultado num GIF animado\n", - "\n", - "Se quiser impressionar os seus amigos, pode enviar-lhes a imagem animada do poste de equilíbrio em formato GIF. Para isso, podemos usar `env.render` para produzir um fotograma de imagem e, em seguida, guardar esses fotogramas num GIF animado utilizando a biblioteca PIL:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "360\n" - ] - } - ], - "source": [ - "from PIL import Image\n", - "obs = env.reset()\n", - "done = False\n", - "i=0\n", - "ims = []\n", - "while not done:\n", - " s = discretize(obs)\n", - " img=env.render(mode='rgb_array')\n", - " ims.append(Image.fromarray(img))\n", - " v = probs(np.array([Qbest.get((s,a),0) for a in actions]))\n", - " a = random.choices(actions,weights=v)[0]\n", - " obs,_,done,_ = env.step(a)\n", - " i+=1\n", - "env.close()\n", - "ims[0].save('images/cartpole-balance.gif',save_all=True,append_images=ims[1::2],loop=0,duration=5)\n", - "print(i)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/2-Gym/solution/Julia/README.md b/translations/pt/8-Reinforcement/2-Gym/solution/Julia/README.md deleted file mode 100644 index 0bb4a9b55..000000000 --- a/translations/pt/8-Reinforcement/2-Gym/solution/Julia/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/2-Gym/solution/R/README.md b/translations/pt/8-Reinforcement/2-Gym/solution/R/README.md deleted file mode 100644 index 46242179c..000000000 --- a/translations/pt/8-Reinforcement/2-Gym/solution/R/README.md +++ /dev/null @@ -1,15 +0,0 @@ - - - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/2-Gym/solution/notebook.ipynb b/translations/pt/8-Reinforcement/2-Gym/solution/notebook.ipynb deleted file mode 100644 index e05e67102..000000000 --- a/translations/pt/8-Reinforcement/2-Gym/solution/notebook.ipynb +++ /dev/null @@ -1,524 +0,0 @@ -{ - "metadata": { - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.7.0" - }, - "orig_nbformat": 4, - "kernelspec": { - "name": "python3", - "display_name": "Python 3.7.0 64-bit ('3.7')" - }, - "interpreter": { - "hash": "70b38d7a306a849643e446cd70466270a13445e5987dfa1344ef2b127438fa4d" - }, - "coopTranslator": { - "original_hash": "5c0e485e58d63c506f1791c4dbf990ce", - "translation_date": "2025-09-03T20:56:26+00:00", - "source_file": "8-Reinforcement/2-Gym/solution/notebook.ipynb", - "language_code": "pt" - } - }, - "nbformat": 4, - "nbformat_minor": 2, - "cells": [ - { - "source": [ - "## Patinagem no CartPole\n", - "\n", - "> **Problema**: Se o Pedro quer escapar do lobo, ele precisa ser capaz de se mover mais rápido do que ele. Vamos ver como o Pedro pode aprender a patinar, em particular, a manter o equilíbrio, utilizando Q-Learning.\n", - "\n", - "Primeiro, vamos instalar o gym e importar as bibliotecas necessárias:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 1, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Requirement already satisfied: gym in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.18.3)\n", - "Requirement already satisfied: Pillow<=8.2.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (7.0.0)\n", - "Requirement already satisfied: scipy in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.4.1)\n", - "Requirement already satisfied: numpy>=1.10.4 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.19.2)\n", - "Requirement already satisfied: cloudpickle<1.7.0,>=1.2.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.6.0)\n", - "Requirement already satisfied: pyglet<=1.5.15,>=1.4.0 in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (from gym) (1.5.15)\n", - "\u001b[33mWARNING: You are using pip version 20.2.3; however, version 21.1.2 is available.\n", - "You should consider upgrading via the '/Library/Frameworks/Python.framework/Versions/3.7/bin/python3.7 -m pip install --upgrade pip' command.\u001b[0m\n" - ] - } - ], - "source": [ - "import sys\n", - "!pip install gym \n", - "\n", - "import gym\n", - "import matplotlib.pyplot as plt\n", - "import numpy as np\n", - "import random" - ] - }, - { - "source": [ - "## Criar um ambiente de cartpole\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "env = gym.make(\"CartPole-v1\")\n", - "print(env.action_space)\n", - "print(env.observation_space)\n", - "print(env.action_space.sample())" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": 2, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Discrete(2)\nBox(-3.4028234663852886e+38, 3.4028234663852886e+38, (4,), float32)\n0\n" - ] - } - ] - }, - { - "source": [ - "Para ver como o ambiente funciona, vamos executar uma simulação curta de 100 passos.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "env.reset()\n", - "\n", - "for i in range(100):\n", - " env.render()\n", - " env.step(env.action_space.sample())\n", - "env.close()" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": 3, - "outputs": [ - { - "output_type": "stream", - "name": "stderr", - "text": [ - "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/gym/logger.py:30: UserWarning: \u001b[33mWARN: You are calling 'step()' even though this environment has already returned done = True. You should always call 'reset()' once you receive 'done = True' -- any further steps are undefined behavior.\u001b[0m\n warnings.warn(colorize('%s: %s'%('WARN', msg % args), 'yellow'))\n" - ] - } - ] - }, - { - "source": [ - "Durante a simulação, precisamos obter observações para decidir como agir. Na verdade, a função `step` retorna-nos as observações atuais, a função de recompensa e a bandeira `done` que indica se faz sentido continuar a simulação ou não:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "source": [ - "env.reset()\n", - "\n", - "done = False\n", - "while not done:\n", - " env.render()\n", - " obs, rew, done, info = env.step(env.action_space.sample())\n", - " print(f\"{obs} -> {rew}\")\n", - "env.close()" - ], - "cell_type": "code", - "metadata": {}, - "execution_count": 4, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[ 0.03044442 -0.19543914 -0.04496216 0.28125618] -> 1.0\n", - "[ 0.02653564 -0.38989186 -0.03933704 0.55942606] -> 1.0\n", - "[ 0.0187378 -0.19424049 -0.02814852 0.25461393] -> 1.0\n", - "[ 0.01485299 -0.38894946 -0.02305624 0.53828712] -> 1.0\n", - "[ 0.007074 -0.19351108 -0.0122905 0.23842953] -> 1.0\n", - "[ 0.00320378 0.00178427 -0.00752191 -0.05810469] -> 1.0\n", - "[ 0.00323946 0.19701326 -0.008684 -0.35315131] -> 1.0\n", - "[ 0.00717973 0.00201587 -0.01574703 -0.06321931] -> 1.0\n", - "[ 0.00722005 0.19736001 -0.01701141 -0.36082863] -> 1.0\n", - "[ 0.01116725 0.39271958 -0.02422798 -0.65882671] -> 1.0\n", - "[ 0.01902164 0.19794307 -0.03740452 -0.37387001] -> 1.0\n", - "[ 0.0229805 0.39357584 -0.04488192 -0.67810827] -> 1.0\n", - "[ 0.03085202 0.58929164 -0.05844408 -0.98457719] -> 1.0\n", - "[ 0.04263785 0.78514572 -0.07813563 -1.2950295 ] -> 1.0\n", - "[ 0.05834076 0.98116859 -0.10403622 -1.61111521] -> 1.0\n", - "[ 0.07796413 0.78741784 -0.13625852 -1.35259196] -> 1.0\n", - "[ 0.09371249 0.98396202 -0.16331036 -1.68461179] -> 1.0\n", - "[ 0.11339173 0.79106371 -0.1970026 -1.44691436] -> 1.0\n", - "[ 0.12921301 0.59883361 -0.22594088 -1.22169133] -> 1.0\n" - ] - } - ] - }, - { - "source": [ - "Podemos obter o valor mínimo e máximo desses números:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 5, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "[-4.8000002e+00 -3.4028235e+38 -4.1887903e-01 -3.4028235e+38]\n[4.8000002e+00 3.4028235e+38 4.1887903e-01 3.4028235e+38]\n" - ] - } - ], - "source": [ - "print(env.observation_space.low)\n", - "print(env.observation_space.high)" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 6, - "metadata": {}, - "outputs": [], - "source": [ - "def discretize(x):\n", - " return tuple((x/np.array([0.25, 0.25, 0.01, 0.1])).astype(np.int))" - ] - }, - { - "source": [ - "Vamos também explorar outro método de discretização usando intervalos:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 7, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Sample bins for interval (-5,5) with 10 bins\n [-5. -4. -3. -2. -1. 0. 1. 2. 3. 4. 5.]\n" - ] - } - ], - "source": [ - "def create_bins(i,num):\n", - " return np.arange(num+1)*(i[1]-i[0])/num+i[0]\n", - "\n", - "print(\"Sample bins for interval (-5,5) with 10 bins\\n\",create_bins((-5,5),10))\n", - "\n", - "ints = [(-5,5),(-2,2),(-0.5,0.5),(-2,2)] # intervals of values for each parameter\n", - "nbins = [20,20,10,10] # number of bins for each parameter\n", - "bins = [create_bins(ints[i],nbins[i]) for i in range(4)]\n", - "\n", - "def discretize_bins(x):\n", - " return tuple(np.digitize(x[i],bins[i]) for i in range(4))" - ] - }, - { - "source": [ - "Vamos agora executar uma breve simulação e observar esses valores discretos do ambiente.\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 8, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "(0, 0, -1, -3)\n(0, 0, -2, 0)\n(0, 0, -2, -3)\n(0, 1, -3, -6)\n(0, 2, -4, -9)\n(0, 3, -6, -12)\n(0, 2, -8, -9)\n(0, 3, -10, -13)\n(0, 4, -13, -16)\n(0, 4, -16, -19)\n(0, 4, -20, -17)\n(0, 4, -24, -20)\n" - ] - } - ], - "source": [ - "env.reset()\n", - "\n", - "done = False\n", - "while not done:\n", - " #env.render()\n", - " obs, rew, done, info = env.step(env.action_space.sample())\n", - " #print(discretize_bins(obs))\n", - " print(discretize(obs))\n", - "env.close()" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 9, - "metadata": {}, - "outputs": [], - "source": [ - "Q = {}\n", - "actions = (0,1)\n", - "\n", - "def qvalues(state):\n", - " return [Q.get((state,a),0) for a in actions]" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "# hyperparameters\n", - "alpha = 0.3\n", - "gamma = 0.9\n", - "epsilon = 0.90" - ] - }, - { - "cell_type": "code", - "execution_count": 11, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "0: 108.0, alpha=0.3, epsilon=0.9\n" - ] - } - ], - "source": [ - "def probs(v,eps=1e-4):\n", - " v = v-v.min()+eps\n", - " v = v/v.sum()\n", - " return v\n", - "\n", - "Qmax = 0\n", - "cum_rewards = []\n", - "rewards = []\n", - "for epoch in range(100000):\n", - " obs = env.reset()\n", - " done = False\n", - " cum_reward=0\n", - " # == do the simulation ==\n", - " while not done:\n", - " s = discretize(obs)\n", - " if random.random() Qmax:\n", - " Qmax = np.average(cum_rewards)\n", - " Qbest = Q\n", - " cum_rewards=[]" - ] - }, - { - "source": [], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 20, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 20 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "plt.plot(rewards)" - ] - }, - { - "source": [ - "A partir deste gráfico, não é possível determinar nada, porque devido à natureza do processo de treino estocástico, a duração das sessões de treino varia bastante. Para dar mais sentido a este gráfico, podemos calcular a **média móvel** ao longo de uma série de experiências, digamos 100. Isto pode ser feito convenientemente usando `np.convolve`:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 22, - "metadata": {}, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "[]" - ] - }, - "metadata": {}, - "execution_count": 22 - }, - { - "output_type": "display_data", - "data": { - "text/plain": "
", - "image/svg+xml": "\r\n\r\n\r\n\r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n \r\n\r\n", - "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXsAAAD4CAYAAAANbUbJAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjAsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+17YcXAAAgAElEQVR4nO2dd3gVZfbHvycdAiGUAKEZelGqkY4gICDo4rr6U3dVVKxrWdeKde2ylnXX1bWiYu8FpYmAKCol9AABAgQIBAglQALp7++PO3Mzd+70O7fk3vN5njyZeeedmXfu3HvmzHlPISEEGIZhmOgmLtwDYBiGYYIPC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMDJIR7AADQokULkZWVFe5hMAzD1CtWrVp1SAiRYaVvRAj7rKws5OTkhHsYDMMw9Qoi2mW1L5txGIZhYgAW9gzDMDEAC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMDsLBnGIaJAUyFPRGlENEKIlpHRBuJ6DGp/V0i2klEa6W/flI7EdFLRJRPROuJaECwL4JhwoUQAp/n7EFldW24h8IwhlgJqqoAMFoIUUpEiQCWEtFcads9QogvVP3PA9BV+hsE4FXpP8NEHXNz9+OeL9aj4HAZ7hnfI9zDYRhdTDV74aFUWk2U/owqnkwG8J603zIA6USUGfhQGSbyOHaqCgBw6ERlmEfCMMZYstkTUTwRrQVwEMACIcRyadNTkqnmRSJKltraAtij2L1QalMf8wYiyiGinOLi4gAugWHCB4V7AAxjEUvCXghRI4ToB6AdgIFEdAaA+wH0AHAWgGYA7pO6a33//d4EhBBvCCGyhRDZGRmW8vgwDMMwDrHljSOEKAHwE4AJQogiyVRTAeAdAAOlboUA2it2awdgnwtjZRiGYRxixRsng4jSpeUGAMYCyJPt8EREAC4EkCvtMgvAVZJXzmAAx4QQRUEZPcOEmVrpnVUYTmPFBt+v34dVu46GexiMDlY0+0wAi4loPYCV8NjsvwfwIRFtALABQAsAT0r95wDYASAfwJsA/ur6qBkmQnjn150AgFnr+OX11o/W4E+v/hbuYTA6mLpeCiHWA+iv0T5ap78AcEvgQ2OYyGfbQY+jWnmVr599eVUNVhYcwYiuPB/FRAYcQcswQeDRWRtx5YwVyNt/PNxDYRgALOyZKOPD5bvw2co95h2DjKzxnyivDtk5K6pr8I9vc1FVw9G8jD8s7Jmo4sGvc3Hvl+tt7fPBsl3YeajM1XHIE5Wh9MO/94v1mPn7Lpz97OIQnpWpL7CwZ2KSkpOVKD5RASEEHvomFxe+8mtAx5twemvNdgqhtP9l2yEAQNGxchwqrbC0z9wNRciaNtsbCcxELyzsmZhkwBMLcNZTP3pdJwMVdh2aN9Rs31tSHtBx7XCkrC5lw/8WbzfsW3yiAmUV1XhtiaffzkNluPWj1fh4xe6gjpEJHyzsmZjE6x8vAvOPv3poFgCgVVqK5vZtB04EdHynmD28znrqR5z/36UorfDMKdQKge/XF+H+rzb49T1cWoGsabOxcPMBS+cuq3A2T3Gqsiak8w3Xv5cTUw83FvZMTBNoKJRsptETrtW14Qm2+s6C3//OQ2XYXuyZqyg1mEjeVOTxKHrn1wJL5z79H/ORf9D+Q67nI/PQ9cG55h1dYsGmA5oPt2Bj1cTmNizsmZimNkDN/rf8wwCAlxZu09xeFaY895U2NeSftribjHDjPnsup1v2h+cNKNQs33EY2U/+iHm5oU8qwMKeiXpeXrQNd362VnNbgLIeW0zMNG5r9vtKTiFr2mx8u3avq8dtmZbsXe720FzNCetgpoQ4WRk6F1XA13zn5C3EKTmSl9a6wmMhO6cMC3sm6nn+h634arW5cHzw6w2ue6XY1bDNeG7+FgDA3z7Rfng5JbNJ3ZxDZXUt1u4p8a6T5ED6a/5h3dw3gc591ITY3KU83dh//YwCl11v9ZAfag0S40NyPiUs7JmoJGvabNz3hbm/vdKM8+Hy3brmGKe4bcZJSdT/yd43wXmlrMR4a6JAby5ALazJps9pqOc21Oa7/cdD4zU1e73HfPP1GnffzKzAwp6JWj7N8Y2k3V5c6tdHrZAGatZR47YMS06o0wgHPf0j8vYfR8GhMmRNm42PVuxyfNz4OGvCOU5HiKuFtcXDeQl11K/64ZSU4FwU7iguxUPfbECthZtdcPgkAGD/sdC55MqwsGdihjEvLPFrU/88F2856Oo50xsmunq8FMXr/4HjFXjz550Y9fxPAIA9R045Pq6eEAeA2RvqJhP1uqmFNdmMHS456dx8tufISaxTmJ2soH6ot0hN1u5ogZs+WIUPlu3GVhPbf/GJCnTKSAUAnKqqcXw+p7CwZ2Ia9eu8kfWhsroWk176Bb/mH7J8/GqXNdZklQYaqDeRTFqKdgLcE+VVPr7oeh9PpcpcdeSkvZq8pQ598wFgxLOLMdlmBLRbnxsAlFV4BHd1jf4xtx44gbOe+hE7ikMzN6AFC3sm5thz5KR3Wf2bH9lNPyXxvpJT2LjvuC3f7CqX7TjJicER9o00hP2O4lJMfTfHp03vYaiM3gX0Hx56lIdY01V/biWnnBeM31vieaP6YlWhbp/cvaH3vlHDwp6JOUYoEoXd+tFqn21G5gdZPOxWPCzMqDHQ9pyg9uLQe5b8aUA7W8fVemaMfmEJVhQc8WnTM/esUZlRGibZE/bqCeK1e0rwyLe5ul4+xSc8Ub2L8qxF9cpU1dTio+W7/Wz26jcTJ5yq1H9gac0XhRoW9kxMIycPk3n7151+Oej3HDmJDQ79oqtq3fbG8RX2esLQonONl2cll04zCo9qzwscV7ms2nXFVNv8L3zlV7z3+y6/ojAysqZ8rerNw4zXl2zHA19vwOc5vlp4WoPA51aM5me27GdhzzARx6SXlvqsj3h2MS54ealO7zpOf2SenznCyI7rBPVEpJ4Zx6p3jczPW61F0Cona5WotdpaIXD9eznIUb0Z6KGnWS/bcdjS/laRbeay6UXG7n06dqoKX632fWAcLtM3BVVUh35CVg0LeybieG5+HuZv3B+047dpop20TMZKgI+W5lpWWYN3fyvwaat2WbP/RFWYRe/wahu6kkADoLR4YcFWn/XiExVYsOkArn/PXPP+bt0+fLNW23//pI5ppOCw/0RnTa3Aw9/k+szJKDl4vBxfSf7tB1R+9XbnPvo+9gPu/GwdNu6re+NTH1NJhc7DbF/JqaDcDy1Y2DMRxyuLt+PG91f5tdfUCld+GOkNkxztpzy3nvfI9Ll5PutVLmv2TVTmBr0UBvM36tuyQyFb5DQSRy24VN728RpsLtLOpaPnovjYd5v82tbsPor3l+3C3z/Vji6+Q9HevplvSuqaWoH8g6XImjYby228TWzcWzfuHq0b6/ar0LiO938vwNDpi3Drx2ssny8QWNgz9YbOD8zBzR+sNu9owiYdwWIHPWHfv0O6z7rbrpcNk6xN0KrZUHgMD3/jmfB0w4PnyhnLMeCJBbrbW0spnxPsRlepsOOPLkft1kjX98rifOQfrLOV/7a9TojLkawyNULgmTmbAQCv/7xD9xzPzN2MborMnD9trYvLGNalhe5+WuUpP1qxR3MswcJU2BNRChGtIKJ1RLSRiB6T2jsS0XIi2kZEnxJRktSeLK3nS9uzgnsJTCwxL0DzTiBeF0rBeqqyRtNdsEtGI591ZWRpba0wfNW3NgZfQW1Vbl/y+m94f9kulFZUY6mNOAE9ftl2CEfKKnVt0bLg7dgiNaDznLKRIE1+rtTWCuwrOYXn5m/BJa/9ptlXbbOvqRVYmOcR3Ivy9APrXl+ywyff0dDOdQLeaJ5kh0buncY23VMDxYpmXwFgtBCiL4B+ACYQ0WAA/wTwohCiK4CjAKZK/acCOCqE6ALgRakfw0QE3wSQk0QpaEe/sASXvv67Rh/fdeXE3yuL8zHo6YW6NmUr2H1Y1dQKHC+v8nq1LNx8EFe/s9Lx+dVco3Msed7DKDLXCqcqrV+vLGxrhMDlby7z7C89kI+ZmJOcJmLLaFwXeWv3EFbSK7iJqbAXHuR3oUTpTwAYDeALqX0mgAul5cnSOqTtY8huViQmavlpy0EUn3CneMPGfcfw8iJ7ics+DKAykVogrCs85memUNvQlRO0SySPl0CSbvnbwI0FxqSXfkGfR3/wrt+hY892itI0okR+MDr55Zcoom+bNUqyLBTlB0tNLbBLykEjP59HPm9chN2p4FW+WdUKgRlLd+K5+Xn6OyjI0ckgGiws2eyJKJ6I1gI4CGABgO0ASoQQ8jtWIYC20nJbAHsAQNp+DEBzjWPeQEQ5RJRTXOxu4QQmMhFC4Op3VuKyN/w1Yidc8N+leP6HrYZ91JpwUYn1/DGnKmt8smC+9ctOvz5+9m/VqnKCVv5xV+j4jjvBzIyTF6aiIAelB7qT9ABK09fD3+Si0wNzLAljWdgfVXgiyZ+PWe6d71R28xcXbLVUhvGmDxSOBAJ44vtNeMWk/m+4sCTshRA1Qoh+ANoBGAigp1Y36b/Ws9zvTgkh3hBCZAshsjMy9EPUmehB/r1q2S9lRktJvewczwi1Nn7QxltFz0fm4V8Kl8IvV/uHw6vH0CzV19NHy/UykND8Sb0zHe/rFupJ5x83+QvFuZI/vlk+fy3ziVbZPjmD6c9bi5E1bbbmseT9lG9OAsJSKoZftvkqnP9ZuA1TZ3rcRn/NP4SsabNNJ9vdzLcTDGx54wghSgD8BGAwgHQikmcY2gGQHWULAbQHAGl7EwDWIiuYqMb7am/Qx+hBoIeRO6bd4KJAGdTJ9yVWK1gnkPS2Qzr7vSSHnNtUroLXafjSWw1SeusXf8+XCf/+xa/tsCTI//dTvu6xrnp7hV9bVY2wlD5Zzw8eAP7y1nIAwAfLjFNIq1NLRBpWvHEyiChdWm4AYCyAzQAWA7hY6jYFwLfS8ixpHdL2RSJUUQNMRFNnx3VXAMvfLq2vmVNty2nZP2WQDaBdlGOrSSlDNXn7j+OdXz0mJPXRwvHDmptr7hE1tIvnoWRUkWnBpgN4Zq41+7b8nXFiWtebV1BiZR5pywHjlAdHDQLZjLhueEdH+9nFiu9PJoCZRBQPz8PhMyHE90S0CcAnRPQkgDUAZkj9ZwB4n4jy4dHoLwvCuJl6iMvBpF4Kj57CjkOl2FfirzEfL3eWJ/3Vn5zZXZXeGYDH5FFRXYN4xQPOivBRImu61wzr6Gekj1Q9qpmUH753uya6faxE18pU1wg8Omujo7eitTZz3euR1sBYXOq9zew+bOx91ad9uuF2tzAV9kKI9QD6a7TvgMd+r24vB3CJK6NjogorZhw91HZXZaTq6Bd+QnWtwMCsZv47OpSFTic2m6uKYFTXCnR/aB7OPK2pt00vmZgVIkGzt4a7I3t/2S5NW74V1u62J+yzmjf0VpRSYpbBVK94ydnPGXsCZSu+G8GEI2iZkBHIBNYuxY/vVGUNXltSp3nLppKaCNRyZW1Pr1C3HY6drLKl2RYdc/5QCRR54nXFTnfs2E4FPQD8bjOZml49XrM6uQePOxtjqBzTWdgzISOQGBKl//oJHdOMlmdHuMW/m7VVNxYdw3u/+04SGj3fLvivvepNbmImGJduCzyKN1jojd0sqZ3Te223hKNTWNgzIcOJfVkIgQWbDvjYQ4+d0hb2WrbZUCv7ZRXVPuMwE3p6ZE2b7edi+MrifNw6uovlYwSiDQfKGoXppEDDw+qKGctDORxbqEs/ymjlt1GiDnjL23/c0kR/qBzGQpucgYlpnMi9GUt34snZmzFU4XJ47os/W95/9e7QRine9fk6n3Ut3+zz+xj7yiv91pVFU37NP+xXNtHtZ9nbV2fbLgiixU6FgB/1/E946fL+OHSiAteGyPMkGHyrk4ZZDy0XUk1Y2DPRhmyzlwXUF6sKMbxLC7Q2yC//5GxPJkK7Hiwyf/0w8CyZgaBVg9aozi3g67depkoE5nISTT9G92gVlOPeLvnmbztYig6q9MKRhtIcGIr8NWzGYaIOWdjLybnu/nxdRL/Ou4GWZm9nolrd1T/rpfvCKJjeIR+v2I1/zrPmW+8WRoF1fTVcQ5XC/sUfjdNx6GHnIREqMw4Le8YV9L7cQghvoJGydJ1snlDmG49GtD4WI+28TJUnXy3MQ6FpntFW3ze+PmKU0fLu8d392pR1g79Y5Z8iwwr/WWg9QV+o8kSysGcCZs6GInR6YI5m6t73ft+FSS8txW/5h/Dh8rqMk3IIuhJ19Gm0onYRnbOhCFnTZuO6mSv9hItSTt00srPfHMRelc9+kt1K4xo8MLEnLh/YPuDjuMnoHi2Dclx1MRjA15/eaaUxW8Le0Rnsw8KeCZj7vlwPAPhcQwvK2++pCrXzcJmpa5q60He0otbW5XmFHzcfRO5e3wee0uX0tSXbsXiLb8Ku3YoH7PIHxmDj4+NxaXZggjopIQ4jutpPTtiiUbJ5J4cESyAmJ/gLe6UHlds1hLXQ8y5zGxb2TMDILmk/aFSRypVqdC7bcSTkbpCRipFZQZ2Qy+wzi1MYfFulpSAxPk63Lm2wCaY1wqkLqxmZGs4BynkRvYLnbtKicfAekkpY2DOuoZViYIOkqS42KPWmh7KIRTRhJOzV+ffNkqZZqVyVZrH8nbKEoLqwuRXcKkqjRbA07OYabyNK000gZSz1yGru643EZhwmIjlUWoGsabPx3bp9OF5ehSe/3+Td1qJRku5+aSkJttMl9Htcv6B1faZWCNTUCgx5ZqFfmcRyVU1X2fU0EBIs2vHH9apzuxwaAamUlVRVh+5txWmJQquo8+4EWrrRKizsGVtskbT36XPz8MycPLy1tK56U28DL47z+7aJWjPOZzcOsdW/tLwaldW1KDpW7p3vkLFSaMMuWsLkvDNa+7UpTUiRVkk0GLni9dIvh8JOr4Rz4zARyQGpCtDeklPe/N1yHdbzemfins/XadaF/WHj/rDZkoON3QIpLy3K934Wai2y3IWShWkpviYYLcVeK9mX+s2rbXqDgMcSyXRt1UizPdiafbhgYc/oIoTw8xzZXHTcuyxPmsn/5+Xux+erCjXrwhYcPomhnVtonqf/4z/gjk/WaG6rDxxxULSi1yPzAfhPPBpVTDJiYu86TT1O9fDR0uzj4wjjT/eNllULuQYabolGhLgoWMDozTEEazJYD9bsmbDT+9EfcI6qJux36+oKM/+oKshcWmGcKEqtccocPVmFb2zmHXGbu8d1c7yvmxPJLR16ZijNLuoHtJawv/Ss9pg6vJNPmzrRl16qXz3s9jdjapDz6Dx/SV/N9mCbG9VzW2yzZ8JGaUU1sqbNRmlFtd9k0sET+vnU1bnLlfbnsT1bRrQZZ4jOW4cVurdu7No4lmwtNu+kgZHASIj33fbjnWdjcKfmGNixGWZMyfa2b1NFMyfpZH/Uw+lbiR7BNKe0SkvGsC6ee948Vd+xIBh8fP1g/H1snXLB3jhM2DjjH/N1tyl/fyO66gvI8qoa9Hh4nnd9cKfmPtkcI4U2kp91IIXJu7RshC9vHurWkByhHL16cjVBdW2dM+ps1crUCEoTHQAkxYfXLuM0VYEVFtw50rusNnsFkxFdW6Brq8b429iu3jZOl8BEPOkNPRqRlqDUCg5atsN9jwqnvHbFAKx8cKz3XSM+gB9cw6QEDOgQmjqiehjJq8Nllbhy8GnedaVwaZWmn3HULH97sLGS5O2/l/tVTLWE0qQYaHyAnYLh708d5F1u38wzAc6aPVNvsPK6LSBw48hOpv1CxYiuGchonOy1z8bZ+CXcf14Pv7Zwuyoanb/kZBUenNTT9jG3mAR0BZvINfoBtymKyDx0fi9Hx/j8xqF47YoBIXuzYGHP4EhZJY7rlPpzyk9b/CNmX9Dw0gkWPTPTDLfLNm55HsHOJNmNIzujkyLaNBIwG32lg0T46RpRtI0tRuO6QSA1i43o0lLb5RKw7hlz1zj/bJl2ad0kBRPOMC5k4yamwp6I2hPRYiLaTEQbiehvUvujRLSXiNZKfxMV+9xPRPlEtIWIxgfzApjAGfDEAvR59Afb+2nlapf52ydrfdZnLN2JvSXuFsD+6e5RutvMfrPqH7WVH/n401uhhzQZG2la51drjMvfNUryCOnbbJQ1/EPfNn5tTtIoOMXK/OzI7vYTtv2osNeridbAP8CaZl8N4C4hRE8AgwHcQkTye8uLQoh+0t8cAJC2XQbgdAATAPyPiOw57DJhxWjiVcncXP/EZ3ocOO5+3pQsA+3a6oSrnOjKimb/+pXZmHfH2dYGF2TsCt24OELB9Em2NNLxp3t895VvMWYxBdcN74ibRna2NTYtRvdoaclmn5aSiB1Pe/VM3DyqMz5Q2MXVPOTAnBUtmAp7IUSREGK1tHwCwGYAbQ12mQzgEyFEhRBiJ4B8AAPdGCzjLsdOVaGi2j88f3An37woe46c9EbORhp6KRrMZL0s2+VJSLtm02BUiLLD97cNd/2Y6jmVoV1a4Pf7R/t4rsjLKYnaouOh83uhUbI13U7P5XFsz1Z4++qz0L6ptfKFSpv39+v3GZp/AvG6knnnmrP82sxKTQLASw4nk93Cls2eiLIA9AcgV564lYjWE9HbRCTXMmsLYI9it0IYPxyYMNH3sR9w0f9+865nTZuNmb8V+PUb8exiDHp6YQhHZh09bwyt6M9hXeoeYuq6n+GeYLVLexfruA7q2AyAtsDKbNLAR0C2TW+AgumTsPyBsbqBaLLw7WpgGwf0I3RrpNw0vTVKBpqx58gpNG2o7zfvxl0epfE5vXlVXbyC3ptxqs2IZLexLOyJqBGALwHcIYQ4DuBVAJ0B9ANQBOAFuavG7n6PWiK6gYhyiCinuNhZIAnjnG2Sp8XGfb6+1f+YtTEcw3FMok7gT8Mk/4nEBIXLjSy/5PS/ekLg+hHBjeIMBKMso3aQg67s5P9q0iARt47u6tP2x/4enU42iZlNsOoVs1Gn4bBD4+QEpFp8s3CKlmKgDEB79A+na+53tgXtP5hYEvZElAiPoP9QCPEVAAghDgghaoQQtQDeRJ2pphCAslROOwB+sfBCiDeEENlCiOyMjPB+CLFIcWnwco87wUwL1EPrrXxsz5Z4WMMdTlkFSv7BJkuZD/Vs9r3bafvPy/t/fpO9jJdu4pYlSb72QLM9pjf0zCPEe4W9cX+9eRzZlVcvvYYR8fFkrNkH8Q1umuSSm9E4GZec2c5nW9v0Bq6nk7CLFW8cAjADwGYhxL8U7UqfoT8CyJWWZwG4jIiSiagjgK4AVrg3ZMYNjL54Rn7z/YMUPETkzJ6qtc9bU87yKxABAGWVdUFC8l7HpZJwejKgfVPjzI+h9E5R888/9XHlOHKErdF9//624XjtigGGx5Ft8LIZx+zhcUZbbfdYWaN/aFJPPGLRh13O0NmuaQOkN0zE+X0yNR/EWt/fyf38vY6ccOPZnbDj6YlIS0nEMxf19tlmN/VEMLAygmEArgQwWuVm+SwRbSCi9QDOAfB3ABBCbATwGYBNAOYBuEUIEfzaXowtWjXWj5w0ErqntzH2X7fCoxf0woWqH1gcEZo5yFGSoVP3VEuDG9WtpWK7578c6aun2evVVd15qMyvrbVBNGowOPO0puadLBAvmbeMhP0ZbZtY9gk/Q/qO9G9vPL42TbQfpLXSOFKTE3CtxehUeXK5b7t0EBFe/vMAnJXVzKdPzkNj0UfjTe2JC8+wdA4ziMj7oFMXjFGnrAgHVrxxlgohSAjRR+lmKYS4UgjRW2r/gxCiSLHPU0KIzkKI7kKIucG9BMYJRknJ9IT920t3ouRk4MFXU4ZmITXZ16ZeUV3ryMPFzmv5PEWNXHm/RtI4GupMniXreJ3IKGMH/jKog+WxuIHepdsVK3KQUdMAE4LJz4pBnZpj+QNjfNIua6FV/xUAaix+D/oqJnDJGySnzZJ7Ruk+uPXMRaMc+PDrYbVaWDAJ/wiYoCGEwKK8A5rBT0a/Jz0l5PHvN+H79UXaG21ARLhYZdOsrK7VtPEqPWiCid5Dw8yMfbKi7qX15lGB+5e7gd1H5l3juuH9qQP9NGG7KD25jHLuyOgJdavZLpVxFrKicEqnQLiTNMLPumQmA/yTzIUDFvZRRnVNLW7/eA027TuOV5dsx7Xv5uAJRZ1YGSNPCbVbYjDo38H3Fb9FoyTU1Aq/4tjn9vQtsBEIsouhFnoPuETJU2WgjiBUCqxQa29W71Oyib04MT4OI7oGrsUeVgVcDeroeVC/8mdtW79aB5FNHVZ81gHf5HVyLd+vdSKJzfLPTOrtb6IKdDJX77rDBQv7KGPHoTLMWrcPE1/6Bc/O2wIAmPn7LszLLUKZorjI+sJjeocIC/FxhFoh8CeVxq/8kVqN7NXjuhH6idi0BOel2e3RvFEyCqZPwmc6XjdWA4jcpGD6JM+CjixSm8OSwmRCaJqahILpkzCpT6amSadG9dok55dXpmA2QvnduELK6qlnSjMzmb94aT+seHCM3z5P/7G34wC2SX1Cl/fGCizsowy97/RNH6zGtK82eNeX79RPNzw3N3BTjV2ICEJ4XrevHprl0y5z7bCO+G3aaEfHv/+8HprauSwYSeOXcG4v/bcK2QunV6Z54I+ebdpNOiiCrNQvbZP7u+NtYkYPgyIu3Vt5Jm1lU9fAjs1QXeM70LvGdcODE3viAo2cPEr+fWk/AHXzLYDHx/+tq7LxmI6Pu555RyYpIQ4tVU4L8XGEPw/q4JPzvz7Dwj7KMHrz3H2kruqU0WTo6t0luttG92ipuy0QjpRVorSiGodKK5CSWKctKzWyuDhCG40i2B9ep58LRaZVWophGmOtj23fMf3EbfKErpXJxFJFXninWSO1JpCV9/rZi/Xty+eFKLOiUVKyW0d3wZc3D8V9E3rgzauy8f7UgX5BU8kJ8bj+7E5+DgK3j/EN3jq/TybuHtcN94yvy/NDRBjbq5WuKa2Rg8/9pMkDor7Bwj7qMJD2CsFkZQJN+xDByQkjuzJ+u3afz+u9cmJN71Vcfv0HgDeuPFP3HHYn6YwmCmWBVGthMvGEwnw2pJP2hLPaD1vtpy3nAFIH68go507BDLIAAB5KSURBVGDUIwpVJoi2Gg9imfg48rqKnturFZIT4i1PxGarXEwT4uNw6+iufh5dRlg1ZXXKqJv0VR5f+WCRuXxgB812La4ZlmWpXzBhYR9lGP2wjygKYzv10Q5iWVAvyrwvPpq9wcWdJgVR6b1yt0pLMfxstCbjurbUN0skeAOH7H0getegFkbqdXm/sxSTzMojpSrSQ6ifx6EoaD2sS3NcMeg0844K1MJezx1YmWbgkxsG2x8crJcenHVrnX1emcvmNI0gvWcu6o1bzrGWMtrouxQqWNhHGUZf6T1H6swSTos5Oy2IbQel0FAKLiOZNfOagbh9TFdN+/hzF/fBkM7NbQs9I/kgexPp+efroTeERJN6r17ThuLzUNqse2TWCZN+qijRUCj2fxrQznbFJav+9ACw4oEx+PLmoX4ZWa1iteyk8jNVmpMCVXL0ooVDSejKzjAhwaq72M/bIjf5nFJoLMqrq3hl5GqY1SIVd56rnYUxo7EnmMaugmv0WT5zUW9cMyzLtjlMT76ZuW2SV9YLRRvhg6mD8P6yAiQn1D10/tC3DVo1Tsalbyzz9gsWk/pkYvb6Ikdup2qFw+j+tkxLQcsAIpSdpOJQfm5OzZf5T52HgsMnDatjhQrW7KOI4+VVun7GMq8t2Q4AeOfXghCMKHDi4wj92ns0VacR57JA1hImsneIli+6kYxMSYzXDL03Q8scAAAX9PH1QFGfW09YDe/aAq9fme3XrpzIDmbuffnYTu6NOuulUVR3oITClKVFQnxcRAh6gDX7qMJKacHpc/NcqSQUKpQTl04LM8sapNbut47u6peq13u+IAiIjhrVtQZ0SEc7VcK1MT1bIS0lAcclTx5ZMFo1JyhTAARzmkWeS3fyWQWrxqwWgeamkYeqVaqxvsCaPeMKcnpbtyk8esorrALNJWXFnKFMtbxi5+HATqg5Bv+27q3T/K6tSYNEzL59hHf913zPWL5b55ctXJMmivsRTJlaG4Bm73TeyAlOFYVogoV9PWb5jsPImjYbBRoZGENF89QkbHlyQtBCw1ftOqpYc/aDlQWs2e99zcPn+nhjHCo1rrdqh/sm9ECvzDS0VmR6bCNNJv+hbxvNB5GWgDqh8Nm3SqVBYfhAkeW1k3kBdVCV1UnUYBMsxSXcsBkngjlwvBylFdW64ePfrPVoeb9uP2RYfDuYpCTGIzkh3kcMd2jW0CeAyy2cygLZVm8mkNRZH7cXlzo7oQY3j+rsnR8474zWmHBGa0zuV1etM2+/f6IsrdE6sWuv31NiOd+MXWQvIidmEqXb6gMTe0SMbXvtI+PCPYSgwMI+gpHrvnpzoahIkn5oVdXB09zMGCj5fSsF6ZmnNdUV9p0znD+UQq33bZVKN7rNq1f4B35pmVq0nk25e+1nT3QaQGeFJy48A+2aNsCo7vYjq5U2+xvOjux5pLQGHlHZKk07TXJ9gIV9PaZK0ozCWWJQjvRUCiYj7w+tdAdK1JWfOrZIDdjobJQmwYhQBsLIV9gzMw3T5c/Upcfb6J7BSXEBeIq7PDjJWjUpNS0b1x/BeU73lvjX//WNuORmdmCbfT1mzgZPwrJXFm8P2xjkPDZKsbS5SF8jNpuUO3bKtziK0uUwmP7iWgQrD5AW8gNySKfm6Bugq6kavaId4SZbSkx3ncVqVOGEiHDRgHY+8Qz1DRb29Ri5apS6xJ8dPphqnkTMCsrJxC0G5g8zd7uemZ5Iw2uHeQRAIAU1ZN95py8GoawbKrwTnYpGDWFvZ/Lwrauy8anD9AKhxEnAE2MfFvZRQEJ8nKWEXDJZ02Z7l4cHmCNexurP1UzwPj7Zk6L2ppGd0LRhok+6Y7s4qWmrxKzoh1WsJOHScmFs1rBu/PIEq53Sh2N7tcIgh+kFooV7xnc3TL0cS7Cwr8dcdlZ7AJ6MiP/7KT9o51ELXPm8SqxaWJSavVYmQNkdr2VaCtY8Mg7dFT9Uu5GgRcfKAQB7j+qnKjYiOdH5K/tfR3X2ZuDsoBM1q6QulqDug1SmIHj9yjPx0fWDcPc4a1kWGQ+3nNMF8+44O9zDiAh4grYekxAvuxQCz/+wNWjnaZPu682hLNwtY2RP3/T4eCzZUoybP1ztEwGqFU2qDqEH6kxEdmNwZBfQds2MJ4X1cKLZt01vgN5tm+DeCT0AeEwpfdqbF7/wPgT1iogTMLSzO29hkUboQqtiGxb2UUKz1CQcKXMvCEhJlSr4peRkFR6c2NNH6zZS7BsmJXiTWCknaLX20cqEKAfb2I24TEmMk87jzCbsRNj/qqqkNdag2pUdIiXgyE2i74oiG9NvMxG1J6LFRLSZiDYS0d+k9mZEtICItkn/m0rtREQvEVE+Ea0nosiquhtFyHKxvKomaIIe0M59f/3ZnXzyjJt5yshavFwrFAC+X+9f/vBsjcLX8gSeXWEve3uo3TmtEsoJWjPClcgrmLSV8gEp6xcwwcOKZl8N4C4hxGoiagxgFREtAHA1gIVCiOlENA3ANAD3ATgPQFfpbxCAV6X/jENOVlajYZL/rZJF39Nz8oJ6/gwL/tC5e40LmDeTik8r2bTPP0BIyzPj6Yt64+VF+bYLrjx6wem4emgWWjusAevWBK0bRGNul0m9M9HsuiQM6Rzbk8ihwvTbLIQoEkKslpZPANgMoC2AyQBmSt1mArhQWp4M4D3hYRmAdCKqv5EILiGEcJxqttcj83WOGciIrJNoISpJq/jGvRO64zmD2qhWldXOGY3w4qX9bGvaSQlx6NbKuSdGUnz99amuDxARhnZpEfL4iVjF1q+HiLIA9AewHEArIUQR4HkgAJAjUNoC2KPYrVBqUx/rBiLKIaKc4uLILaThFh3vn4O7PlsX8HFeX7IdP0gTpBVVdQWRz8pyVmbQCu2aNsDFOrVPZZR1YGW6t2qMS7L9PXdkjjtI6gUA/7msH2ZM8c/h7jaJCaETQt55BZ6tZIKEZWFPRI0AfAngDiGEUYIO7fxN6gYh3hBCZAshsjMygpOkKdL4yqSwiBHHpACqZ+bm4Yb3V/kdzzc7pDWmDDGvGdqjdWPExZGhhg5om1+ClcJ2cr+2GNPTnYlP7eN7gtQymzjz4nECK7dMsLEk7IkoER5B/6EQ4iup+YBsnpH+y/XjCgEo1bl2AKwl4Y5S7AQ86fHb9kM+6+8v2+V7DgensFLPU37FNnvV1hL2ai8eM+6T3BXDzX8u64+C6ZMcT+w6Qf74QlnQg4ktrHjjEIAZADYLIf6l2DQLwBRpeQqAbxXtV0leOYMBHJPNPbHKzsOB55tX1/h8+JvcgI95pgXTz+Yi/5c4rYhE2TWwqSKcv1xhZtIiSxVs9OeB1qNDo41mqZ5JcHWa5Wcu6o2+7cz99BnGDCveOMMAXAlgAxGtldoeADAdwGdENBXAbgCXSNvmAJgIIB/ASQDXuDriesjyHUcCPsb+4+V+2n2gNE4211wzNTxZtLR42TVQqZdWmKRevnNcd9z+8RrveiS5Ooaai/q3hRACF/b3nd66fGAHXB7DD0HGPUyFvRBiKfTjH8Zo9BcAbglwXFGFVlSomoMnypHRKNlrLlHb4P+7cBsOnnA3lXGDJHNvk/SG/vllxvVq7dcmW3mUJqvKamPNvqzCd4JWy6MnVoiLI8PJbIYJlNhVpUKIme03d+8xDHxqIT7PKfS2qQtnuCXo7SYH03IXvW10F782cqDZK/OZF0yf5GeqYhjGPfjXFQIqdDTcrGmzkTVtNj5cvhsAsKKgztwTjBzkfx/bDRdKpfCmnWdtMnScRri/VoBPqvSWoJxkNRP2IzSiZRmGCQ6cGycEmAm9j1d4hH2ipNl+tnIPdh1xPqk7Y0o2ps7M8WufOqIjGibG465x3ZCabH7rVz98LtIteqQkxMd5I2QfkiaP9R5yMpzHnGFCBwt7FymvqsHGfcf9wvorqqzViJWLNt/75fqAxqH0QR/ZLQNLtnqC1uLIo5VbEfRA4Pngza5blvWRlJaAYaIV/pW5yKOzNuJPr/6GXZKr5Wc5e5B/sNRUw5UJhqL77jVneZfdqmlqFbO5CiLCfRN6YNatw0M0IoaJXVizd5FNkk96yckqnNYcuPeL9UhOiMP1Izp5++wrOaVbdNvNHCEfXz8YLdOSfY7ptPC2Xc48rSlW7TqKszqalxS8eVTnEIyIYRgW9i6yvtCT+fFwWYU3VUBFda2PZp9g4F7oZhpbrUyCdo7fVueBZIUGUoUnKy6noeaFS/oikc1GTAzCwj4IrCw4iiGd6hKDKSdodxSXoWXjFM2UwMEOlQ+VEUf2l49EYf8nk4RuDBOtsIoTBI6dqsI9X9RluFSmDZCXH9JId/DubwX4dOVuW+d6aFJPy31DVQDjkQtOx9ndMnweeAzDhBfW7IPAR8t9BbZSs1+ytRiz1u7TzQh535cbbJ1rytAsPDl7s6W+ZgUwWqelYP9xT5FurefCm1dlW8rJ37FFKt67dqClMTEMExpY2IcApQviO78WAACSXIoWVdcm/UPfNo6PpXwWaAn7c12qp8owTOhhM04AlFVU47n5eag0CZoqq/Qv0lHpkj1bra2/eGk/x8dSeu6E2k2TYZjgwsI+AK6bmYNXFm/HN2uNi5L8ss3dbJVGaEWlWk0wdk4PZQFx14bEMEwEwMI+AH7fcRgAsGZ3ScjPTQTT6lEyP/x9JF68tK9pv39ccDoW3TUSDZPiMS1CCokwDOMObLN3gd0B5LExY94dIzDh37/4tV8x6DTLKXE7tkhFxxaputu/u3U45m/cj8T4OHTKaIRNj09wPF6GYSIT1uxdoE2TBkGrt9o8VTv75Ucr7LloGtG7XRPcPb67a8djGCbyYGHvAkO7NMftn6wx7+gAoarV3q99OoDgFfNmGCY6YWHvAmUVNZi9PjhldlMSfatJrd0T+vkBhmHqPyzsXeDRWRuDduyGiealA7+8eUjQzs8wTHTAwl6DaV+uxyWv/Wa5f3UQTSpWSvWVW8yXzzBM7MLeOBp8snKP4facgiO4+LXfvetxBITThB6MEoYMw0QXpmojEb1NRAeJKFfR9igR7SWitdLfRMW2+4kon4i2ENH4YA08nCgFPRCe8nqt0uoEfLdWjUJ+foZh6hdWNPt3AbwM4D1V+4tCiOeVDUTUC8BlAE4H0AbAj0TUTQhhrVRThPPIt7nomZnm1x7kzMSa3DWuzlXSzaInDMNEJ6bCXgjxMxFlWTzeZACfCCEqAOwkonwAAwH8brxbZLLrcBlOa14XjPTe77s0+wXTZq9HUUl5yM/JMEz9JZAJ2luJaL1k5pErbLcFoDR4F0ptfhDRDUSUQ0Q5xcXFAQwjeIx87iesL4xMV8fOLfUjYhmGYdQ4FfavAugMoB+AIgAvSO1a9gRNtVcI8YYQIlsIkZ2RkaHVJSLYfeSkX1v/Duk+6/dOCH30aeHRUz7rvds24XquDMPo4kjYCyEOCCFqhBC1AN6Ex1QDeDR5ZcKWdgD2BTbEyEOd+OyLnEJHx9kcQA6aU5W+0yDf3TYc93HyMoZhdHAk7IkoU7H6RwCyp84sAJcRUTIRdQTQFcCKwIYYXuS87ifKq3T77DjkLBFag6S6gKl5d4zwLmc09njaZDVvqLuv3IdhGMYKphO0RPQxgFEAWhBRIYB/ABhFRP3gMdEUALgRAIQQG4noMwCbAFQDuKW+e+I8Oz8Pk/pk4vI3l7l63LvHdfNZ79G6zstn5YNjTfcf2rm5q+NhGCa6seKNc7lG8wyD/k8BeCqQQUUSuw6fRL/Hf0DJSX3N3gm3ju7q1/bhdYOQf7DUrz37tKbI2XUUo3u0xKK8gwCAZAtpFBiGYWQ4XYIF3Bb0rdNSNNuHdWmBKUOz/Npfv/JMNE9Nwp3n1r0NWK0+xTAMA3C6BC+HSyuwcd9xnN0t+J5BN43s5F3u2z4dI7q0MOzfvFEyVj18rk9bYhw/pxmGsQ4Le4m/vLUceftPIPcxdzI8/HjnSGQ2ScGO4jJc8PJSn23tm9VNvH57yzBHx09MYGHPMIx1WGJIbDlwAgDw1OzNrhyvY4tUpCYnoHe7Jt422bumVxv/lAt2SWFhzzCMDVizB5C3/7g3v82+klPGnS2ilRxt0V2jcOxUFZqmJjk+7tpHzsX+4+WWUh8zDMPIsLAH8MmKugwPp6qC5ykaF0cBCXoASG+YhPSGgR2DYZjYI+aF/UPfbMAHy+qKd6/YeSSMo2EYhgkOMW8LUAp6hmGYaCXmhT3DMEwsENPCvromsNqt7107EL/ce45f+9y/jdDozTAMEz5i2mb/yKyNAe2vF4ClVc2KYRgmnMS0Zj9nQ5HjfXu3rfOfb8kZKBmGiXBiWrMPpHbsjKuzvctL7jkHOw6VYtJLS/GPC3r59f3qr0NRXROGQrUMwzASMS3sA6Fl47pkZg2S4nF6myYomD5Js++ADk012xmGYUJFTJtxGIZhYoWYFvbCoR1nbM+WLo+EYRgmuMS0sHfCiK4t8MaV2eYdGYZhIoiYFvZ6ev3401vp7pPVPBVxGknOGIZhIpmYFvYnyqs12+dvPKC7zxCu/cowTD0k5oR9Ta3A/mPleOTbXL9tZlWqLj6zHSb2zgzW0BiGYYJGzLle/nNeHt74eYfmtkbJxkW8OygqTDEMw9QnTDV7InqbiA4SUa6irRkRLSCibdL/plI7EdFLRJRPROuJaEAwB2+XlQVHdAU9ACSZFATp3yHd7SExDMOEBCtmnHcBTFC1TQOwUAjRFcBCaR0AzgPQVfq7AcCr7gzTHS557XfD7ftKyr3Lc24fgXeuPguXD+zgbRtuUhicYRgmUjEV9kKInwGoK3pMBjBTWp4J4EJF+3vCwzIA6URUb4zcKwrqLrNXmzSc06MlhnWpm5AlYi8chmHqJ04naFsJIYoAQPovRxm1BbBH0a9QavODiG4gohwiyikuLnY4DPdY8cAYzfZmXAKQYZgowG1vHC3VV9OdXQjxhhAiWwiRnZFh7AUTCL9tP4SPlu9GZbVx7vqWaSma7a2baLczDMPUJ5wK+wOyeUb6f1BqLwTQXtGvHYB9zocXOH9+czke+HoDKi0UKpHTFr91VV2EbAanL2YYJgpwKuxnAZgiLU8B8K2i/SrJK2cwgGOyuSfcHCmt1N3WOSMVABAvRcY2Ta0z3TROSQzuwBiGYUKAFdfLjwH8DqA7ERUS0VQA0wGcS0TbAJwrrQPAHAA7AOQDeBPAX4MyagekJOlfavfWjQEAXVs2AgA0aeAv4FulsYbPMEz9xTSoSghxuc4mvxlN4UkjeUuggwoGRsVD+rbz+M8/ceEZmNyvLbpIQl9GL089wzBMfSGq0yUcKq3wLg+dvki33/UjOgEAUhLjMbwr+9IzDBN9RLWwv+Kt5Zb6cRZLhmGinagW9nn7T4R7CAzDMBFBVAt7K2x8bHy4h8AwDBN0olbYV1vwq7+wXxukJsdc4k+GYWKQqBX2XR6ca9qndzvOYskwTGwQtcLeCuVVNeEeAsMwTEiIaWE/4YzW4R4CwzBMSIhpYS/046wYhmGiipgS9lufPM9nPS2FJ2cZhokNokra1dQKfLJyN/4vu71Pe3JCHH6+9xwkJcThgYk90CApAWN6tNRNa8wwDBNtRJWw/2LVHjz4dS5KTlZ52+4/rwduHNnZu37D2Z21dmUYholqosqMU1rh8a5Zs7sEAHDjyE4+gp5hGCZWiSphXyUFUv24+QAAYN2eknAOh2EYJmKIKmE/fW6ez3r+wbIwjYRhGCayiCphr0aZ4phhGCaWiWphzzAMw3iIamGf89DYcA+BYRgmIohqYd+iEdeNZRiGAaJY2PeQiogzDMMwUSzs371mYLiHwDAMEzEEFEFLRAUATgCoAVAthMgmomYAPgWQBaAAwP8JIY4GNkxz5HTF7Zs1wPSL+qB1E06FwDAMI+OGZn+OEKKfECJbWp8GYKEQoiuAhdJ60Bn+z0UAgPQGSRjWpUUoTskwDFNvCIYZZzKAmdLyTAAXBuEcfhwqrQQAbNh7LBSnYxiGqVcEKuwFgB+IaBUR3SC1tRJCFAGA9L9lgOewxcTeXJCEYRhGTaBZL4cJIfYRUUsAC4goz3QPCenhcAMAdOjQIcBh1PHipf1cOxbDMEy0EJBmL4TYJ/0/COBrAAMBHCCiTACQ/h/U2fcNIUS2ECI7IyMjkGEAAAZ08BQPT06ID/hYDMMw0YZjYU9EqUTUWF4GMA5ALoBZAKZI3aYA+DbQQVqhY4tGaM3FSBiGYTQJxIzTCsDXRCQf5yMhxDwiWgngMyKaCmA3gEsCH6YxczYU4cvVhcE+DcMwTL3FsbAXQuwA0Fej/TCAMYEMyi5//XB1KE/HMAxT74jaCFqGYRimDhb2DMMwMUC9F/alFdXhHgLDMEzEU++F/Wcr94R7CAzDMBFPvRf2S7YWe5ffuirboCfDMEzsEmgEbdhp3igJAPDtLcPQt316mEfDMAwTmdRrzf5kZTW+Wr0XANC+WcMwj4ZhGCZyqdfC/pFvN3qXGyXX+5cUhmGYoFGvhf1pCm0+KaFeXwrDMExQqdfq8G1juiI1OQF7S06FeygMwzARTb0W9gBw7fCO4R4CwzBMxMO2D4ZhmBiAhT3DMEwMwMKeYRgmBmBhzzAMEwOwsGcYhokBWNgzDMPEACzsGYZhYgAW9gzDMDEACSHCPQYQUTGAXQ53bwHgkIvDqQ/wNccGfM2xQSDXfJoQIsNKx4gQ9oFARDlCiJhKZM/XHBvwNccGobpmNuMwDMPEACzsGYZhYoBoEPZvhHsAYYCvOTbga44NQnLN9d5mzzAMw5gTDZo9wzAMYwILe4ZhmBigXgt7IppARFuIKJ+IpoV7PHYgovZEtJiINhPRRiL6m9TejIgWENE26X9TqZ2I6CXpWtcT0QDFsaZI/bcR0RRF+5lEtEHa5yUiotBfqT9EFE9Ea4joe2m9IxEtl8b/KRElSe3J0nq+tD1LcYz7pfYtRDRe0R5x3wkiSieiL4goT7rfQ6L9PhPR36XvdS4RfUxEKdF2n4nobSI6SES5irag31e9c5gihKiXfwDiAWwH0AlAEoB1AHqFe1w2xp8JYIC03BjAVgC9ADwLYJrUPg3AP6XliQDmAiAAgwEsl9qbAdgh/W8qLTeVtq0AMETaZy6A88J93dK47gTwEYDvpfXPAFwmLb8G4GZp+a8AXpOWLwPwqbTcS7rfyQA6St+D+Ej9TgCYCeA6aTkJQHo032cAbQHsBNBAcX+vjrb7DOBsAAMA5Cragn5f9c5hOt5w/xAC+KCHAJivWL8fwP3hHlcA1/MtgHMBbAGQKbVlAtgiLb8O4HJF/y3S9ssBvK5of11qywSQp2j36RfG62wHYCGA0QC+l77IhwAkqO8rgPkAhkjLCVI/Ut9ruV8kficApEmCj1TtUXuf4RH2eyQBliDd5/HReJ8BZMFX2Af9vuqdw+yvPptx5C+UTKHUVu+QXlv7A1gOoJUQoggApP8tpW5612vUXqjRHm7+DeBeALXSenMAJUKIamldOU7vtUnbj0n97X4W4aQTgGIA70imq7eIKBVRfJ+FEHsBPA9gN4AieO7bKkT3fZYJxX3VO4ch9VnYa9kl650fKRE1AvAlgDuEEMeNumq0CQftYYOIzgdwUAixStms0VWYbKs31wyPpjoAwKtCiP4AyuB59daj3l+zZEOeDI/ppQ2AVADnaXSNpvtsRtivsT4L+0IA7RXr7QDsC9NYHEFEifAI+g+FEF9JzQeIKFPangngoNSud71G7e002sPJMAB/IKICAJ/AY8r5N4B0IkqQ+ijH6b02aXsTAEdg/7MIJ4UACoUQy6X1L+AR/tF8n8cC2CmEKBZCVAH4CsBQRPd9lgnFfdU7hyH1WdivBNBVmuFPgmdiZ1aYx2QZaWZ9BoDNQoh/KTbNAiDPyE+Bx5Yvt18lzeoPBnBMeoWbD2AcETWVNKpx8NgziwCcIKLB0rmuUhwrLAgh7hdCtBNCZMFzvxYJIf4CYDGAi6Vu6muWP4uLpf5Car9M8uLoCKArPJNZEfedEELsB7CHiLpLTWMAbEIU32d4zDeDiaihNCb5mqP2PisIxX3VO4cx4ZzIcWFyZCI8XizbATwY7vHYHPtweF7L1gNYK/1NhMdWuRDANul/M6k/AXhFutYNALIVx7oWQL70d42iPRtArrTPy1BNEob5+kehzhunEzw/4nwAnwNIltpTpPV8aXsnxf4PSte1BQrvk0j8TgDoByBHutffwON1EdX3GcBjAPKkcb0Pj0dNVN1nAB/DMydRBY8mPjUU91XvHGZ/nC6BYRgmBqjPZhyGYRjGIizsGYZhYgAW9gzDMDEAC3uGYZgYgIU9wzBMDMDCnmEYJgZgYc8wDBMD/D9pwksMstgtRgAAAABJRU5ErkJggg==\n" - }, - "metadata": { - "needs_background": "light" - } - } - ], - "source": [ - "def running_average(x,window):\n", - " return np.convolve(x,np.ones(window)/window,mode='valid')\n", - "\n", - "plt.plot(running_average(rewards,100))" - ] - }, - { - "source": [ - "## Variar os Hiperparâmetros e Ver o Resultado em Ação\n", - "\n", - "Agora seria interessante ver como o modelo treinado se comporta. Vamos executar a simulação, seguindo a mesma estratégia de seleção de ações utilizada durante o treino: amostragem de acordo com a distribuição de probabilidades na Q-Table:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 23, - "metadata": {}, - "outputs": [], - "source": [ - "obs = env.reset()\n", - "done = False\n", - "while not done:\n", - " s = discretize(obs)\n", - " env.render()\n", - " v = probs(np.array(qvalues(s)))\n", - " a = random.choices(actions,weights=v)[0]\n", - " obs,_,done,_ = env.step(a)\n", - "env.close()" - ] - }, - { - "source": [ - "## Guardar o resultado num GIF animado\n", - "\n", - "Se quiser impressionar os seus amigos, pode enviar-lhes a imagem animada do poste de equilíbrio em formato GIF. Para fazer isso, podemos usar `env.render` para produzir um frame de imagem e, em seguida, guardar esses frames num GIF animado utilizando a biblioteca PIL:\n" - ], - "cell_type": "markdown", - "metadata": {} - }, - { - "cell_type": "code", - "execution_count": 26, - "metadata": {}, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "360\n" - ] - } - ], - "source": [ - "from PIL import Image\n", - "obs = env.reset()\n", - "done = False\n", - "i=0\n", - "ims = []\n", - "while not done:\n", - " s = discretize(obs)\n", - " img=env.render(mode='rgb_array')\n", - " ims.append(Image.fromarray(img))\n", - " v = probs(np.array([Qbest.get((s,a),0) for a in actions]))\n", - " a = random.choices(actions,weights=v)[0]\n", - " obs,_,done,_ = env.step(a)\n", - " i+=1\n", - "env.close()\n", - "ims[0].save('images/cartpole-balance.gif',save_all=True,append_images=ims[1::2],loop=0,duration=5)\n", - "print(i)" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/8-Reinforcement/README.md b/translations/pt/8-Reinforcement/README.md deleted file mode 100644 index 05ade32a0..000000000 --- a/translations/pt/8-Reinforcement/README.md +++ /dev/null @@ -1,67 +0,0 @@ - -# Introdução ao aprendizado por reforço - -O aprendizado por reforço, RL, é considerado um dos paradigmas básicos de aprendizado de máquina, ao lado do aprendizado supervisionado e não supervisionado. RL trata de decisões: tomar as decisões certas ou, pelo menos, aprender com elas. - -Imagine que você tem um ambiente simulado, como o mercado de ações. O que acontece se você impuser uma determinada regulamentação? Isso terá um efeito positivo ou negativo? Se algo negativo acontecer, você precisa aceitar esse _reforço negativo_, aprender com ele e mudar de rumo. Se o resultado for positivo, você deve construir sobre esse _reforço positivo_. - -![peter e o lobo](../../../translated_images/pt-PT/peter.779730f9ba3a8a8d.webp) - -> Peter e seus amigos precisam escapar do lobo faminto! Imagem por [Jen Looper](https://twitter.com/jenlooper) - -## Tópico regional: Peter e o Lobo (Rússia) - -[Peter e o Lobo](https://en.wikipedia.org/wiki/Peter_and_the_Wolf) é um conto musical escrito por um compositor russo [Sergei Prokofiev](https://en.wikipedia.org/wiki/Sergei_Prokofiev). É uma história sobre o jovem pioneiro Peter, que corajosamente sai de casa para a clareira da floresta para perseguir o lobo. Nesta seção, treinaremos algoritmos de aprendizado de máquina que ajudarão Peter: - -- **Explorar** a área ao redor e construir um mapa de navegação ideal. -- **Aprender** a usar um skate e equilibrar-se nele, para se mover mais rapidamente. - -[![Peter e o Lobo](https://img.youtube.com/vi/Fmi5zHg4QSM/0.jpg)](https://www.youtube.com/watch?v=Fmi5zHg4QSM) - -> 🎥 Clique na imagem acima para ouvir Peter e o Lobo de Prokofiev - -## Aprendizado por reforço - -Nas seções anteriores, você viu dois exemplos de problemas de aprendizado de máquina: - -- **Supervisionado**, onde temos conjuntos de dados que sugerem soluções de exemplo para o problema que queremos resolver. [Classificação](../4-Classification/README.md) e [regressão](../2-Regression/README.md) são tarefas de aprendizado supervisionado. -- **Não supervisionado**, no qual não temos dados de treinamento rotulados. O principal exemplo de aprendizado não supervisionado é [Agrupamento](../5-Clustering/README.md). - -Nesta seção, apresentaremos um novo tipo de problema de aprendizado que não requer dados de treinamento rotulados. Existem vários tipos de problemas desse tipo: - -- **[Aprendizado semi-supervisionado](https://wikipedia.org/wiki/Semi-supervised_learning)**, onde temos muitos dados não rotulados que podem ser usados para pré-treinar o modelo. -- **[Aprendizado por reforço](https://wikipedia.org/wiki/Reinforcement_learning)**, no qual um agente aprende como se comportar realizando experimentos em algum ambiente simulado. - -### Exemplo - jogo de computador - -Suponha que você queira ensinar um computador a jogar um jogo, como xadrez ou [Super Mario](https://wikipedia.org/wiki/Super_Mario). Para que o computador jogue, precisamos que ele preveja qual movimento fazer em cada estado do jogo. Embora isso possa parecer um problema de classificação, não é - porque não temos um conjunto de dados com estados e ações correspondentes. Embora possamos ter alguns dados, como partidas de xadrez existentes ou gravações de jogadores jogando Super Mario, é provável que esses dados não cubram suficientemente um número grande de estados possíveis. - -Em vez de procurar dados existentes do jogo, o **Aprendizado por Reforço** (RL) baseia-se na ideia de *fazer o computador jogar* muitas vezes e observar o resultado. Assim, para aplicar o Aprendizado por Reforço, precisamos de duas coisas: - -- **Um ambiente** e **um simulador** que nos permitam jogar muitas vezes. Este simulador definiria todas as regras do jogo, bem como os estados e ações possíveis. - -- **Uma função de recompensa**, que nos diria quão bem nos saímos durante cada movimento ou partida. - -A principal diferença entre outros tipos de aprendizado de máquina e RL é que, no RL, normalmente não sabemos se ganhamos ou perdemos até terminarmos o jogo. Assim, não podemos dizer se um determinado movimento isolado é bom ou não - só recebemos uma recompensa no final do jogo. E nosso objetivo é projetar algoritmos que nos permitam treinar um modelo em condições incertas. Aprenderemos sobre um algoritmo de RL chamado **Q-learning**. - -## Lições - -1. [Introdução ao aprendizado por reforço e Q-Learning](1-QLearning/README.md) -2. [Usando um ambiente de simulação Gym](2-Gym/README.md) - -## Créditos - -"Introdução ao Aprendizado por Reforço" foi escrito com ♥️ por [Dmitry Soshnikov](http://soshnikov.com) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/9-Real-World/1-Applications/README.md b/translations/pt/9-Real-World/1-Applications/README.md deleted file mode 100644 index 36652772a..000000000 --- a/translations/pt/9-Real-World/1-Applications/README.md +++ /dev/null @@ -1,157 +0,0 @@ - -# Pós-escrito: Aprendizagem automática no mundo real - -![Resumo da aprendizagem automática no mundo real em um sketchnote](../../../../sketchnotes/ml-realworld.png) -> Sketchnote por [Tomomi Imura](https://www.twitter.com/girlie_mac) - -Neste currículo, aprendeste várias formas de preparar dados para treino e criar modelos de aprendizagem automática. Construíste uma série de modelos clássicos de regressão, clustering, classificação, processamento de linguagem natural e séries temporais. Parabéns! Agora, talvez te perguntes para que serve tudo isto... quais são as aplicações reais destes modelos? - -Embora a inteligência artificial (IA), que geralmente utiliza aprendizagem profunda, tenha atraído muita atenção na indústria, ainda existem aplicações valiosas para modelos clássicos de aprendizagem automática. É provável que já utilizes algumas destas aplicações no teu dia a dia! Nesta lição, vais explorar como oito indústrias e domínios de especialização utilizam estes tipos de modelos para tornar as suas aplicações mais eficientes, fiáveis, inteligentes e valiosas para os utilizadores. - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## 💰 Finanças - -O setor financeiro oferece muitas oportunidades para a aprendizagem automática. Muitos problemas nesta área podem ser modelados e resolvidos com ML. - -### Deteção de fraude com cartões de crédito - -Aprendemos sobre [k-means clustering](../../5-Clustering/2-K-Means/README.md) anteriormente no curso, mas como pode ser usado para resolver problemas relacionados com fraude em cartões de crédito? - -O k-means clustering é útil numa técnica de deteção de fraude chamada **deteção de outliers**. Outliers, ou desvios nas observações de um conjunto de dados, podem indicar se um cartão de crédito está a ser usado de forma normal ou se algo incomum está a acontecer. Como mostrado no artigo abaixo, é possível organizar dados de cartões de crédito usando um algoritmo de k-means clustering e atribuir cada transação a um cluster com base no grau de anomalia. Depois, é possível avaliar os clusters mais arriscados para identificar transações fraudulentas versus legítimas. -[Referência](https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.680.1195&rep=rep1&type=pdf) - -### Gestão de património - -Na gestão de património, um indivíduo ou empresa gere investimentos em nome dos seus clientes. O objetivo é sustentar e aumentar o património a longo prazo, sendo essencial escolher investimentos que tenham um bom desempenho. - -Uma forma de avaliar o desempenho de um investimento é através da regressão estatística. [A regressão linear](../../2-Regression/1-Tools/README.md) é uma ferramenta valiosa para compreender como um fundo se comporta em relação a um benchmark. Também é possível determinar se os resultados da regressão são estatisticamente significativos ou o impacto que teriam nos investimentos de um cliente. Podes expandir ainda mais a análise utilizando regressão múltipla, onde fatores de risco adicionais são considerados. Para um exemplo de como isto funciona para um fundo específico, consulta o artigo abaixo sobre avaliação de desempenho de fundos usando regressão. -[Referência](http://www.brightwoodventures.com/evaluating-fund-performance-using-regression/) - -## 🎓 Educação - -O setor da educação também é uma área muito interessante para a aplicação de ML. Existem problemas intrigantes a resolver, como detetar fraudes em testes ou ensaios, ou gerir preconceitos, intencionais ou não, no processo de correção. - -### Prever o comportamento dos estudantes - -A [Coursera](https://coursera.com), uma plataforma de cursos online, tem um excelente blog técnico onde discute várias decisões de engenharia. Neste estudo de caso, traçaram uma linha de regressão para explorar a correlação entre uma baixa classificação NPS (Net Promoter Score) e a retenção ou desistência de um curso. -[Referência](https://medium.com/coursera-engineering/controlled-regression-quantifying-the-impact-of-course-quality-on-learner-retention-31f956bd592a) - -### Mitigação de preconceitos - -O [Grammarly](https://grammarly.com), um assistente de escrita que verifica erros ortográficos e gramaticais, utiliza sistemas sofisticados de [processamento de linguagem natural](../../6-NLP/README.md) nos seus produtos. Publicaram um estudo de caso interessante no seu blog técnico sobre como lidaram com preconceitos de género na aprendizagem automática, tema que aprendeste na nossa [lição introdutória sobre justiça](../../1-Introduction/3-fairness/README.md). -[Referência](https://www.grammarly.com/blog/engineering/mitigating-gender-bias-in-autocorrect/) - -## 👜 Retalho - -O setor do retalho pode beneficiar imenso do uso de ML, desde a criação de uma melhor jornada do cliente até à gestão otimizada de inventário. - -### Personalização da jornada do cliente - -Na Wayfair, uma empresa que vende artigos para o lar, ajudar os clientes a encontrar os produtos certos para os seus gostos e necessidades é fundamental. Neste artigo, os engenheiros da empresa descrevem como utilizam ML e NLP para "apresentar os resultados certos aos clientes". Notavelmente, o seu motor de intenção de consulta foi construído para usar extração de entidades, treino de classificadores, extração de ativos e opiniões, e etiquetagem de sentimentos em avaliações de clientes. Este é um caso clássico de como o NLP funciona no retalho online. -[Referência](https://www.aboutwayfair.com/tech-innovation/how-we-use-machine-learning-and-natural-language-processing-to-empower-search) - -### Gestão de inventário - -Empresas inovadoras e ágeis como a [StitchFix](https://stitchfix.com), um serviço de caixas de roupa por assinatura, dependem fortemente de ML para recomendações e gestão de inventário. As suas equipas de estilistas trabalham em conjunto com as equipas de merchandising. Por exemplo: "um dos nossos cientistas de dados experimentou um algoritmo genético e aplicou-o ao vestuário para prever o sucesso de uma peça de roupa que ainda não existe. Apresentámos isso à equipa de merchandising, que agora pode usar isso como uma ferramenta." -[Referência](https://www.zdnet.com/article/how-stitch-fix-uses-machine-learning-to-master-the-science-of-styling/) - -## 🏥 Saúde - -O setor da saúde pode aproveitar o ML para otimizar tarefas de investigação e também problemas logísticos, como readmissões hospitalares ou a contenção de doenças. - -### Gestão de ensaios clínicos - -A toxicidade em ensaios clínicos é uma grande preocupação para os fabricantes de medicamentos. Quanta toxicidade é tolerável? Neste estudo, a análise de vários métodos de ensaios clínicos levou ao desenvolvimento de uma nova abordagem para prever os resultados dos ensaios. Especificamente, foi possível usar random forest para produzir um [classificador](../../4-Classification/README.md) capaz de distinguir entre grupos de medicamentos. -[Referência](https://www.sciencedirect.com/science/article/pii/S2451945616302914) - -### Gestão de readmissões hospitalares - -Os cuidados hospitalares são dispendiosos, especialmente quando os pacientes precisam de ser readmitidos. Este artigo discute uma empresa que utiliza ML para prever o potencial de readmissão usando [clustering](../../5-Clustering/README.md). Estes clusters ajudam os analistas a "descobrir grupos de readmissões que podem partilhar uma causa comum". -[Referência](https://healthmanagement.org/c/healthmanagement/issuearticle/hospital-readmissions-and-machine-learning) - -### Gestão de doenças - -A recente pandemia destacou como a aprendizagem automática pode ajudar a conter a propagação de doenças. Neste artigo, reconheces o uso de ARIMA, curvas logísticas, regressão linear e SARIMA. "Este trabalho é uma tentativa de calcular a taxa de propagação deste vírus e, assim, prever mortes, recuperações e casos confirmados, para que possamos estar melhor preparados e sobreviver." -[Referência](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7979218/) - -## 🌲 Ecologia e Tecnologia Verde - -A natureza e a ecologia consistem em muitos sistemas sensíveis onde a interação entre animais e o meio ambiente é crucial. É importante medir estes sistemas com precisão e agir adequadamente se algo acontecer, como um incêndio florestal ou uma queda na população animal. - -### Gestão florestal - -Aprendeste sobre [Reinforcement Learning](../../8-Reinforcement/README.md) em lições anteriores. Pode ser muito útil para prever padrões na natureza. Em particular, pode ser usado para monitorizar problemas ecológicos como incêndios florestais e a propagação de espécies invasoras. No Canadá, um grupo de investigadores utilizou Reinforcement Learning para construir modelos de dinâmica de incêndios florestais a partir de imagens de satélite. Usando um inovador "processo de propagação espacial (SSP)", imaginaram um incêndio florestal como "o agente em qualquer célula da paisagem". "O conjunto de ações que o fogo pode tomar de uma localização em qualquer momento inclui propagar-se para norte, sul, leste, oeste ou não se propagar." -[Referência](https://www.frontiersin.org/articles/10.3389/fict.2018.00006/full) - -### Monitorização de movimentos de animais - -Embora a aprendizagem profunda tenha revolucionado o rastreamento visual de movimentos de animais (podes criar o teu próprio [rastreador de ursos polares](https://docs.microsoft.com/learn/modules/build-ml-model-with-azure-stream-analytics/?WT.mc_id=academic-77952-leestott) aqui), as técnicas clássicas de ML ainda têm o seu lugar nesta tarefa. - -Sensores para rastrear movimentos de animais de quinta e IoT utilizam este tipo de processamento visual, mas técnicas mais básicas de ML são úteis para pré-processar dados. Por exemplo, neste artigo, as posturas de ovelhas foram monitorizadas e analisadas usando vários algoritmos de classificação. Podes reconhecer a curva ROC na página 335. -[Referência](https://druckhaus-hofmann.de/gallery/31-wj-feb-2020.pdf) - -### ⚡️ Gestão de Energia - -Nas nossas lições sobre [previsão de séries temporais](../../7-TimeSeries/README.md), abordámos o conceito de parquímetros inteligentes para gerar receita para uma cidade com base na compreensão da oferta e da procura. Este artigo discute em detalhe como clustering, regressão e previsão de séries temporais foram combinados para ajudar a prever o uso futuro de energia na Irlanda, com base em medições inteligentes. -[Referência](https://www-cdn.knime.com/sites/default/files/inline-images/knime_bigdata_energy_timeseries_whitepaper.pdf) - -## 💼 Seguros - -O setor de seguros é outro setor que utiliza ML para construir e otimizar modelos financeiros e atuariais viáveis. - -### Gestão de volatilidade - -A MetLife, uma fornecedora de seguros de vida, é transparente sobre como analisa e mitiga a volatilidade nos seus modelos financeiros. Neste artigo, vais notar visualizações de classificação binária e ordinal. Também vais encontrar visualizações de previsão. -[Referência](https://investments.metlife.com/content/dam/metlifecom/us/investments/insights/research-topics/macro-strategy/pdf/MetLifeInvestmentManagement_MachineLearnedRanking_070920.pdf) - -## 🎨 Artes, Cultura e Literatura - -Nas artes, por exemplo no jornalismo, existem muitos problemas interessantes. Detetar notícias falsas é um grande desafio, pois já foi provado que influenciam a opinião pública e até derrubam democracias. Os museus também podem beneficiar do uso de ML em tudo, desde encontrar ligações entre artefactos até ao planeamento de recursos. - -### Deteção de notícias falsas - -Detetar notícias falsas tornou-se um jogo de gato e rato nos meios de comunicação atuais. Neste artigo, os investigadores sugerem que um sistema combinando várias das técnicas de ML que estudámos pode ser testado e o melhor modelo implementado: "Este sistema baseia-se no processamento de linguagem natural para extrair características dos dados e, em seguida, essas características são usadas para treinar classificadores de aprendizagem automática como Naive Bayes, Support Vector Machine (SVM), Random Forest (RF), Stochastic Gradient Descent (SGD) e Logistic Regression (LR)." -[Referência](https://www.irjet.net/archives/V7/i6/IRJET-V7I6688.pdf) - -Este artigo mostra como combinar diferentes domínios de ML pode produzir resultados interessantes que ajudam a impedir a disseminação de notícias falsas e os danos que podem causar; neste caso, o foco foi a propagação de rumores sobre tratamentos para a COVID que incitaram violência. - -### ML em Museus - -Os museus estão à beira de uma revolução em IA, onde catalogar e digitalizar coleções e encontrar ligações entre artefactos está a tornar-se mais fácil à medida que a tecnologia avança. Projetos como o [In Codice Ratio](https://www.sciencedirect.com/science/article/abs/pii/S0306457321001035#:~:text=1.,studies%20over%20large%20historical%20sources.) estão a ajudar a desvendar os mistérios de coleções inacessíveis, como os Arquivos do Vaticano. Mas o aspeto comercial dos museus também beneficia de modelos de ML. - -Por exemplo, o Art Institute of Chicago construiu modelos para prever os interesses do público e quando irão visitar exposições. O objetivo é criar experiências de visita individualizadas e otimizadas sempre que o utilizador visita o museu. "Durante o ano fiscal de 2017, o modelo previu a frequência e as receitas de bilheteira com uma precisão de 1%, diz Andrew Simnick, vice-presidente sénior do Art Institute." -[Referência](https://www.chicagobusiness.com/article/20180518/ISSUE01/180519840/art-institute-of-chicago-uses-data-to-make-exhibit-choices) - -## 🏷 Marketing - -### Segmentação de clientes - -As estratégias de marketing mais eficazes segmentam os clientes de diferentes formas com base em vários agrupamentos. Neste artigo, são discutidas as utilizações de algoritmos de Clustering para apoiar o marketing diferenciado. O marketing diferenciado ajuda as empresas a melhorar o reconhecimento da marca, alcançar mais clientes e gerar mais receitas. -[Referência](https://ai.inqline.com/machine-learning-for-marketing-customer-segmentation/) - -## 🚀 Desafio - -Identifica outro setor que beneficie de algumas das técnicas que aprendeste neste currículo e descobre como utiliza ML. -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Revisão e Autoestudo - -A equipa de ciência de dados da Wayfair tem vários vídeos interessantes sobre como utilizam ML na sua empresa. Vale a pena [dar uma vista de olhos](https://www.youtube.com/channel/UCe2PjkQXqOuwkW1gw6Ameuw/videos)! - -## Tarefa - -[Uma caça ao tesouro de ML](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/9-Real-World/1-Applications/assignment.md b/translations/pt/9-Real-World/1-Applications/assignment.md deleted file mode 100644 index 6881d26e6..000000000 --- a/translations/pt/9-Real-World/1-Applications/assignment.md +++ /dev/null @@ -1,27 +0,0 @@ - -# Uma Caça ao Tesouro de ML - -## Instruções - -Nesta lição, aprendeste sobre muitos casos de uso reais que foram resolvidos utilizando ML clássico. Embora o uso de aprendizagem profunda, novas técnicas e ferramentas em IA, e o aproveitamento de redes neurais tenham ajudado a acelerar a produção de ferramentas para ajudar nestes setores, o ML clássico utilizando as técnicas deste currículo ainda tem um grande valor. - -Neste exercício, imagina que estás a participar num hackathon. Usa o que aprendeste no currículo para propor uma solução utilizando ML clássico para resolver um problema num dos setores discutidos nesta lição. Cria uma apresentação onde discutas como vais implementar a tua ideia. Pontos extra se conseguires reunir dados de exemplo e construir um modelo de ML para apoiar o teu conceito! - -## Rubrica - -| Critério | Exemplar | Adequado | Necessita de Melhorias | -| -------- | ------------------------------------------------------------------- | ------------------------------------------------ | ----------------------- | -| | É apresentada uma apresentação em PowerPoint - bônus por construir um modelo | É apresentada uma apresentação básica e não inovadora | O trabalho está incompleto | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/9-Real-World/2-Debugging-ML-Models/README.md b/translations/pt/9-Real-World/2-Debugging-ML-Models/README.md deleted file mode 100644 index f1a3ccb56..000000000 --- a/translations/pt/9-Real-World/2-Debugging-ML-Models/README.md +++ /dev/null @@ -1,183 +0,0 @@ - -# Pós-escrito: Depuração de Modelos de Machine Learning usando componentes do painel de IA Responsável - -## [Questionário pré-aula](https://ff-quizzes.netlify.app/en/ml/) - -## Introdução - -O machine learning impacta as nossas vidas diariamente. A IA está a integrar-se em alguns dos sistemas mais importantes que nos afetam como indivíduos e como sociedade, desde a saúde, finanças, educação e emprego. Por exemplo, sistemas e modelos estão envolvidos em tarefas de tomada de decisão diária, como diagnósticos médicos ou deteção de fraude. Consequentemente, os avanços na IA, juntamente com a sua adoção acelerada, estão a ser acompanhados por expectativas sociais em evolução e regulamentações crescentes em resposta. Continuamos a observar áreas onde os sistemas de IA não correspondem às expectativas; expõem novos desafios; e os governos estão a começar a regulamentar soluções de IA. Por isso, é essencial que estes modelos sejam analisados para fornecer resultados justos, confiáveis, inclusivos, transparentes e responsáveis para todos. - -Neste currículo, iremos explorar ferramentas práticas que podem ser usadas para avaliar se um modelo apresenta problemas relacionados com IA responsável. As técnicas tradicionais de depuração de machine learning tendem a basear-se em cálculos quantitativos, como precisão agregada ou perda média de erro. Imagine o que pode acontecer quando os dados que está a usar para construir esses modelos carecem de certos grupos demográficos, como raça, género, visão política, religião, ou representam desproporcionalmente esses grupos demográficos. E quando a saída do modelo é interpretada de forma a favorecer um grupo demográfico? Isso pode introduzir uma representação excessiva ou insuficiente desses grupos sensíveis, resultando em problemas de justiça, inclusão ou confiabilidade no modelo. Outro fator é que os modelos de machine learning são considerados caixas pretas, o que dificulta a compreensão e explicação do que impulsiona as previsões de um modelo. Todos estes são desafios enfrentados por cientistas de dados e desenvolvedores de IA quando não possuem ferramentas adequadas para depurar e avaliar a justiça ou confiabilidade de um modelo. - -Nesta lição, irá aprender a depurar os seus modelos usando: - -- **Análise de Erros**: identificar onde na distribuição dos seus dados o modelo apresenta taxas de erro elevadas. -- **Visão Geral do Modelo**: realizar análises comparativas entre diferentes coortes de dados para descobrir disparidades nas métricas de desempenho do modelo. -- **Análise de Dados**: investigar onde pode haver representação excessiva ou insuficiente nos seus dados que podem enviesar o modelo para favorecer um grupo demográfico em detrimento de outro. -- **Importância das Features**: compreender quais features estão a impulsionar as previsões do modelo a nível global ou local. - -## Pré-requisito - -Como pré-requisito, reveja [Ferramentas de IA Responsável para desenvolvedores](https://www.microsoft.com/ai/ai-lab-responsible-ai-dashboard) - -> ![Gif sobre Ferramentas de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/rai-overview.gif) - -## Análise de Erros - -As métricas tradicionais de desempenho de modelos usadas para medir a precisão são, na maioria das vezes, cálculos baseados em previsões corretas versus incorretas. Por exemplo, determinar que um modelo é preciso 89% das vezes com uma perda de erro de 0.001 pode ser considerado um bom desempenho. No entanto, os erros nem sempre estão distribuídos uniformemente no seu conjunto de dados subjacente. Pode obter uma pontuação de precisão de 89% no modelo, mas descobrir que existem diferentes regiões nos seus dados onde o modelo falha 42% das vezes. As consequências desses padrões de falha em certos grupos de dados podem levar a problemas de justiça ou confiabilidade. É essencial compreender as áreas onde o modelo está a ter um bom desempenho ou não. As regiões de dados onde há um número elevado de imprecisões no modelo podem revelar-se um grupo demográfico importante. - -![Analisar e depurar erros do modelo](../../../../9-Real-World/2-Debugging-ML-Models/images/ea-error-distribution.png) - -O componente de Análise de Erros no painel de IA Responsável ilustra como as falhas do modelo estão distribuídas entre vários coortes com uma visualização em árvore. Isto é útil para identificar features ou áreas onde há uma taxa de erro elevada no seu conjunto de dados. Ao ver de onde vêm a maioria das imprecisões do modelo, pode começar a investigar a causa raiz. Também pode criar coortes de dados para realizar análises. Esses coortes de dados ajudam no processo de depuração para determinar porque o desempenho do modelo é bom num coorte, mas apresenta erros noutro. - -![Análise de Erros](../../../../9-Real-World/2-Debugging-ML-Models/images/ea-error-cohort.png) - -Os indicadores visuais no mapa de árvore ajudam a localizar as áreas problemáticas mais rapidamente. Por exemplo, quanto mais escuro for o tom de vermelho num nó da árvore, maior será a taxa de erro. - -O mapa de calor é outra funcionalidade de visualização que os utilizadores podem usar para investigar a taxa de erro usando uma ou duas features para encontrar contribuintes para os erros do modelo em todo o conjunto de dados ou coortes. - -![Mapa de Calor da Análise de Erros](../../../../9-Real-World/2-Debugging-ML-Models/images/ea-heatmap.png) - -Use a análise de erros quando precisar de: - -* Obter uma compreensão profunda de como as falhas do modelo estão distribuídas num conjunto de dados e em várias dimensões de entrada e features. -* Dividir as métricas de desempenho agregadas para descobrir automaticamente coortes com erros e informar os seus passos de mitigação direcionados. - -## Visão Geral do Modelo - -Avaliar o desempenho de um modelo de machine learning requer uma compreensão holística do seu comportamento. Isto pode ser alcançado ao rever mais de uma métrica, como taxa de erro, precisão, recall, precisão ou MAE (Erro Absoluto Médio), para encontrar disparidades entre as métricas de desempenho. Uma métrica de desempenho pode parecer ótima, mas imprecisões podem ser expostas noutra métrica. Além disso, comparar as métricas para disparidades em todo o conjunto de dados ou coortes ajuda a esclarecer onde o modelo está a ter um bom desempenho ou não. Isto é especialmente importante para observar o desempenho do modelo entre features sensíveis versus insensíveis (por exemplo, raça, género ou idade de pacientes) para descobrir potenciais injustiças que o modelo possa ter. Por exemplo, descobrir que o modelo é mais impreciso num coorte que possui features sensíveis pode revelar potenciais injustiças no modelo. - -O componente Visão Geral do Modelo do painel de IA Responsável ajuda não apenas a analisar as métricas de desempenho da representação de dados num coorte, mas também dá aos utilizadores a capacidade de comparar o comportamento do modelo entre diferentes coortes. - -![Coortes de conjunto de dados - visão geral do modelo no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/model-overview-dataset-cohorts.png) - -A funcionalidade de análise baseada em features do componente permite que os utilizadores reduzam subgrupos de dados dentro de uma feature específica para identificar anomalias a um nível granular. Por exemplo, o painel possui inteligência integrada para gerar automaticamente coortes para uma feature selecionada pelo utilizador (ex., *"tempo_no_hospital < 3"* ou *"tempo_no_hospital >= 7"*). Isto permite que o utilizador isole uma feature específica de um grupo de dados maior para ver se é um influenciador chave dos resultados errados do modelo. - -![Coortes de features - visão geral do modelo no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/model-overview-feature-cohorts.png) - -O componente Visão Geral do Modelo suporta duas classes de métricas de disparidade: - -**Disparidade no desempenho do modelo**: Estes conjuntos de métricas calculam a disparidade (diferença) nos valores da métrica de desempenho selecionada entre subgrupos de dados. Aqui estão alguns exemplos: - -* Disparidade na taxa de precisão -* Disparidade na taxa de erro -* Disparidade na precisão -* Disparidade no recall -* Disparidade no erro absoluto médio (MAE) - -**Disparidade na taxa de seleção**: Esta métrica contém a diferença na taxa de seleção (previsão favorável) entre subgrupos. Um exemplo disso é a disparidade nas taxas de aprovação de empréstimos. A taxa de seleção refere-se à fração de pontos de dados em cada classe classificados como 1 (em classificação binária) ou à distribuição de valores de previsão (em regressão). - -## Análise de Dados - -> "Se torturar os dados o suficiente, eles confessarão qualquer coisa" - Ronald Coase - -Esta afirmação parece extrema, mas é verdade que os dados podem ser manipulados para apoiar qualquer conclusão. Tal manipulação pode, por vezes, acontecer de forma não intencional. Como humanos, todos temos preconceitos, e é frequentemente difícil saber conscientemente quando estamos a introduzir preconceitos nos dados. Garantir justiça na IA e no machine learning continua a ser um desafio complexo. - -Os dados são um grande ponto cego para as métricas tradicionais de desempenho de modelos. Pode ter pontuações de precisão elevadas, mas isso nem sempre reflete o preconceito subjacente nos dados que pode estar no seu conjunto de dados. Por exemplo, se um conjunto de dados de funcionários tem 27% de mulheres em posições executivas numa empresa e 73% de homens no mesmo nível, um modelo de IA de publicidade de emprego treinado com esses dados pode direcionar principalmente um público masculino para posições de nível sénior. Ter este desequilíbrio nos dados enviesou a previsão do modelo para favorecer um género. Isto revela um problema de justiça onde há preconceito de género no modelo de IA. - -O componente de Análise de Dados no painel de IA Responsável ajuda a identificar áreas onde há representação excessiva ou insuficiente no conjunto de dados. Ajuda os utilizadores a diagnosticar a causa raiz de erros e problemas de justiça introduzidos por desequilíbrios nos dados ou falta de representação de um grupo de dados específico. Isto dá aos utilizadores a capacidade de visualizar conjuntos de dados com base em resultados previstos e reais, grupos de erros e features específicas. Por vezes, descobrir um grupo de dados sub-representado também pode revelar que o modelo não está a aprender bem, daí as imprecisões elevadas. Ter um modelo com preconceito nos dados não é apenas um problema de justiça, mas mostra que o modelo não é inclusivo ou confiável. - -![Componente de Análise de Dados no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/dataanalysis-cover.png) - -Use a análise de dados quando precisar de: - -* Explorar as estatísticas do seu conjunto de dados selecionando diferentes filtros para dividir os seus dados em diferentes dimensões (também conhecidos como coortes). -* Compreender a distribuição do seu conjunto de dados entre diferentes coortes e grupos de features. -* Determinar se as suas descobertas relacionadas com justiça, análise de erros e causalidade (derivadas de outros componentes do painel) são resultado da distribuição do seu conjunto de dados. -* Decidir em quais áreas coletar mais dados para mitigar erros que surgem de problemas de representação, ruído de rótulos, ruído de features, preconceito de rótulos e fatores semelhantes. - -## Interpretabilidade do Modelo - -Os modelos de machine learning tendem a ser caixas pretas. Compreender quais features de dados chave impulsionam a previsão de um modelo pode ser desafiador. É importante fornecer transparência sobre porque um modelo faz uma determinada previsão. Por exemplo, se um sistema de IA prevê que um paciente diabético está em risco de ser readmitido num hospital em menos de 30 dias, deve ser capaz de fornecer dados de suporte que levaram à sua previsão. Ter indicadores de suporte traz transparência para ajudar os clínicos ou hospitais a tomar decisões bem informadas. Além disso, ser capaz de explicar porque um modelo fez uma previsão para um paciente individual permite responsabilidade com regulamentos de saúde. Quando está a usar modelos de machine learning de formas que afetam a vida das pessoas, é crucial compreender e explicar o que influencia o comportamento de um modelo. A explicabilidade e interpretabilidade do modelo ajudam a responder a perguntas em cenários como: - -* Depuração do modelo: Por que o meu modelo cometeu este erro? Como posso melhorar o meu modelo? -* Colaboração humano-IA: Como posso compreender e confiar nas decisões do modelo? -* Conformidade regulatória: O meu modelo cumpre os requisitos legais? - -O componente Importância das Features do painel de IA Responsável ajuda a depurar e obter uma compreensão abrangente de como um modelo faz previsões. Também é uma ferramenta útil para profissionais de machine learning e tomadores de decisão explicarem e mostrarem evidências das features que influenciam o comportamento do modelo para conformidade regulatória. Em seguida, os utilizadores podem explorar explicações globais e locais para validar quais features impulsionam a previsão do modelo. As explicações globais listam as principais features que afetaram a previsão geral do modelo. As explicações locais mostram quais features levaram à previsão do modelo para um caso individual. A capacidade de avaliar explicações locais também é útil na depuração ou auditoria de um caso específico para compreender e interpretar melhor porque um modelo fez uma previsão precisa ou imprecisa. - -![Componente Importância das Features no painel de IA Responsável](../../../../9-Real-World/2-Debugging-ML-Models/images/9-feature-importance.png) - -* Explicações globais: Por exemplo, quais features afetam o comportamento geral de um modelo de readmissão hospitalar para diabetes? -* Explicações locais: Por exemplo, porque foi previsto que um paciente diabético com mais de 60 anos e hospitalizações anteriores seria readmitido ou não readmitido num hospital dentro de 30 dias? - -No processo de depuração ao examinar o desempenho de um modelo entre diferentes coortes, a Importância das Features mostra o nível de impacto que uma feature tem entre os coortes. Ajuda a revelar anomalias ao comparar o nível de influência que a feature tem em impulsionar previsões erradas do modelo. O componente Importância das Features pode mostrar quais valores numa feature influenciaram positivamente ou negativamente o resultado do modelo. Por exemplo, se um modelo fez uma previsão imprecisa, o componente dá-lhe a capacidade de aprofundar e identificar quais features ou valores de features impulsionaram a previsão. Este nível de detalhe ajuda não apenas na depuração, mas também fornece transparência e responsabilidade em situações de auditoria. Finalmente, o componente pode ajudá-lo a identificar problemas de justiça. Para ilustrar, se uma feature sensível como etnia ou género é altamente influente em impulsionar a previsão do modelo, isso pode ser um sinal de preconceito de raça ou género no modelo. - -![Importância das features](../../../../9-Real-World/2-Debugging-ML-Models/images/9-features-influence.png) - -Use a interpretabilidade quando precisar de: - -* Determinar quão confiáveis são as previsões do seu sistema de IA ao compreender quais features são mais importantes para as previsões. -* Abordar a depuração do seu modelo ao compreendê-lo primeiro e identificar se o modelo está a usar features saudáveis ou apenas correlações falsas. -* Descobrir potenciais fontes de injustiça ao compreender se o modelo está a basear previsões em features sensíveis ou em features altamente correlacionadas com elas. -* Construir confiança do utilizador nas decisões do modelo ao gerar explicações locais para ilustrar os seus resultados. -* Completar uma auditoria regulatória de um sistema de IA para validar modelos e monitorizar o impacto das decisões do modelo nas pessoas. - -## Conclusão - -Todos os componentes do painel de IA Responsável são ferramentas práticas para ajudá-lo a construir modelos de machine learning que sejam menos prejudiciais e mais confiáveis para a sociedade. Melhoram a prevenção de ameaças aos direitos humanos; discriminação ou exclusão de certos grupos de oportunidades de vida; e o risco de danos físicos ou psicológicos. Também ajudam a construir confiança nas decisões do modelo ao gerar explicações locais para ilustrar os seus resultados. Alguns dos potenciais danos podem ser classificados como: - -- **Alocação**, se um género ou etnia, por exemplo, for favorecido em detrimento de outro. -- **Qualidade do serviço**. Se treinar os dados para um cenário específico, mas a realidade for muito mais complexa, isso leva a um serviço de desempenho inferior. -- **Estereotipagem**. Associar um determinado grupo a atributos pré-atribuídos. -- **Denigração**. Criticar injustamente e rotular algo ou alguém. -- **Representação excessiva ou insuficiente**. A ideia é que um determinado grupo não seja visto em uma certa profissão, e qualquer serviço ou função que continue a promover isso está a contribuir para o problema. - -### Azure RAI dashboard - -[Azure RAI dashboard](https://learn.microsoft.com/en-us/azure/machine-learning/concept-responsible-ai-dashboard?WT.mc_id=aiml-90525-ruyakubu) é construído com ferramentas de código aberto desenvolvidas por instituições académicas e organizações líderes, incluindo a Microsoft, que são fundamentais para cientistas de dados e desenvolvedores de IA compreenderem melhor o comportamento dos modelos, descobrirem e mitigarem problemas indesejáveis nos modelos de IA. - -- Aprenda a usar os diferentes componentes consultando a [documentação do RAI dashboard.](https://learn.microsoft.com/en-us/azure/machine-learning/how-to-responsible-ai-dashboard?WT.mc_id=aiml-90525-ruyakubu) - -- Veja alguns [notebooks de exemplo do RAI dashboard](https://github.com/Azure/RAI-vNext-Preview/tree/main/examples/notebooks) para depurar cenários de IA mais responsáveis no Azure Machine Learning. - ---- -## 🚀 Desafio - -Para evitar que vieses estatísticos ou de dados sejam introduzidos desde o início, devemos: - -- ter uma diversidade de origens e perspetivas entre as pessoas que trabalham nos sistemas -- investir em conjuntos de dados que reflitam a diversidade da nossa sociedade -- desenvolver melhores métodos para detetar e corrigir vieses quando eles ocorrem - -Pense em cenários da vida real onde a injustiça é evidente na construção e utilização de modelos. O que mais devemos considerar? - -## [Questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) -## Revisão e Autoestudo - -Nesta lição, aprendeu algumas ferramentas práticas para incorporar IA responsável em machine learning. - -Veja este workshop para aprofundar os tópicos: - -- Responsible AI Dashboard: Uma solução completa para operacionalizar IA responsável na prática, por Besmira Nushi e Mehrnoosh Sameki - -[![Responsible AI Dashboard: Uma solução completa para operacionalizar IA responsável na prática](https://img.youtube.com/vi/f1oaDNl3djg/0.jpg)](https://www.youtube.com/watch?v=f1oaDNl3djg "Responsible AI Dashboard: Uma solução completa para operacionalizar IA responsável na prática") - -> 🎥 Clique na imagem acima para ver o vídeo: Responsible AI Dashboard: Uma solução completa para operacionalizar IA responsável na prática, por Besmira Nushi e Mehrnoosh Sameki - -Consulte os seguintes materiais para aprender mais sobre IA responsável e como construir modelos mais confiáveis: - -- Ferramentas do RAI dashboard da Microsoft para depurar modelos de ML: [Recursos de ferramentas de IA responsável](https://aka.ms/rai-dashboard) - -- Explore o toolkit de IA responsável: [Github](https://github.com/microsoft/responsible-ai-toolbox) - -- Centro de recursos de IA responsável da Microsoft: [Recursos de IA Responsável – Microsoft AI](https://www.microsoft.com/ai/responsible-ai-resources?activetab=pivot1%3aprimaryr4) - -- Grupo de pesquisa FATE da Microsoft: [FATE: Justiça, Responsabilidade, Transparência e Ética em IA - Microsoft Research](https://www.microsoft.com/research/theme/fate/) - -## Tarefa - -[Explore o RAI dashboard](assignment.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte oficial. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/9-Real-World/2-Debugging-ML-Models/assignment.md b/translations/pt/9-Real-World/2-Debugging-ML-Models/assignment.md deleted file mode 100644 index d4974bb4c..000000000 --- a/translations/pt/9-Real-World/2-Debugging-ML-Models/assignment.md +++ /dev/null @@ -1,25 +0,0 @@ - -# Explorar o painel de Responsible AI (RAI) - -## Instruções - -Nesta lição, aprendeste sobre o painel RAI, um conjunto de componentes construídos com ferramentas "open-source" para ajudar os cientistas de dados a realizar análises de erros, exploração de dados, avaliação de imparcialidade, interpretabilidade de modelos, avaliações contrafactuais/what-if e análise causal em sistemas de IA. Para esta tarefa, explora alguns dos [notebooks](https://github.com/Azure/RAI-vNext-Preview/tree/main/examples/notebooks) de exemplo do painel RAI e relata as tuas descobertas num artigo ou apresentação. - -## Rubrica - -| Critérios | Exemplar | Adequado | Necessita de Melhorias | -| --------- | -------- | -------- | ---------------------- | -| | Um artigo ou apresentação em PowerPoint é apresentado, discutindo os componentes do painel RAI, o notebook que foi executado e as conclusões obtidas a partir da sua execução | Um artigo é apresentado sem conclusões | Nenhum artigo é apresentado | - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/9-Real-World/README.md b/translations/pt/9-Real-World/README.md deleted file mode 100644 index 053bf157e..000000000 --- a/translations/pt/9-Real-World/README.md +++ /dev/null @@ -1,32 +0,0 @@ - -# Pós-escrito: Aplicações reais de aprendizagem automática clássica - -Nesta secção do currículo, será apresentado a algumas aplicações reais de aprendizagem automática clássica. Pesquisámos na internet para encontrar artigos e documentos técnicos sobre aplicações que utilizaram estas estratégias, evitando redes neuronais, aprendizagem profunda e IA tanto quanto possível. Descubra como a aprendizagem automática é utilizada em sistemas empresariais, aplicações ecológicas, finanças, artes e cultura, entre outros. - -![chess](../../../translated_images/pt-PT/chess.e704a268781bdad8.webp) - -> Foto por Alexis Fauvet em Unsplash - -## Aula - -1. [Aplicações Reais de Aprendizagem Automática](1-Applications/README.md) -2. [Depuração de Modelos de Aprendizagem Automática usando componentes do painel de IA Responsável](2-Debugging-ML-Models/README.md) - -## Créditos - -"Aplicações Reais" foi escrito por uma equipa de pessoas, incluindo [Jen Looper](https://twitter.com/jenlooper) e [Ornella Altunyan](https://twitter.com/ornelladotcom). - -"Depuração de Modelos de Aprendizagem Automática usando componentes do painel de IA Responsável" foi escrito por [Ruth Yakubu](https://twitter.com/ruthieyakubu) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/AGENTS.md b/translations/pt/AGENTS.md deleted file mode 100644 index d81f66d5a..000000000 --- a/translations/pt/AGENTS.md +++ /dev/null @@ -1,345 +0,0 @@ - -# AGENTS.md - -## Visão Geral do Projeto - -Este é o **Machine Learning para Principiantes**, um currículo abrangente de 12 semanas e 26 lições que cobre conceitos clássicos de machine learning utilizando Python (principalmente com Scikit-learn) e R. O repositório foi concebido como um recurso de aprendizagem autodidata, com projetos práticos, questionários e tarefas. Cada lição explora conceitos de ML através de dados reais provenientes de várias culturas e regiões do mundo. - -Componentes principais: -- **Conteúdo Educacional**: 26 lições que abrangem introdução ao ML, regressão, classificação, clustering, NLP, séries temporais e aprendizagem por reforço -- **Aplicação de Questionários**: Aplicação de questionários baseada em Vue.js com avaliações antes e depois das lições -- **Suporte Multilíngue**: Traduções automáticas para mais de 40 idiomas via GitHub Actions -- **Suporte a Duas Linguagens**: Lições disponíveis tanto em Python (notebooks Jupyter) quanto em R (ficheiros R Markdown) -- **Aprendizagem Baseada em Projetos**: Cada tópico inclui projetos práticos e tarefas - -## Estrutura do Repositório - -``` -ML-For-Beginners/ -├── 1-Introduction/ # ML basics, history, fairness, techniques -├── 2-Regression/ # Regression models with Python/R -├── 3-Web-App/ # Flask web app for ML model deployment -├── 4-Classification/ # Classification algorithms -├── 5-Clustering/ # Clustering techniques -├── 6-NLP/ # Natural Language Processing -├── 7-TimeSeries/ # Time series forecasting -├── 8-Reinforcement/ # Reinforcement learning -├── 9-Real-World/ # Real-world ML applications -├── quiz-app/ # Vue.js quiz application -├── translations/ # Auto-generated translations -└── sketchnotes/ # Visual learning aids -``` - -Cada pasta de lição geralmente contém: -- `README.md` - Conteúdo principal da lição -- `notebook.ipynb` - Notebook Jupyter em Python -- `solution/` - Código de solução (versões em Python e R) -- `assignment.md` - Exercícios práticos -- `images/` - Recursos visuais - -## Comandos de Configuração - -### Para Lições em Python - -A maioria das lições utiliza notebooks Jupyter. Instale as dependências necessárias: - -```bash -# Install Python 3.8+ if not already installed -python --version - -# Install Jupyter -pip install jupyter - -# Install common ML libraries -pip install scikit-learn pandas numpy matplotlib seaborn - -# For specific lessons, check lesson-specific requirements -# Example: Web App lesson -pip install flask -``` - -### Para Lições em R - -As lições em R estão nas pastas `solution/R/` como ficheiros `.rmd` ou `.ipynb`: - -```bash -# Install R and required packages -# In R console: -install.packages(c("tidyverse", "tidymodels", "caret")) -``` - -### Para a Aplicação de Questionários - -A aplicação de questionários é uma aplicação Vue.js localizada no diretório `quiz-app/`: - -```bash -cd quiz-app -npm install -``` - -### Para o Site de Documentação - -Para executar a documentação localmente: - -```bash -# Install Docsify -npm install -g docsify-cli - -# Serve from repository root -docsify serve - -# Access at http://localhost:3000 -``` - -## Fluxo de Trabalho de Desenvolvimento - -### Trabalhar com Notebooks de Lição - -1. Navegue até ao diretório da lição (ex.: `2-Regression/1-Tools/`) -2. Abra o notebook Jupyter: - ```bash - jupyter notebook notebook.ipynb - ``` -3. Trabalhe no conteúdo e nos exercícios da lição -4. Consulte as soluções na pasta `solution/` se necessário - -### Desenvolvimento em Python - -- As lições utilizam bibliotecas padrão de ciência de dados em Python -- Notebooks Jupyter para aprendizagem interativa -- Código de solução disponível na pasta `solution/` de cada lição - -### Desenvolvimento em R - -- As lições em R estão no formato `.rmd` (R Markdown) -- Soluções localizadas em subdiretórios `solution/R/` -- Utilize RStudio ou Jupyter com kernel R para executar os notebooks em R - -### Desenvolvimento da Aplicação de Questionários - -```bash -cd quiz-app - -# Start development server -npm run serve -# Access at http://localhost:8080 - -# Build for production -npm run build - -# Lint and fix files -npm run lint -``` - -## Instruções de Teste - -### Teste da Aplicação de Questionários - -```bash -cd quiz-app - -# Lint code -npm run lint - -# Build to verify no errors -npm run build -``` - -**Nota**: Este é principalmente um repositório de currículo educacional. Não há testes automatizados para o conteúdo das lições. A validação é feita através de: -- Conclusão dos exercícios das lições -- Execução bem-sucedida das células dos notebooks -- Verificação dos resultados contra as soluções esperadas - -## Diretrizes de Estilo de Código - -### Código em Python -- Siga as diretrizes de estilo PEP 8 -- Utilize nomes de variáveis claros e descritivos -- Inclua comentários para operações complexas -- Os notebooks Jupyter devem conter células markdown explicando os conceitos - -### JavaScript/Vue.js (Aplicação de Questionários) -- Siga o guia de estilo Vue.js -- Configuração ESLint em `quiz-app/package.json` -- Execute `npm run lint` para verificar e corrigir automaticamente problemas - -### Documentação -- Os ficheiros markdown devem ser claros e bem estruturados -- Inclua exemplos de código em blocos de código delimitados -- Utilize links relativos para referências internas -- Siga as convenções de formatação existentes - -## Construção e Implementação - -### Implementação da Aplicação de Questionários - -A aplicação de questionários pode ser implementada no Azure Static Web Apps: - -1. **Pré-requisitos**: - - Conta Azure - - Repositório GitHub (já bifurcado) - -2. **Implementar no Azure**: - - Crie um recurso Azure Static Web App - - Conecte ao repositório GitHub - - Defina a localização da aplicação: `/quiz-app` - - Defina a localização de saída: `dist` - - O Azure cria automaticamente o workflow do GitHub Actions - -3. **Workflow do GitHub Actions**: - - Ficheiro de workflow criado em `.github/workflows/azure-static-web-apps-*.yml` - - Constrói e implementa automaticamente ao fazer push para a branch principal - -### PDF da Documentação - -Gerar PDF a partir da documentação: - -```bash -npm install -npm run convert -``` - -## Fluxo de Trabalho de Tradução - -**Importante**: As traduções são automatizadas via GitHub Actions utilizando o Co-op Translator. - -- As traduções são geradas automaticamente quando alterações são feitas na branch `main` -- **NÃO traduza o conteúdo manualmente** - o sistema trata disso -- Workflow definido em `.github/workflows/co-op-translator.yml` -- Utiliza serviços Azure AI/OpenAI para tradução -- Suporta mais de 40 idiomas - -## Diretrizes de Contribuição - -### Para Contribuidores de Conteúdo - -1. **Bifurque o repositório** e crie uma branch de funcionalidade -2. **Faça alterações no conteúdo das lições** se estiver a adicionar/atualizar lições -3. **Não modifique ficheiros traduzidos** - eles são gerados automaticamente -4. **Teste o seu código** - certifique-se de que todas as células dos notebooks são executadas com sucesso -5. **Verifique se os links e imagens** funcionam corretamente -6. **Submeta um pull request** com uma descrição clara - -### Diretrizes para Pull Requests - -- **Formato do título**: `[Seção] Breve descrição das alterações` - - Exemplo: `[Regression] Corrigir erro na lição 5` - - Exemplo: `[Quiz-App] Atualizar dependências` -- **Antes de submeter**: - - Certifique-se de que todas as células dos notebooks são executadas sem erros - - Execute `npm run lint` se estiver a modificar quiz-app - - Verifique a formatação markdown - - Teste quaisquer novos exemplos de código -- **O PR deve incluir**: - - Descrição das alterações - - Razão para as alterações - - Capturas de ecrã se houver alterações na interface -- **Código de Conduta**: Siga o [Código de Conduta de Código Aberto da Microsoft](CODE_OF_CONDUCT.md) -- **CLA**: Será necessário assinar o Acordo de Licença de Contribuidor - -## Estrutura das Lições - -Cada lição segue um padrão consistente: - -1. **Questionário pré-aula** - Testar conhecimento inicial -2. **Conteúdo da lição** - Instruções e explicações escritas -3. **Demonstrações de código** - Exemplos práticos em notebooks -4. **Verificações de conhecimento** - Confirmar compreensão ao longo da lição -5. **Desafio** - Aplicar conceitos de forma independente -6. **Tarefa** - Prática estendida -7. **Questionário pós-aula** - Avaliar resultados de aprendizagem - -## Referência de Comandos Comuns - -```bash -# Python/Jupyter -jupyter notebook # Start Jupyter server -jupyter notebook notebook.ipynb # Open specific notebook -pip install -r requirements.txt # Install dependencies (where available) - -# Quiz App -cd quiz-app -npm install # Install dependencies -npm run serve # Development server -npm run build # Production build -npm run lint # Lint and fix - -# Documentation -docsify serve # Serve documentation locally -npm run convert # Generate PDF - -# Git workflow -git checkout -b feature/my-change # Create feature branch -git add . # Stage changes -git commit -m "Description" # Commit changes -git push origin feature/my-change # Push to remote -``` - -## Recursos Adicionais - -- **Coleção Microsoft Learn**: [Módulos de ML para Principiantes](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -- **Aplicação de Questionários**: [Questionários online](https://ff-quizzes.netlify.app/en/ml/) -- **Fórum de Discussão**: [Discussões no GitHub](https://github.com/microsoft/ML-For-Beginners/discussions) -- **Tutoriais em Vídeo**: [Playlist no YouTube](https://aka.ms/ml-beginners-videos) - -## Tecnologias Principais - -- **Python**: Linguagem principal para lições de ML (Scikit-learn, Pandas, NumPy, Matplotlib) -- **R**: Implementação alternativa utilizando tidyverse, tidymodels, caret -- **Jupyter**: Notebooks interativos para lições em Python -- **R Markdown**: Documentos para lições em R -- **Vue.js 3**: Framework da aplicação de questionários -- **Flask**: Framework de aplicação web para implementação de modelos de ML -- **Docsify**: Gerador de sites de documentação -- **GitHub Actions**: CI/CD e traduções automatizadas - -## Considerações de Segurança - -- **Sem segredos no código**: Nunca comprometa chaves de API ou credenciais -- **Dependências**: Mantenha os pacotes npm e pip atualizados -- **Entrada do utilizador**: Exemplos de aplicações web Flask incluem validação básica de entrada -- **Dados sensíveis**: Os conjuntos de dados de exemplo são públicos e não sensíveis - -## Resolução de Problemas - -### Notebooks Jupyter - -- **Problemas com o kernel**: Reinicie o kernel se as células ficarem pendentes: Kernel → Reiniciar -- **Erros de importação**: Certifique-se de que todos os pacotes necessários estão instalados com pip -- **Problemas de caminho**: Execute os notebooks a partir do diretório onde estão localizados - -### Aplicação de Questionários - -- **npm install falha**: Limpe a cache do npm: `npm cache clean --force` -- **Conflitos de porta**: Altere a porta com: `npm run serve -- --port 8081` -- **Erros de construção**: Elimine `node_modules` e reinstale: `rm -rf node_modules && npm install` - -### Lições em R - -- **Pacote não encontrado**: Instale com: `install.packages("nome-do-pacote")` -- **Renderização de RMarkdown**: Certifique-se de que o pacote rmarkdown está instalado -- **Problemas com o kernel**: Pode ser necessário instalar IRkernel para Jupyter - -## Notas Específicas do Projeto - -- Este é principalmente um **currículo de aprendizagem**, não código de produção -- O foco está em **compreender conceitos de ML** através de prática prática -- Os exemplos de código priorizam **clareza em vez de otimização** -- A maioria das lições é **autossuficiente** e pode ser concluída de forma independente -- **Soluções fornecidas**, mas os alunos devem tentar os exercícios primeiro -- O repositório utiliza **Docsify** para documentação web sem etapa de construção -- **Sketchnotes** fornecem resumos visuais dos conceitos -- **Suporte multilíngue** torna o conteúdo acessível globalmente - ---- - -**Aviso**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/CODE_OF_CONDUCT.md b/translations/pt/CODE_OF_CONDUCT.md deleted file mode 100644 index 92de7d742..000000000 --- a/translations/pt/CODE_OF_CONDUCT.md +++ /dev/null @@ -1,23 +0,0 @@ - -# Código de Conduta de Código Aberto da Microsoft - -Este projeto adotou o [Código de Conduta de Código Aberto da Microsoft](https://opensource.microsoft.com/codeofconduct/). - -Recursos: - -- [Código de Conduta de Código Aberto da Microsoft](https://opensource.microsoft.com/codeofconduct/) -- [FAQ do Código de Conduta da Microsoft](https://opensource.microsoft.com/codeofconduct/faq/) -- Contacte [opencode@microsoft.com](mailto:opencode@microsoft.com) para questões ou preocupações - ---- - -**Aviso de Responsabilidade**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/CONTRIBUTING.md b/translations/pt/CONTRIBUTING.md deleted file mode 100644 index 1b07d478a..000000000 --- a/translations/pt/CONTRIBUTING.md +++ /dev/null @@ -1,24 +0,0 @@ - -# Contribuir - -Este projeto acolhe contribuições e sugestões. A maioria das contribuições requer que concorde com um Acordo de Licença de Contribuidor (CLA), declarando que tem o direito de, e realmente concede-nos, os direitos para usar a sua contribuição. Para mais detalhes, visite https://cla.microsoft.com. - -> Importante: ao traduzir texto neste repositório, certifique-se de que não utiliza tradução automática. Vamos verificar as traduções através da comunidade, por isso, só se ofereça para traduzir em línguas nas quais é proficiente. - -Quando submeter um pull request, um CLA-bot determinará automaticamente se precisa de fornecer um CLA e decorará o PR de forma apropriada (por exemplo, etiqueta, comentário). Basta seguir as instruções fornecidas pelo bot. Só precisará de fazer isto uma vez em todos os repositórios que utilizam o nosso CLA. - -Este projeto adotou o [Código de Conduta de Código Aberto da Microsoft](https://opensource.microsoft.com/codeofconduct/). -Para mais informações, consulte as [Perguntas Frequentes sobre o Código de Conduta](https://opensource.microsoft.com/codeofconduct/faq/) ou contacte [opencode@microsoft.com](mailto:opencode@microsoft.com) para quaisquer questões ou comentários adicionais. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/PyTorch_Fundamentals.ipynb b/translations/pt/PyTorch_Fundamentals.ipynb deleted file mode 100644 index 62a56f8fe..000000000 --- a/translations/pt/PyTorch_Fundamentals.ipynb +++ /dev/null @@ -1,2830 +0,0 @@ -{ - "nbformat": 4, - "nbformat_minor": 0, - "metadata": { - "colab": { - "provenance": [], - "gpuType": "T4", - "authorship_tag": "ABX9TyOgv0AozH1FKQBD+RkgT2bV", - "include_colab_link": true - }, - "kernelspec": { - "name": "python3", - "display_name": "Python 3" - }, - "language_info": { - "name": "python" - }, - "accelerator": "GPU", - "coopTranslator": { - "original_hash": "0ca21b6ee62904d616f2e36dc1cf0da7", - "translation_date": "2025-09-03T19:15:37+00:00", - "source_file": "PyTorch_Fundamentals.ipynb", - "language_code": "pt" - } - }, - "cells": [ - { - "cell_type": "markdown", - "metadata": { - "id": "view-in-github", - "colab_type": "text" - }, - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": { - "id": "EHh5JllMh1rG", - "outputId": "f55755ad-c369-414c-85ec-6e9d4f061a02", - "colab": { - "base_uri": "https://localhost:8080/", - "height": 35 - } - }, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "'2.2.1+cu121'" - ], - "application/vnd.google.colaboratory.intrinsic+json": { - "type": "string" - } - }, - "metadata": {}, - "execution_count": 1 - } - ], - "source": [ - "import torch\n", - "torch.__version__" - ] - }, - { - "cell_type": "code", - "source": [ - "print(\"I am excited to run this\")" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "UPlb-duwXAfz", - "outputId": "cfd687e4-1238-49f4-ab6b-ee1305b740d2" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "I am excited to run this\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "import pandas as pd\n", - "import numpy as np\n", - "import matplotlib.pyplot as plt\n", - "print(torch.__version__)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "byWVlJ9wXDSk", - "outputId": "fd74a5c4-4d4a-41b2-ef3c-562ea3e4811f" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "2.2.1+cu121\n" - ] - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "Osm80zoEYklS" - } - }, - { - "cell_type": "code", - "source": [ - "# scalar\n", - "scalar = torch.tensor(7)\n", - "scalar" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "-o8wvJ-VXZmI", - "outputId": "558816f5-1205-4de1-fe1f-2f96e9bd79e6" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(7)" - ] - }, - "metadata": {}, - "execution_count": 4 - } - ] - }, - { - "cell_type": "code", - "source": [ - "scalar.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "mCZ2tXC4Y_Sg", - "outputId": "2d86dbdc-56e1-45c6-d3dd-14515f2a457a" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "0" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ] - }, - { - "cell_type": "code", - "source": [ - "scalar.item()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ssN00By0ZQgS", - "outputId": "490f40d1-5135-4969-a6d3-c8c902cdc473" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "7" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ] - }, - { - "cell_type": "code", - "source": [ - "# vector\n", - "vector = torch.tensor([7, 7])\n", - "vector\n", - "#vector.ndim\n", - "#vector.item()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Bws__5wlZnmF", - "outputId": "944e38f9-5ba1-4ddc-a9c6-cfb6a19bb488" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([7, 7])" - ] - }, - "metadata": {}, - "execution_count": 7 - } - ] - }, - { - "cell_type": "code", - "source": [ - "vector.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "9pjCvnsZZzNG", - "outputId": "e030a4da-8f81-4858-fbce-86da2aaafe52" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([2])" - ] - }, - "metadata": {}, - "execution_count": 8 - } - ] - }, - { - "cell_type": "code", - "source": [ - "# Matrix\n", - "MATRIX = torch.tensor([[7, 8],[9, 10]])\n", - "MATRIX" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "a747hI9SaBGW", - "outputId": "af835ddb-81ff-4981-badb-441567194d15" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[ 7, 8],\n", - " [ 9, 10]])" - ] - }, - "metadata": {}, - "execution_count": 9 - } - ] - }, - { - "cell_type": "code", - "source": [ - "MATRIX.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XdTfFa7vaRUj", - "outputId": "0fbbab9c-8263-4cad-a380-0d2a16ca499e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ] - }, - { - "cell_type": "code", - "source": [ - "MATRIX[0]\n", - "MATRIX[1]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "TFeD3jSDafm7", - "outputId": "69b44ab3-5ba7-451a-c6b2-f019a03d0c96" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 9, 10])" - ] - }, - "metadata": {}, - "execution_count": 11 - } - ] - }, - { - "cell_type": "code", - "source": [ - "# Tensor\n", - "TENSOR = torch.tensor([[[1, 2, 3],[3,6,9], [2,4,5]]])\n", - "TENSOR" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ic3cE47tah42", - "outputId": "f250e295-91de-43ec-9d80-588a6fe0abde" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[1, 2, 3],\n", - " [3, 6, 9],\n", - " [2, 4, 5]]])" - ] - }, - "metadata": {}, - "execution_count": 12 - } - ] - }, - { - "cell_type": "code", - "source": [ - "TENSOR.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Wvjf5fczbAM1", - "outputId": "9c72b5b8-bafe-4ae7-9883-b051e209eada" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([1, 3, 3])" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ] - }, - { - "cell_type": "code", - "source": [ - "TENSOR.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "mwtXZwiMbN3m", - "outputId": "331a5e36-b1b0-4a5f-a9b8-e7049cbaa8f9" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "3" - ] - }, - "metadata": {}, - "execution_count": 14 - } - ] - }, - { - "cell_type": "code", - "source": [ - "TENSOR[0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "vzdZu_IfbP3J", - "outputId": "e24e7e71-e365-412d-ff50-fc094b56d2f3" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 2, 3],\n", - " [3, 6, 9],\n", - " [2, 4, 5]])" - ] - }, - "metadata": {}, - "execution_count": 15 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "A8OL9eWfcRrJ" - } - }, - { - "cell_type": "code", - "source": [ - "random_tensor = torch.rand(3,4)\n", - "random_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "hAqSDE1EcVS_", - "outputId": "946171c3-d054-400c-f893-79110356888c" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.4414, 0.7681, 0.8385, 0.3166],\n", - " [0.0468, 0.5812, 0.0670, 0.9173],\n", - " [0.2959, 0.3276, 0.7411, 0.4643]])" - ] - }, - "metadata": {}, - "execution_count": 16 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor.ndim" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "g4fvPE5GcwzP", - "outputId": "8737f36b-6864-4059-eaed-6f9156c22306" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "2" - ] - }, - "metadata": {}, - "execution_count": 17 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XsAg99QmdAU6", - "outputId": "35467c11-257c-4f16-99aa-eca930bcbc36" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([3, 4])" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor.size()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cii1pNdVdB68", - "outputId": "fc8d2de6-9215-43de-99f7-7b0d7f7d20fa" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([3, 4])" - ] - }, - "metadata": {}, - "execution_count": 19 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_image_tensor = torch.rand(size=(3, 224, 224)) #color channels, height, width\n", - "random_image_tensor.ndim, random_image_tensor.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "aTKq2j0cdDjb", - "outputId": "6be42057-20b9-4faf-d79d-8b65c42cc27e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(3, torch.Size([3, 224, 224]))" - ] - }, - "metadata": {}, - "execution_count": 20 - } - ] - }, - { - "cell_type": "code", - "source": [ - "random_tensor_ofownsize = torch.rand(size=(5,10,10))\n", - "random_tensor_ofownsize.ndim, random_tensor_ofownsize.shape\n" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "IyhDdj-Pd6nC", - "outputId": "43e5e334-6d4d-4b67-f87d-7d364c6d8c67" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(3, torch.Size([5, 10, 10]))" - ] - }, - "metadata": {}, - "execution_count": 21 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "UOJW08uOert_" - } - }, - { - "cell_type": "code", - "source": [ - "zero = torch.zeros(size=(3, 4))\n", - "zero" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "uGvXtaXyefie", - "outputId": "d40d3e28-8667-4d2f-8b62-f0829c6162ad" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0., 0., 0., 0.],\n", - " [0., 0., 0., 0.],\n", - " [0., 0., 0., 0.]])" - ] - }, - "metadata": {}, - "execution_count": 22 - } - ] - }, - { - "cell_type": "code", - "source": [ - "zero*random_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "OyUkUPkDe0uH", - "outputId": "26c2e4be-36ba-4c6c-9a90-2704ec135828" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0., 0., 0., 0.],\n", - " [0., 0., 0., 0.],\n", - " [0., 0., 0., 0.]])" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ones = torch.ones(size=(3, 4))\n", - "ones\n" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "y_Ac62Aqe82G", - "outputId": "291de5d9-b9df-49de-c9d1-d098e3e9f4d8" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1., 1., 1., 1.],\n", - " [1., 1., 1., 1.],\n", - " [1., 1., 1., 1.]])" - ] - }, - "metadata": {}, - "execution_count": 24 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ones.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "TvGOA9odfIEO", - "outputId": "45949ef4-6649-4b6c-d6af-2d4bfb8de832" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.float32" - ] - }, - "metadata": {}, - "execution_count": 25 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ones*zero" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "--pTyge-fI-8", - "outputId": "c4d9bb7e-829b-43db-e2db-b1a2d64e61f0" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0., 0., 0., 0.],\n", - " [0., 0., 0., 0.],\n", - " [0., 0., 0., 0.]])" - ] - }, - "metadata": {}, - "execution_count": 26 - } - ] - }, - { - "cell_type": "markdown", - "source": [], - "metadata": { - "id": "qDcc7Z36fSJF" - } - }, - { - "cell_type": "code", - "source": [ - "one_to_ten = torch.arange(start = 1, end = 11, step = 1)\n", - "one_to_ten" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "w3CZB4zUfR1s", - "outputId": "197fcba1-da0a-4b4a-ed11-3974bd6c01aa" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])" - ] - }, - "metadata": {}, - "execution_count": 27 - } - ] - }, - { - "cell_type": "code", - "source": [ - "ten_zeros = torch.zeros_like(one_to_ten)\n", - "ten_zeros" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "WZh99BwVfRy8", - "outputId": "51ef8bfb-6fa0-4099-ff66-b97d65b2ddea" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])" - ] - }, - "metadata": {}, - "execution_count": 28 - } - ] - }, - { - "cell_type": "markdown", - "source": [ - "Tipos de Dados Tensoriais\n" - ], - "metadata": { - "id": "pGGhgsbUgqbW" - } - }, - { - "cell_type": "code", - "source": [ - "float_32_tensor = torch.tensor([3.0, 6.0,9.0], dtype = None, device = None, requires_grad = False)\n", - "float_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "JORJl4XkfRsx", - "outputId": "71114171-0f49-481f-b6fc-6cb48e2fb895" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([3., 6., 9.])" - ] - }, - "metadata": {}, - "execution_count": 29 - } - ] - }, - { - "cell_type": "code", - "source": [ - "float_32_tensor.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "6wOPPwGyfRLn", - "outputId": "f23776a1-b682-404a-9f67-d5bcb0402666" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.float32" - ] - }, - "metadata": {}, - "execution_count": 30 - } - ] - }, - { - "cell_type": "code", - "source": [ - "float_16_tensor = float_32_tensor.type(torch.float16)\n", - "float_16_tensor.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "tFsHCvmZfOYe", - "outputId": "d3aa305a-7591-47f5-97fd-61bff60b44bd" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.float16" - ] - }, - "metadata": {}, - "execution_count": 31 - } - ] - }, - { - "cell_type": "code", - "source": [ - "float_16_tensor*float_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "TQiCGTPuwq0q", - "outputId": "98750fce-1ca3-4889-e269-8b753efdea96" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 9., 36., 81.])" - ] - }, - "metadata": {}, - "execution_count": 32 - } - ] - }, - { - "cell_type": "code", - "source": [ - "int_32_tensor = torch.tensor([3, 6, 9], dtype = torch.int32)\n", - "int_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "5hlrLvGUw5D_", - "outputId": "41d890a0-9aee-446c-d906-631ce2ab0995" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([3, 6, 9], dtype=torch.int32)" - ] - }, - "metadata": {}, - "execution_count": 33 - } - ] - }, - { - "cell_type": "code", - "source": [ - "int_32_tensor*float_32_tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ihApD9u3xTNW", - "outputId": "d295eed0-6996-4e0f-8502-ff4b55cd1373" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 9., 36., 81.])" - ] - }, - "metadata": {}, - "execution_count": 34 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x = torch.arange(0,100,10)" - ], - "metadata": { - "id": "utKhlb_KxWDQ" - }, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "p78D74E9Rj7Y", - "outputId": "781a1614-a900-41f5-9e5d-358f0b2390aa" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 0, 10, 20, 30, 40, 50, 60, 70, 80, 90])" - ] - }, - "metadata": {}, - "execution_count": 36 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.min()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "4BcSs5NeRkcj", - "outputId": "3f24a8dc-58e9-4a5f-9834-e85856a34f9d" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0)" - ] - }, - "metadata": {}, - "execution_count": 37 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.max()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "hinqvXVLRm4q", - "outputId": "5c7d8a53-3913-4ac1-bba3-5ba8ff68250a" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(90)" - ] - }, - "metadata": {}, - "execution_count": 38 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.mean(x.type(torch.float32))" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "k7okc0_vRpnB", - "outputId": "91e5494f-dc57-417c-ea4d-25dbc547c893" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(45.)" - ] - }, - "metadata": {}, - "execution_count": 39 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.type(torch.float32).mean()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "29QcDTjHRq10", - "outputId": "62937c6c-78e0-49f2-dde3-1543ee8f7907" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(45.)" - ] - }, - "metadata": {}, - "execution_count": 40 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.sum()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "wlpY_G_sbdKF", - "outputId": "475d8258-af65-4011-a258-b93d4d8142d4" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(450)" - ] - }, - "metadata": {}, - "execution_count": 41 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.argmax()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "GT6HJzwhbk4n", - "outputId": "2e455c20-c322-4bcf-d07c-1259d3ccefc6" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(9)" - ] - }, - "metadata": {}, - "execution_count": 42 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x.argmin()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "egL3oi2Mb19P", - "outputId": "f71fb32f-6338-44a3-b377-75bea0a3ab54" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0)" - ] - }, - "metadata": {}, - "execution_count": 43 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "p2U8DZKib3DP", - "outputId": "b9f613b9-74e9-45f4-ed01-05babb6a6793" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0)" - ] - }, - "metadata": {}, - "execution_count": 44 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[9]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "24qBFlGYcABe", - "outputId": "5813cfcb-7f63-4bd7-ee46-f95ccbfda939" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(90)" - ] - }, - "metadata": {}, - "execution_count": 45 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x = torch.arange(1, 10)\n", - "x.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "0GPOxEzkcBHO", - "outputId": "aefbd903-4f4c-4d2c-c90f-eccd682fe018" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "torch.Size([9])" - ] - }, - "metadata": {}, - "execution_count": 46 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_reshaped = x.reshape(1,9)\n", - "x_reshaped, x_reshaped.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "spmRgQjwddgp", - "outputId": "85a7c55c-2909-4ea2-fc68-386dddc65742" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(tensor([[1, 2, 3, 4, 5, 6, 7, 8, 9]]), torch.Size([1, 9]))" - ] - }, - "metadata": {}, - "execution_count": 47 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_reshaped.view(1,9)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "tH2ahWGydqqP", - "outputId": "65d92263-4fc4-434a-c06d-c5e08436f7fe" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 2, 3, 4, 5, 6, 7, 8, 9]])" - ] - }, - "metadata": {}, - "execution_count": 48 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked = torch.stack([x, x, x, x], dim = 1)\n", - "x_stacked" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "jgCeJcaud_-1", - "outputId": "7f293a37-6ef1-43b6-aee5-9d6d91c94f9e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 1, 1, 1],\n", - " [2, 2, 2, 2],\n", - " [3, 3, 3, 3],\n", - " [4, 4, 4, 4],\n", - " [5, 5, 5, 5],\n", - " [6, 6, 6, 6],\n", - " [7, 7, 7, 7],\n", - " [8, 8, 8, 8],\n", - " [9, 9, 9, 9]])" - ] - }, - "metadata": {}, - "execution_count": 49 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.squeeze()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "XhJHIK6cfPse", - "outputId": "06c47b89-3a9e-453e-bcc3-00cbcb0b8b49" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 1, 1, 1],\n", - " [2, 2, 2, 2],\n", - " [3, 3, 3, 3],\n", - " [4, 4, 4, 4],\n", - " [5, 5, 5, 5],\n", - " [6, 6, 6, 6],\n", - " [7, 7, 7, 7],\n", - " [8, 8, 8, 8],\n", - " [9, 9, 9, 9]])" - ] - }, - "metadata": {}, - "execution_count": 50 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.unsqueeze(dim=1)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ej2c3Xxzf0tq", - "outputId": "94024061-eb37-446d-c4a8-e4d16cb6de81" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[1, 1, 1, 1]],\n", - "\n", - " [[2, 2, 2, 2]],\n", - "\n", - " [[3, 3, 3, 3]],\n", - "\n", - " [[4, 4, 4, 4]],\n", - "\n", - " [[5, 5, 5, 5]],\n", - "\n", - " [[6, 6, 6, 6]],\n", - "\n", - " [[7, 7, 7, 7]],\n", - "\n", - " [[8, 8, 8, 8]],\n", - "\n", - " [[9, 9, 9, 9]]])" - ] - }, - "metadata": {}, - "execution_count": 52 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.squeeze()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "4DJYo1a0f5M0", - "outputId": "efca2b47-1b14-44de-9a9a-2c83629d153f" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 1, 1, 1],\n", - " [2, 2, 2, 2],\n", - " [3, 3, 3, 3],\n", - " [4, 4, 4, 4],\n", - " [5, 5, 5, 5],\n", - " [6, 6, 6, 6],\n", - " [7, 7, 7, 7],\n", - " [8, 8, 8, 8],\n", - " [9, 9, 9, 9]])" - ] - }, - "metadata": {}, - "execution_count": 53 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_stacked.unsqueeze(dim=-2)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "J4iEjn2ah2HL", - "outputId": "22395593-7c16-4162-beae-dd2bbe7bda35" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[1, 1, 1, 1]],\n", - "\n", - " [[2, 2, 2, 2]],\n", - "\n", - " [[3, 3, 3, 3]],\n", - "\n", - " [[4, 4, 4, 4]],\n", - "\n", - " [[5, 5, 5, 5]],\n", - "\n", - " [[6, 6, 6, 6]],\n", - "\n", - " [[7, 7, 7, 7]],\n", - "\n", - " [[8, 8, 8, 8]],\n", - "\n", - " [[9, 9, 9, 9]]])" - ] - }, - "metadata": {}, - "execution_count": 55 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "tensor = torch.tensor([1, 2, 3])\n", - "tensor = tensor - 10\n", - "tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cFfiD7Nth7Z_", - "outputId": "1139e1f8-fc1a-46ca-d636-f2bc4fd2eef6" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-9, -8, -7])" - ] - }, - "metadata": {}, - "execution_count": 7 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.mul(tensor, 10)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "dyA7BM_GHhqE", - "outputId": "0e3b9671-d9e8-4a32-87bb-59bc05986142" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-90, -80, -70])" - ] - }, - "metadata": {}, - "execution_count": 9 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.sub(tensor, 100)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "owtUsZ1KNegI", - "outputId": "189b7b23-0041-4e09-b991-cd209a48506a" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-109, -108, -107])" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.add(tensor, 100)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "K5STXlQONsyc", - "outputId": "00cbb79a-0a1d-4e21-86ec-5c91c37a2d01" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([91, 92, 93])" - ] - }, - "metadata": {}, - "execution_count": 11 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.divide(tensor, 2)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xqMGnzIUNvp0", - "outputId": "c894cf3e-f148-45f8-cfc8-d78740735306" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([-4.5000, -4.0000, -3.5000])" - ] - }, - "metadata": {}, - "execution_count": 13 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.matmul(tensor, tensor)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "ruGzKpV8NyBc", - "outputId": "fddb63bf-006f-48b6-ae28-287fbcda8bc5" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 15 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor@tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "8GS3r9yTeGfD", - "outputId": "c80b12ac-30b5-4f3d-c38c-9e41ba511b0e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 16 - } - ] - }, - { - "cell_type": "code", - "source": [ - "%%time\n", - "tensor@tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "QmuYHqXTemC0", - "outputId": "402fe3ba-70b5-4bb2-c83b-254db84ff810" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "CPU times: user 622 µs, sys: 0 ns, total: 622 µs\n", - "Wall time: 516 µs\n" - ] - }, - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 17 - } - ] - }, - { - "cell_type": "code", - "source": [ - "%%time\n", - "torch.matmul(tensor,tensor)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "dGr1fzdNepd8", - "outputId": "97bd6c91-bc25-4b38-cdf5-f22dcdef243e" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "CPU times: user 424 µs, sys: 998 µs, total: 1.42 ms\n", - "Wall time: 1.43 ms\n" - ] - }, - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(194)" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.rand(3,2)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "pGYDoK2gevfo", - "outputId": "2c8783d5-0453-47c5-c7ed-af10d25d6989" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.5999, 0.0073],\n", - " [0.9321, 0.3026],\n", - " [0.3463, 0.3872]])" - ] - }, - "metadata": {}, - "execution_count": 20 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.matmul(torch.rand(3,2), torch.rand(2,3))" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "KGBGQoB8e2DP", - "outputId": "4c2ef361-a2d0-41ee-c328-3992cbbc138d" - }, - "execution_count": null, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.3528, 0.1893, 0.0714],\n", - " [1.2791, 0.7110, 0.2563],\n", - " [0.8812, 0.4553, 0.1803]])" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch" - ], - "metadata": { - "id": "ib8DMtkBe_LJ" - }, - "execution_count": 1, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x = torch.rand(2,9)" - ], - "metadata": { - "id": "nJo8ZBdrQY1b" - }, - "execution_count": 2, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "wi6oRv4MQfgf", - "outputId": "55c99f55-31f6-4cf5-ba4e-19a47c3a0167" - }, - "execution_count": 3, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[0.5894, 0.4391, 0.2018, 0.5417, 0.3844, 0.3592, 0.9209, 0.9269, 0.0681],\n", - " [0.0746, 0.1740, 0.6821, 0.6890, 0.0999, 0.7444, 0.2391, 0.4625, 0.8302]])" - ] - }, - "metadata": {}, - "execution_count": 3 - } - ] - }, - { - "cell_type": "code", - "source": [ - "y=torch.randn(2,3,5)\n", - "y" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Zpx8myAUQgoc", - "outputId": "07756d70-56bd-437c-c74e-9aecc1a77311" - }, - "execution_count": 5, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[ 1.5552, -0.4877, 0.5175, -1.7958, -0.6187],\n", - " [-0.3359, -1.9710, 0.0112, -1.7578, -1.5295],\n", - " [ 0.0932, 1.4079, 0.9108, 0.3328, -0.6978]],\n", - "\n", - " [[-0.9406, -1.0809, -0.2595, 0.1282, 1.6605],\n", - " [ 1.1624, 1.0902, 1.7092, -0.2842, -1.3780],\n", - " [-0.1534, -1.2795, -0.5495, 0.9902, 0.1822]]])" - ] - }, - "metadata": {}, - "execution_count": 5 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_original = torch.rand(size=(224,224,3))\n", - "x_original" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "s4U-X9bJQnWe", - "outputId": "657a7a76-962c-4b41-a76b-902d0482266c" - }, - "execution_count": 6, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[[0.4549, 0.6809, 0.2118],\n", - " [0.4824, 0.9008, 0.8741],\n", - " [0.1715, 0.1757, 0.1845],\n", - " ...,\n", - " [0.8741, 0.6594, 0.2610],\n", - " [0.0092, 0.1984, 0.1955],\n", - " [0.4236, 0.4182, 0.0251]],\n", - "\n", - " [[0.9174, 0.1661, 0.5852],\n", - " [0.1837, 0.2351, 0.3810],\n", - " [0.3726, 0.4808, 0.8732],\n", - " ...,\n", - " [0.6794, 0.0554, 0.9202],\n", - " [0.0864, 0.8750, 0.3558],\n", - " [0.8445, 0.9759, 0.4934]],\n", - "\n", - " [[0.1600, 0.2635, 0.7194],\n", - " [0.9488, 0.3405, 0.3647],\n", - " [0.6683, 0.5168, 0.9592],\n", - " ...,\n", - " [0.0521, 0.0140, 0.2445],\n", - " [0.3596, 0.3999, 0.2730],\n", - " [0.5926, 0.9877, 0.7784]],\n", - "\n", - " ...,\n", - "\n", - " [[0.4794, 0.5635, 0.3764],\n", - " [0.9124, 0.6094, 0.5059],\n", - " [0.4528, 0.4447, 0.5021],\n", - " ...,\n", - " [0.0089, 0.4816, 0.8727],\n", - " [0.2173, 0.6296, 0.2347],\n", - " [0.2028, 0.9931, 0.7201]],\n", - "\n", - " [[0.3116, 0.6459, 0.4703],\n", - " [0.0148, 0.2345, 0.7149],\n", - " [0.8393, 0.5804, 0.6691],\n", - " ...,\n", - " [0.2105, 0.9460, 0.2696],\n", - " [0.5918, 0.9295, 0.2616],\n", - " [0.2537, 0.7819, 0.4700]],\n", - "\n", - " [[0.6654, 0.1200, 0.5841],\n", - " [0.9147, 0.5522, 0.6529],\n", - " [0.1799, 0.5276, 0.5415],\n", - " ...,\n", - " [0.7536, 0.4346, 0.8793],\n", - " [0.3793, 0.1750, 0.7792],\n", - " [0.9266, 0.8325, 0.9974]]])" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_permuted=x_original.permute(2, 0, 1)\n", - "print(x_original.shape)\n", - "print(x_permuted.shape)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "DD19_zvbQzHo", - "outputId": "1d64ce1b-eb48-47e3-90b6-7f1340e7f2b2" - }, - "execution_count": 9, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "torch.Size([224, 224, 3])\n", - "torch.Size([3, 224, 224])\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_original[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "NnPmMk4ZRF7w", - "outputId": "2cd5da7f-4a23-4a76-8c4a-bb982113f2a4" - }, - "execution_count": 10, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.4549)" - ] - }, - "metadata": {}, - "execution_count": 10 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_permuted[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Z0ylNoAARgTo", - "outputId": "ddca0298-cddf-4048-9b71-a791655e5bed" - }, - "execution_count": 11, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.4549)" - ] - }, - "metadata": {}, - "execution_count": 11 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_original[0,0,0]=0.989" - ], - "metadata": { - "id": "RXw0xXsDRi4L" - }, - "execution_count": 13, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "x_original[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "1sFdV6wzRo3f", - "outputId": "1cf87d2c-6d88-453a-d136-0f625a2800f1" - }, - "execution_count": 14, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.9890)" - ] - }, - "metadata": {}, - "execution_count": 14 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x_permuted[0,0,0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "xTX-hx2SR1wp", - "outputId": "0d4908c4-c3bc-44e3-8ec6-1487104cc209" - }, - "execution_count": 15, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(0.9890)" - ] - }, - "metadata": {}, - "execution_count": 15 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x=torch.arange(1,10).reshape(1,3,3)\n", - "x, x.shape" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "mZomOe7gR4Q8", - "outputId": "0b3c922f-ec11-46de-b8a5-9f9533d866ad" - }, - "execution_count": 18, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(tensor([[[1, 2, 3],\n", - " [4, 5, 6],\n", - " [7, 8, 9]]]),\n", - " torch.Size([1, 3, 3]))" - ] - }, - "metadata": {}, - "execution_count": 18 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "3y7v4SQvSBs1", - "outputId": "8c53307d-e628-404d-db66-56c6bdffab7c" - }, - "execution_count": 19, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([[1, 2, 3],\n", - " [4, 5, 6],\n", - " [7, 8, 9]])" - ] - }, - "metadata": {}, - "execution_count": 19 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0][0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "hf9uG4xLSNya", - "outputId": "3075bc42-9ffa-426b-8a86-95628ffcd824" - }, - "execution_count": 21, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1, 2, 3])" - ] - }, - "metadata": {}, - "execution_count": 21 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0][0][0]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "zA4G2Se4SRB3", - "outputId": "324312d2-ed0a-49eb-f81f-e904e53992fe" - }, - "execution_count": 22, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(1)" - ] - }, - "metadata": {}, - "execution_count": 22 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0][2][2]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Mwy3zmKKSdbk", - "outputId": "d35172c3-b099-40a6-ddf1-a453c2adfa44" - }, - "execution_count": 23, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor(9)" - ] - }, - "metadata": {}, - "execution_count": 23 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[:,1,1]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "fE3nCM1KS7XT", - "outputId": "01f5d755-9737-4235-9f73-dce89ff6ba16" - }, - "execution_count": 24, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([5])" - ] - }, - "metadata": {}, - "execution_count": 24 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0,0,:]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "luNDINKNTTxp", - "outputId": "091195ef-2f71-4602-e95f-529a69193150" - }, - "execution_count": 25, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1, 2, 3])" - ] - }, - "metadata": {}, - "execution_count": 25 - } - ] - }, - { - "cell_type": "code", - "source": [ - "x[0,:,2]" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "KG8A4xbfThCL", - "outputId": "5866bc41-9241-4619-be7b-e9206b3f80ab" - }, - "execution_count": 26, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([3, 6, 9])" - ] - }, - "metadata": {}, - "execution_count": 26 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import numpy as np" - ], - "metadata": { - "id": "CZ3PX0qlTwHJ" - }, - "execution_count": 27, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "array = np.arange(1.0, 8.0)" - ], - "metadata": { - "id": "UOBeTumiT3Lf" - }, - "execution_count": 28, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "array" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "RzcO32E9UCQl", - "outputId": "430def24-c42c-461f-e5e7-398544c695d3" - }, - "execution_count": 29, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array([1., 2., 3., 4., 5., 6., 7.])" - ] - }, - "metadata": {}, - "execution_count": 29 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor = torch.from_numpy(array)\n", - "tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "JJIL0q1DUC6O", - "outputId": "8a3b1d7c-4482-4d32-f34f-9212d9d3a177" - }, - "execution_count": 32, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1., 2., 3., 4., 5., 6., 7.], dtype=torch.float64)" - ] - }, - "metadata": {}, - "execution_count": 32 - } - ] - }, - { - "cell_type": "code", - "source": [ - "array[3]=11.0" - ], - "metadata": { - "id": "j3Ce6q3DUIEK" - }, - "execution_count": 33, - "outputs": [] - }, - { - "cell_type": "code", - "source": [ - "array" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "dc_BCVdjUsCc", - "outputId": "65537325-8b11-4f36-fc73-e56f30d6a036" - }, - "execution_count": 34, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "array([ 1., 2., 3., 11., 5., 6., 7.])" - ] - }, - "metadata": {}, - "execution_count": 34 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "VG1e_eITUta2", - "outputId": "a26c5198-23b6-4a6d-d73a-ba20cd9782b8" - }, - "execution_count": 35, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([ 1., 2., 3., 11., 5., 6., 7.], dtype=torch.float64)" - ] - }, - "metadata": {}, - "execution_count": 35 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor = torch.ones(7)\n", - "tensor, tensor.dtype\n", - "numpy_tensor = tensor.numpy()\n", - "numpy_tensor, numpy_tensor.dtype" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Swt8JF8vUuev", - "outputId": "c9e5bf6a-6d2c-41d6-8327-366867ffdd2d" - }, - "execution_count": 37, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "(array([1., 1., 1., 1., 1., 1., 1.], dtype=float32), dtype('float32'))" - ] - }, - "metadata": {}, - "execution_count": 37 - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "random_tensor_A = torch.rand(3,4)\n", - "random_tensor_B = torch.rand(3,4)\n", - "print(random_tensor_A)\n", - "print(random_tensor_B)\n", - "print(random_tensor_A == random_tensor_B)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "uGcagTteVFTD", - "outputId": "49405790-08e7-4210-b7f1-f00b904c7eb9" - }, - "execution_count": 38, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "tensor([[0.9870, 0.6636, 0.6873, 0.8863],\n", - " [0.8386, 0.4169, 0.3587, 0.0265],\n", - " [0.2981, 0.6025, 0.5652, 0.5840]])\n", - "tensor([[0.9821, 0.3481, 0.0913, 0.4940],\n", - " [0.7495, 0.4387, 0.9582, 0.8659],\n", - " [0.5064, 0.6919, 0.0809, 0.9771]])\n", - "tensor([[False, False, False, False],\n", - " [False, False, False, False],\n", - " [False, False, False, False]])\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "RANDOM_SEED = 42\n", - "torch.manual_seed(RANDOM_SEED)\n", - "random_tensor_C = torch.rand(3,4)\n", - "torch.manual_seed(RANDOM_SEED)\n", - "random_tensor_D = torch.rand(3,4)\n", - "print(random_tensor_C)\n", - "print(random_tensor_D)\n", - "print(random_tensor_C == random_tensor_D)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "HznyXyEaWjLM", - "outputId": "25956434-01b6-4059-9054-c9978884ddc1" - }, - "execution_count": 46, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "tensor([[0.8823, 0.9150, 0.3829, 0.9593],\n", - " [0.3904, 0.6009, 0.2566, 0.7936],\n", - " [0.9408, 0.1332, 0.9346, 0.5936]])\n", - "tensor([[0.8823, 0.9150, 0.3829, 0.9593],\n", - " [0.3904, 0.6009, 0.2566, 0.7936],\n", - " [0.9408, 0.1332, 0.9346, 0.5936]])\n", - "tensor([[True, True, True, True],\n", - " [True, True, True, True],\n", - " [True, True, True, True]])\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "!nvidia-smi" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "vltPTh0YXJSt", - "outputId": "807af6dc-a9ca-4301-ec32-b688dbde8be8" - }, - "execution_count": 2, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "Thu May 23 02:57:59 2024 \n", - "+---------------------------------------------------------------------------------------+\n", - "| NVIDIA-SMI 535.104.05 Driver Version: 535.104.05 CUDA Version: 12.2 |\n", - "|-----------------------------------------+----------------------+----------------------+\n", - "| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |\n", - "| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |\n", - "| | | MIG M. |\n", - "|=========================================+======================+======================|\n", - "| 0 Tesla T4 Off | 00000000:00:04.0 Off | 0 |\n", - "| N/A 60C P8 11W / 70W | 0MiB / 15360MiB | 0% Default |\n", - "| | | N/A |\n", - "+-----------------------------------------+----------------------+----------------------+\n", - " \n", - "+---------------------------------------------------------------------------------------+\n", - "| Processes: |\n", - "| GPU GI CI PID Type Process name GPU Memory |\n", - "| ID ID Usage |\n", - "|=======================================================================================|\n", - "| No running processes found |\n", - "+---------------------------------------------------------------------------------------+\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "import torch\n", - "torch.cuda.is_available()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "L6mMyPDyYh1j", - "outputId": "279c5dd8-c2a8-4fbd-f321-2f5d7c6e90e6" - }, - "execution_count": 3, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "True" - ] - }, - "metadata": {}, - "execution_count": 3 - } - ] - }, - { - "cell_type": "code", - "source": [ - "device = \"cuda\" if torch.cuda.is_available() else \"cpu\"\n", - "device" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 35 - }, - "id": "oOdiYa7ZYytx", - "outputId": "d73b04fc-8963-4826-9722-08d118d5ab91" - }, - "execution_count": 5, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "'cuda'" - ], - "application/vnd.google.colaboratory.intrinsic+json": { - "type": "string" - } - }, - "metadata": {}, - "execution_count": 5 - } - ] - }, - { - "cell_type": "code", - "source": [ - "torch.cuda.device_count()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "vOdsazLqZFM5", - "outputId": "8189cd6a-9017-4663-a652-3e15c517d9c3" - }, - "execution_count": 6, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "1" - ] - }, - "metadata": {}, - "execution_count": 6 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor = torch.tensor([1,2,3], device = \"cpu\")\n", - "print(tensor, tensor.device)" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "cdik9Vw3ZMv0", - "outputId": "044a68fd-83a1-409d-8e3b-655142ca0270" - }, - "execution_count": 7, - "outputs": [ - { - "output_type": "stream", - "name": "stdout", - "text": [ - "tensor([1, 2, 3]) cpu\n" - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor_on_gpu = tensor.to(device)\n", - "tensor_on_gpu" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, - "id": "Zmp835rrZp-z", - "outputId": "37fa3413-18a3-47bf-ae51-5b36ff85a3ef" - }, - "execution_count": 8, - "outputs": [ - { - "output_type": "execute_result", - "data": { - "text/plain": [ - "tensor([1, 2, 3], device='cuda:0')" - ] - }, - "metadata": {}, - "execution_count": 8 - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor_on_gpu.numpy()" - ], - "metadata": { - "colab": { - "base_uri": "https://localhost:8080/", - "height": 159 - }, - "id": "jhriaa8uZ1yM", - "outputId": "bc5a3226-1a12-4fea-8769-a44f21cdc323" - }, - "execution_count": 10, - "outputs": [ - { - "output_type": "error", - "ename": "TypeError", - "evalue": "can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first.", - "traceback": [ - "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", - "\u001b[0;31mTypeError\u001b[0m Traceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mtensor_on_gpu\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mnumpy\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", - "\u001b[0;31mTypeError\u001b[0m: can't convert cuda:0 device type tensor to numpy. Use Tensor.cpu() to copy the tensor to host memory first." - ] - } - ] - }, - { - "cell_type": "code", - "source": [ - "tensor_on_cpu = tensor_on_gpu.cpu().numpy()" - ], - "metadata": { - "id": "LHGXK3GgaOzL" - }, - "execution_count": 12, - "outputs": [] - }, - { - "cell_type": "code", - "source": [], - "metadata": { - "id": "j-El4LlCajfq" - }, - "execution_count": null, - "outputs": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "\n---\n\n**Aviso Legal**: \nEste documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução.\n" - ] - } - ] -} \ No newline at end of file diff --git a/translations/pt/README.md b/translations/pt/README.md deleted file mode 100644 index acd498084..000000000 --- a/translations/pt/README.md +++ /dev/null @@ -1,232 +0,0 @@ - -[![Licença GitHub](https://img.shields.io/github/license/microsoft/ML-For-Beginners.svg)](https://github.com/microsoft/ML-For-Beginners/blob/master/LICENSE) -[![Contribuidores GitHub](https://img.shields.io/github/contributors/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/graphs/contributors/) -[![Issues GitHub](https://img.shields.io/github/issues/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/issues/) -[![Pull-requests GitHub](https://img.shields.io/github/issues-pr/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/pulls/) -[![PRs Bem-vindos](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com) - -[![Observadores GitHub](https://img.shields.io/github/watchers/microsoft/ML-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/ML-For-Beginners/watchers/) -[![Forks GitHub](https://img.shields.io/github/forks/microsoft/ML-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/ML-For-Beginners/network/) -[![Estrelas GitHub](https://img.shields.io/github/stars/microsoft/ML-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/ML-For-Beginners/stargazers/) - -### 🌐 Suporte Multilíngue - -#### Suportado via GitHub Action (Automatizado e Sempre Atualizado) - - -[Árabe](../ar/README.md) | [Bengali](../bn/README.md) | [Búlgaro](../bg/README.md) | [Birmanês (Myanmar)](../my/README.md) | [Chinês (Simplificado)](../zh/README.md) | [Chinês (Tradicional, Hong Kong)](../hk/README.md) | [Chinês (Tradicional, Macau)](../mo/README.md) | [Chinês (Tradicional, Taiwan)](../tw/README.md) | [Croata](../hr/README.md) | [Checo](../cs/README.md) | [Dinamarquês](../da/README.md) | [Holandês](../nl/README.md) | [Estónio](../et/README.md) | [Finlandês](../fi/README.md) | [Francês](../fr/README.md) | [Alemão](../de/README.md) | [Grego](../el/README.md) | [Hebraico](../he/README.md) | [Hindi](../hi/README.md) | [Húngaro](../hu/README.md) | [Indonésio](../id/README.md) | [Italiano](../it/README.md) | [Japonês](../ja/README.md) | [Kannada](../kn/README.md) | [Coreano](../ko/README.md) | [Lituano](../lt/README.md) | [Malaio](../ms/README.md) | [Malaiala](../ml/README.md) | [Marata](../mr/README.md) | [Nepalês](../ne/README.md) | [Pidgin Nigeriano](../pcm/README.md) | [Norueguês](../no/README.md) | [Persa (Farsi)](../fa/README.md) | [Polaco](../pl/README.md) | [Português (Brasil)](../br/README.md) | [Português (Portugal)](./README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romeno](../ro/README.md) | [Russo](../ru/README.md) | [Sérvio (Cirílico)](../sr/README.md) | [Eslovaco](../sk/README.md) | [Esloveno](../sl/README.md) | [Espanhol](../es/README.md) | [Suaíli](../sw/README.md) | [Sueco](../sv/README.md) | [Tagalo (Filipino)](../tl/README.md) | [Tâmil](../ta/README.md) | [Telugu](../te/README.md) | [Tailandês](../th/README.md) | [Turco](../tr/README.md) | [Ucraniano](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamita](../vi/README.md) - -> **Prefere Clonar Localmente?** - -> Este repositório inclui mais de 50 traduções que aumentam significativamente o tamanho do download. Para clonar sem traduções, use checkout esparso: -> ```bash -> git clone --filter=blob:none --sparse https://github.com/microsoft/ML-For-Beginners.git -> cd ML-For-Beginners -> git sparse-checkout set --no-cone '/*' '!translations' '!translated_images' -> ``` -> Isto dá-lhe tudo o que precisa para completar o curso com um download muito mais rápido. - - -#### Junte-se à Nossa Comunidade - -[![Discord Microsoft Foundry](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) - -Temos uma série de aprendizagem com IA no Discord, saiba mais e junte-se a nós em [Learn with AI Series](https://aka.ms/learnwithai/discord) de 18 a 30 de setembro de 2025. Irá receber dicas e truques sobre como usar o GitHub Copilot para Ciência de Dados. - -![Série Learn with AI](../../../../translated_images/pt-PT/3.9b58fd8d6c373c20.webp) - -# Aprendizagem Automática para Iniciantes - Um Currículo - -> 🌍 Viaje pelo mundo enquanto exploramos a Aprendizagem Automática através das culturas mundiais 🌍 - -Os Cloud Advocates na Microsoft têm o prazer de oferecer um currículo de 12 semanas e 26 aulas, totalmente dedicado à **Aprendizagem Automática**. Neste currículo, irá aprender sobre o que às vezes é chamado de **aprendizagem automática clássica**, usando principalmente a biblioteca Scikit-learn e evitando o deep learning, que é abordado no nosso [currículo AI for Beginners](https://aka.ms/ai4beginners). Combine estas lições com o nosso ['Data Science for Beginners' curriculum](https://aka.ms/ds4beginners), também! - -Viaje connosco pelo mundo enquanto aplicamos essas técnicas clássicas a dados de várias áreas do mundo. Cada aula inclui questionários pré e pós-aula, instruções escritas para completar a lição, uma solução, um desafio, e muito mais. Nossa pedagogia baseada em projetos permite que aprenda construindo, uma forma comprovada para fixar novas competências. - -**✍️ Um grande agradecimento aos nossos autores** Jen Looper, Stephen Howell, Francesca Lazzeri, Tomomi Imura, Cassie Breviu, Dmitry Soshnikov, Chris Noring, Anirban Mukherjee, Ornella Altunyan, Ruth Yakubu e Amy Boyd - -**🎨 Agradecimentos também aos nossos ilustradores** Tomomi Imura, Dasani Madipalli, e Jen Looper - -**🙏 Agradecimentos especiais 🙏 aos nossos autores, revisores e colaboradores de conteúdo Microsoft Student Ambassador**, nomeadamente Rishit Dagli, Muhammad Sakib Khan Inan, Rohan Raj, Alexandru Petrescu, Abhishek Jaiswal, Nawrin Tabassum, Ioan Samuila, e Snigdha Agarwal - -**🤩 Gratidão extra aos Microsoft Student Ambassadors Eric Wanjau, Jasleen Sondhi, e Vidushi Gupta pelas nossas lições de R!** - -# Começando - -Siga estes passos: -1. **Fork do Repositório**: Clique no botão "Fork" no canto superior direito desta página. -2. **Clone o Repositório**: `git clone https://github.com/microsoft/ML-For-Beginners.git` - -> [encontre todos os recursos adicionais para este curso na nossa coleção Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) - -> 🔧 **Precisa de ajuda?** Consulte o nosso [Guia de Resolução de Problemas](TROUBLESHOOTING.md) para soluções para problemas comuns com instalação, configuração e execução das lições. - - -**[Estudantes](https://aka.ms/student-page)**, para usar este currículo, faça fork do repositório completo para a sua conta GitHub e complete os exercícios sozinho ou em grupo: - -- Comece com um questionário pré-aula. -- Leia a aula e complete as atividades, pausando e refletindo em cada verificação de conhecimento. -- Tente criar os projetos compreendendo as lições e não apenas executando o código da solução; no entanto, o código está disponível nas pastas `/solution` em cada lição orientada a projetos. -- Faça o questionário pós-aula. -- Complete o desafio. -- Complete a tarefa. -- Depois de completar um grupo de aulas, visite o [Fórum de Discussão](https://github.com/microsoft/ML-For-Beginners/discussions) e "aprenda em voz alta" preenchendo a rubrica PAT apropriada. Um 'PAT' é uma Ferramenta de Avaliação de Progresso que é uma rubrica que preenche para aprofundar o seu aprendizado. Pode também reagir a outros PATs para aprendermos juntos. - -> Para estudar mais, recomendamos seguir estes módulos e percursos de aprendizagem [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott). - -**Professores**, incluímos [algumas sugestões](for-teachers.md) sobre como usar este currículo. - ---- - -## Vídeos explicativos - -Algumas das lições estão disponíveis em formato de vídeo curto. Pode encontrá-los integrados nas lições, ou na [playlist ML for Beginners do canal Microsoft Developer no YouTube](https://aka.ms/ml-beginners-videos) clicando na imagem abaixo. - -[![Banner ML for beginners](../../../../translated_images/pt-PT/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) - ---- - -## Conheça a Equipa - -[![Vídeo promocional](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) - -**Gif por** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) - -> 🎥 Clique na imagem acima para um vídeo sobre o projeto e as pessoas que o criaram! - ---- - -## Pedagogia - -Escolhemos dois princípios pedagógicos enquanto construíamos este currículo: garantir que é prático e **baseado em projetos** e que inclui **questionários frequentes**. Além disso, este currículo tem um **tema** comum para lhe dar coesão. - -Ao assegurar que o conteúdo está alinhado com projetos, o processo torna-se mais envolvente para os estudantes e a retenção dos conceitos será aumentada. Além disso, um questionário de baixo risco antes da aula define a intenção do estudante para aprender um tópico, enquanto um segundo questionário após a aula garante uma retenção adicional. Este currículo foi desenhado para ser flexível e divertido, podendo ser realizado na íntegra ou em parte. Os projetos começam pequenos e tornam-se progressivamente mais complexos até ao fim do ciclo de 12 semanas. O currículo inclui também um pós-escrito sobre aplicações reais de ML, que pode ser usado como crédito extra ou como base para discussão. - -> Consulte as nossas diretrizes de [Código de Conduta](CODE_OF_CONDUCT.md), [Contribuição](CONTRIBUTING.md), [Tradução](TRANSLATIONS.md) e [Resolução de Problemas](TROUBLESHOOTING.md). Agradecemos o seu feedback construtivo! - -## Cada lição inclui - -- sketchnote opcional -- vídeo suplementar opcional -- vídeo explicativo (em algumas lições) -- [questionário de aquecimento pré-aula](https://ff-quizzes.netlify.app/en/ml/) -- lição escrita -- para lições baseadas em projetos, guias passo a passo para construir o projeto -- verificações de conhecimento -- um desafio -- leitura suplementar -- tarefa -- [questionário pós-aula](https://ff-quizzes.netlify.app/en/ml/) - -> **Uma nota sobre linguagens**: Estas lições estão principalmente escritas em Python, mas muitas também estão disponíveis em R. Para completar uma lição em R, vá à pasta `/solution` e procure lições de R. Elas incluem uma extensão .rmd que representa um ficheiro **R Markdown**, que pode ser simplesmente definido como uma integração de `blocos de código` (de R ou outras linguagens) e um `cabeçalho YAML` (que orienta como formatar as saídas como PDF) num `documento Markdown`. Como tal, serve como um excelente framework de autoria para ciência de dados, permitindo combinar o seu código, o seu output e as suas reflexões escrevendo-as em Markdown. Além disso, documentos R Markdown podem ser renderizados para formatos de saída como PDF, HTML ou Word. -> **Uma nota sobre quizzes**: Todos os quizzes estão contidos na [pasta Quiz App](../../quiz-app), com um total de 52 quizzes com três perguntas cada. Eles estão ligados dentro das lições, mas a aplicação de quizzes pode ser executada localmente; siga as instruções na pasta `quiz-app` para hospedar localmente ou implantar no Azure. - -| Número da Lição | Tema | Agrupamento de Lição | Objetivos de Aprendizagem | Lição Ligada | Autor | -| :-------------: | :-----------------------------------------------------------: | :-------------------------------------------------------: | ----------------------------------------------------------------------------------------------------------------------------- | :-----------------------------------------------------------------------------------------------------------------------------------------: | :------------------------------------------------: | -| 01 | Introdução ao machine learning | [Introdução](1-Introduction/README.md) | Aprender os conceitos básicos por detrás do machine learning | [Lição](1-Introduction/1-intro-to-ML/README.md) | Muhammad | -| 02 | A História do machine learning | [Introdução](1-Introduction/README.md) | Aprender a história que suporta esta área | [Lição](1-Introduction/2-history-of-ML/README.md) | Jen e Amy | -| 03 | Justiça e machine learning | [Introdução](1-Introduction/README.md) | Quais são as importantes questões filosóficas em torno da justiça que os estudantes devem considerar ao construir e aplicar modelos ML? | [Lição](1-Introduction/3-fairness/README.md) | Tomomi | -| 04 | Técnicas para machine learning | [Introdução](1-Introduction/README.md) | Quais técnicas os investigadores de ML usam para construir modelos ML? | [Lição](1-Introduction/4-techniques-of-ML/README.md) | Chris e Jen | -| 05 | Introdução à regressão | [Regressão](2-Regression/README.md) | Começar com Python e Scikit-learn para modelos de regressão | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Jen • Eric Wanjau | -| 06 | Preços da abóbora na América do Norte 🎃 | [Regressão](2-Regression/README.md) | Visualizar e limpar dados em preparação para ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Jen • Eric Wanjau | -| 07 | Preços da abóbora na América do Norte 🎃 | [Regressão](2-Regression/README.md) | Construir modelos de regressão linear e polinomial | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Jen e Dmitry • Eric Wanjau | -| 08 | Preços da abóbora na América do Norte 🎃 | [Regressão](2-Regression/README.md) | Construir um modelo de regressão logística | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Jen • Eric Wanjau | -| 09 | Uma Aplicação Web 🔌 | [Web App](3-Web-App/README.md) | Construir uma aplicação web para utilizar o seu modelo treinado | [Python](3-Web-App/1-Web-App/README.md) | Jen | -| 10 | Introdução à classificação | [Classificação](4-Classification/README.md) | Limpar, preparar e visualizar os seus dados; introdução à classificação | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Jen e Cassie • Eric Wanjau | -| 11 | Cozinhas asiáticas e indianas deliciosas 🍜 | [Classificação](4-Classification/README.md) | Introdução aos classificadores | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Jen e Cassie • Eric Wanjau | -| 12 | Cozinhas asiáticas e indianas deliciosas 🍜 | [Classificação](4-Classification/README.md) | Mais classificadores | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Jen e Cassie • Eric Wanjau | -| 13 | Cozinhas asiáticas e indianas deliciosas 🍜 | [Classificação](4-Classification/README.md) | Construir uma aplicação web recomendadora usando o seu modelo | [Python](4-Classification/4-Applied/README.md) | Jen | -| 14 | Introdução ao clustering | [Clustering](5-Clustering/README.md) | Limpar, preparar e visualizar os seus dados; introdução ao clustering | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Jen • Eric Wanjau | -| 15 | Explorando gostos musicais nigerianos 🎧 | [Clustering](5-Clustering/README.md) | Explorar o método de clustering K-Means | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Jen • Eric Wanjau | -| 16 | Introdução ao processamento de linguagem natural ☕️| [Processamento de linguagem natural](6-NLP/README.md) | Aprender o básico sobre PLN construindo um bot simples | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Stephen | -| 17 | Tarefas comuns de PLN ☕️ | [Processamento de linguagem natural](6-NLP/README.md) | Aprofundar o seu conhecimento sobre PLN compreendendo tarefas comuns quando se lida com estruturas de linguagem | [Python](6-NLP/2-Tasks/README.md) | Stephen | -| 18 | Tradução e análise de sentimento ♥️ | [Processamento de linguagem natural](6-NLP/README.md) | Tradução e análise de sentimento com Jane Austen | [Python](6-NLP/3-Translation-Sentiment/README.md) | Stephen | -| 19 | Hotéis românticos da Europa ♥️ | [Processamento de linguagem natural](6-NLP/README.md) | Análise de sentimento com críticas de hotéis 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Stephen | -| 20 | Hotéis românticos da Europa ♥️ | [Processamento de linguagem natural](6-NLP/README.md) | Análise de sentimento com críticas de hotéis 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Stephen | -| 21 | Introdução à previsão de séries temporais | [Séries temporais](7-TimeSeries/README.md) | Introdução à previsão de séries temporais | [Python](7-TimeSeries/1-Introduction/README.md) | Francesca | -| 22 | ⚡️ Uso mundial de energia ⚡️ - previsão de séries temporais com ARIMA | [Séries temporais](7-TimeSeries/README.md) | Previsão de séries temporais com ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Francesca | -| 23 | ⚡️ Uso mundial de energia ⚡️ - previsão de séries temporais com SVR | [Séries temporais](7-TimeSeries/README.md) | Previsão de séries temporais com Support Vector Regressor | [Python](7-TimeSeries/3-SVR/README.md) | Anirban | -| 24 | Introdução ao reinforcement learning | [Aprendizagem por reforço](8-Reinforcement/README.md) | Introdução ao reinforcement learning com Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Dmitry | -| 25 | Ajude o Peter a evitar o lobo! 🐺 | [Aprendizagem por reforço](8-Reinforcement/README.md) | Aprendizagem por reforço Gym | [Python](8-Reinforcement/2-Gym/README.md) | Dmitry | -| Epílogo | Cenários e aplicações reais de ML | [ML no Mundo Real](9-Real-World/README.md) | Aplicações reais interessantes e reveladoras do ML clássico | [Lição](9-Real-World/1-Applications/README.md) | Equipa | -| Epílogo | Debugging de modelos ML usando o dashboard RAI | [ML no Mundo Real](9-Real-World/README.md) | Debugging de modelos em Machine Learning usando componentes do dashboard Responsible AI | [Lição](9-Real-World/2-Debugging-ML-Models/README.md) | Ruth Yakubu | - -> [encontre todos os recursos adicionais para este curso na nossa coleção Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) - -## Acesso offline - -Pode executar esta documentação offline usando [Docsify](https://docsify.js.org/#/). Faça fork deste repositório, [instale Docsify](https://docsify.js.org/#/quickstart) na sua máquina local e depois, na pasta raiz deste repositório, digite `docsify serve`. O site será servido na porta 3000 no seu localhost: `localhost:3000`. - -## PDFs - -Encontre um pdf do currículo com ligações [aqui](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). - - -## 🎒 Outros Cursos - -A nossa equipa produz outros cursos! Confira: - - -### LangChain -[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) -[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) - ---- - -### Azure / Edge / MCP / Agents -[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) -[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) -[![MCP for Beginners](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst) -[![AI Agents for Beginners](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) - ---- - -### Série de IA Generativa -[![IA Generativa para Iniciantes](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) -[![IA Generativa (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) -[![IA Generativa (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) -[![IA Generativa (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) - ---- -  -### Aprendizagem Central -[![ML para Iniciantes](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) -[![Ciência de Dados para Iniciantes](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) -[![IA para Iniciantes](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) -[![Cibersegurança para Iniciantes](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) -[![Desenvolvimento Web para Iniciantes](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) -[![IoT para Iniciantes](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) -[![Desenvolvimento XR para Iniciantes](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) - ---- -  -### Série Copilot -[![Copilot para Programação Emparelhada com IA](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) -[![Copilot para C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) -[![Aventura Copilot](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) - - -## Obter Ajuda - -Se ficar bloqueado ou tiver alguma dúvida sobre a construção de aplicações de IA. Junte-se a outros aprendizes e desenvolvedores experientes em discussões sobre o MCP. É uma comunidade de apoio onde perguntas são bem-vindas e o conhecimento é partilhado livremente. - -[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) - -Se tiver feedback sobre produtos ou erros durante a construção, visite: - -[![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) - ---- - - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução automática [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que as traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autorizada. Para informações críticas, recomenda-se a tradução profissional realizada por um humano. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. - \ No newline at end of file diff --git a/translations/pt/SECURITY.md b/translations/pt/SECURITY.md deleted file mode 100644 index 4d997ba8d..000000000 --- a/translations/pt/SECURITY.md +++ /dev/null @@ -1,51 +0,0 @@ - -## Segurança - -A Microsoft leva a segurança dos seus produtos e serviços de software muito a sério, incluindo todos os repositórios de código fonte geridos através das nossas organizações no GitHub, que incluem [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin) e [as nossas organizações no GitHub](https://opensource.microsoft.com/). - -Se acredita ter encontrado uma vulnerabilidade de segurança em qualquer repositório pertencente à Microsoft que se enquadre na [definição de vulnerabilidade de segurança da Microsoft](https://docs.microsoft.com/previous-versions/tn-archive/cc751383(v=technet.10)?WT.mc_id=academic-77952-leestott), por favor reporte-a conforme descrito abaixo. - -## Reportar Problemas de Segurança - -**Por favor, não reporte vulnerabilidades de segurança através de problemas públicos no GitHub.** - -Em vez disso, reporte-as ao Microsoft Security Response Center (MSRC) em [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report). - -Se preferir enviar sem iniciar sessão, envie um email para [secure@microsoft.com](mailto:secure@microsoft.com). Se possível, encripte a sua mensagem com a nossa chave PGP; pode descarregá-la na [página da chave PGP do Microsoft Security Response Center](https://www.microsoft.com/en-us/msrc/pgp-key-msrc). - -Deverá receber uma resposta dentro de 24 horas. Se, por algum motivo, não receber, por favor envie um email de seguimento para garantir que recebemos a sua mensagem original. Informações adicionais podem ser encontradas em [microsoft.com/msrc](https://www.microsoft.com/msrc). - -Por favor, inclua as informações solicitadas abaixo (tanto quanto possível) para nos ajudar a compreender melhor a natureza e o alcance do possível problema: - - * Tipo de problema (ex.: buffer overflow, SQL injection, cross-site scripting, etc.) - * Caminhos completos dos ficheiros fonte relacionados com a manifestação do problema - * A localização do código fonte afetado (tag/branch/commit ou URL direto) - * Qualquer configuração especial necessária para reproduzir o problema - * Instruções passo-a-passo para reproduzir o problema - * Código de prova de conceito ou de exploração (se possível) - * Impacto do problema, incluindo como um atacante poderia explorar o problema - -Estas informações ajudarão a agilizar a triagem do seu relatório. - -Se estiver a reportar para um programa de recompensas por bugs, relatórios mais completos podem contribuir para uma recompensa maior. Por favor, visite a página do [Programa de Recompensas por Bugs da Microsoft](https://microsoft.com/msrc/bounty) para mais detalhes sobre os nossos programas ativos. - -## Idiomas Preferidos - -Preferimos que todas as comunicações sejam feitas em inglês. - -## Política - -A Microsoft segue o princípio de [Divulgação Coordenada de Vulnerabilidades](https://www.microsoft.com/en-us/msrc/cvd). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/SUPPORT.md b/translations/pt/SUPPORT.md deleted file mode 100644 index 94ffd6fec..000000000 --- a/translations/pt/SUPPORT.md +++ /dev/null @@ -1,29 +0,0 @@ - -# Suporte -## Como reportar problemas e obter ajuda - -Antes de reportar um problema, consulte o nosso [Guia de Resolução de Problemas](TROUBLESHOOTING.md) para soluções para problemas comuns relacionados com instalação, configuração e execução das lições. - -Este projeto utiliza GitHub Issues para acompanhar erros e pedidos de funcionalidades. Por favor, pesquise os problemas existentes antes de criar novos para evitar duplicados. Para novos problemas, reporte o seu erro ou pedido de funcionalidade como um novo Issue. - -Para obter ajuda e esclarecer dúvidas sobre o uso deste projeto, pode também: -- Consultar o [Guia de Resolução de Problemas](TROUBLESHOOTING.md) -- Visitar o nosso [canal de Discussões no Discord #ml-for-beginners](https://aka.ms/foundry/discord) -- Reportar um problema - -## Política de Suporte da Microsoft - -O suporte para este repositório está limitado aos recursos listados acima. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos pela precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/TROUBLESHOOTING.md b/translations/pt/TROUBLESHOOTING.md deleted file mode 100644 index 76daa95e8..000000000 --- a/translations/pt/TROUBLESHOOTING.md +++ /dev/null @@ -1,610 +0,0 @@ - -# Guia de Resolução de Problemas - -Este guia ajuda a resolver problemas comuns ao trabalhar com o currículo de Machine Learning para Iniciantes. Se não encontrar uma solução aqui, consulte as nossas [Discussões no Discord](https://aka.ms/foundry/discord) ou [abra um problema](https://github.com/microsoft/ML-For-Beginners/issues). - -## Índice - -- [Problemas de Instalação](../..) -- [Problemas com o Jupyter Notebook](../..) -- [Problemas com Pacotes Python](../..) -- [Problemas com o Ambiente R](../..) -- [Problemas com a Aplicação de Questionários](../..) -- [Problemas com Dados e Caminhos de Ficheiros](../..) -- [Mensagens de Erro Comuns](../..) -- [Problemas de Desempenho](../..) -- [Ambiente e Configuração](../..) - ---- - -## Problemas de Instalação - -### Instalação do Python - -**Problema**: `python: command not found` - -**Solução**: -1. Instale o Python 3.8 ou superior a partir de [python.org](https://www.python.org/downloads/) -2. Verifique a instalação: `python --version` ou `python3 --version` -3. No macOS/Linux, pode ser necessário usar `python3` em vez de `python` - -**Problema**: Múltiplas versões do Python a causar conflitos - -**Solução**: -```bash -# Use virtual environments to isolate projects -python -m venv ml-env - -# Activate virtual environment -# On Windows: -ml-env\Scripts\activate -# On macOS/Linux: -source ml-env/bin/activate -``` - -### Instalação do Jupyter - -**Problema**: `jupyter: command not found` - -**Solução**: -```bash -# Install Jupyter -pip install jupyter - -# Or with pip3 -pip3 install jupyter - -# Verify installation -jupyter --version -``` - -**Problema**: O Jupyter não abre no navegador - -**Solução**: -```bash -# Try specifying the browser -jupyter notebook --browser=chrome - -# Or copy the URL with token from terminal and paste in browser manually -# Look for: http://localhost:8888/?token=... -``` - -### Instalação do R - -**Problema**: Os pacotes R não instalam - -**Solução**: -```r -# Ensure you have the latest R version -# Install packages with dependencies -install.packages(c("tidyverse", "tidymodels", "caret"), dependencies = TRUE) - -# If compilation fails, try installing binary versions -install.packages("package-name", type = "binary") -``` - -**Problema**: IRkernel não está disponível no Jupyter - -**Solução**: -```r -# In R console -install.packages('IRkernel') -IRkernel::installspec(user = TRUE) -``` - ---- - -## Problemas com o Jupyter Notebook - -### Problemas com o Kernel - -**Problema**: O kernel continua a falhar ou reiniciar - -**Solução**: -1. Reinicie o kernel: `Kernel → Restart` -2. Limpe a saída e reinicie: `Kernel → Restart & Clear Output` -3. Verifique problemas de memória (consulte [Problemas de Desempenho](../..)) -4. Tente executar as células individualmente para identificar o código problemático - -**Problema**: Kernel Python errado selecionado - -**Solução**: -1. Verifique o kernel atual: `Kernel → Change Kernel` -2. Selecione a versão correta do Python -3. Se o kernel estiver ausente, crie-o: -```bash -python -m ipykernel install --user --name=ml-env -``` - -**Problema**: O kernel não inicia - -**Solução**: -```bash -# Reinstall ipykernel -pip uninstall ipykernel -pip install ipykernel - -# Register the kernel again -python -m ipykernel install --user -``` - -### Problemas com Células do Notebook - -**Problema**: As células estão a executar, mas não mostram saída - -**Solução**: -1. Verifique se a célula ainda está a executar (procure o indicador `[*]`) -2. Reinicie o kernel e execute todas as células: `Kernel → Restart & Run All` -3. Verifique o console do navegador para erros de JavaScript (F12) - -**Problema**: Não é possível executar células - sem resposta ao clicar em "Run" - -**Solução**: -1. Verifique se o servidor Jupyter ainda está a executar no terminal -2. Atualize a página do navegador -3. Feche e reabra o notebook -4. Reinicie o servidor Jupyter - ---- - -## Problemas com Pacotes Python - -### Erros de Importação - -**Problema**: `ModuleNotFoundError: No module named 'sklearn'` - -**Solução**: -```bash -pip install scikit-learn - -# Common ML packages for this course -pip install scikit-learn pandas numpy matplotlib seaborn -``` - -**Problema**: `ImportError: cannot import name 'X' from 'sklearn'` - -**Solução**: -```bash -# Update scikit-learn to latest version -pip install --upgrade scikit-learn - -# Check version -python -c "import sklearn; print(sklearn.__version__)" -``` - -### Conflitos de Versão - -**Problema**: Erros de incompatibilidade de versão de pacotes - -**Solução**: -```bash -# Create a new virtual environment -python -m venv fresh-env -source fresh-env/bin/activate # or fresh-env\Scripts\activate on Windows - -# Install packages fresh -pip install jupyter scikit-learn pandas numpy matplotlib seaborn - -# If specific version needed -pip install scikit-learn==1.3.0 -``` - -**Problema**: `pip install` falha com erros de permissão - -**Solução**: -```bash -# Install for current user only -pip install --user package-name - -# Or use virtual environment (recommended) -python -m venv venv -source venv/bin/activate -pip install package-name -``` - -### Problemas ao Carregar Dados - -**Problema**: `FileNotFoundError` ao carregar ficheiros CSV - -**Solução**: -```python -import os -# Check current working directory -print(os.getcwd()) - -# Use relative paths from notebook location -df = pd.read_csv('../../data/filename.csv') - -# Or use absolute paths -df = pd.read_csv('/full/path/to/data/filename.csv') -``` - ---- - -## Problemas com o Ambiente R - -### Instalação de Pacotes - -**Problema**: A instalação de pacotes falha com erros de compilação - -**Solução**: -```r -# Install binary version (Windows/macOS) -install.packages("package-name", type = "binary") - -# Update R to latest version if packages require it -# Check R version -R.version.string - -# Install system dependencies (Linux) -# For Ubuntu/Debian, in terminal: -# sudo apt-get install r-base-dev -``` - -**Problema**: `tidyverse` não instala - -**Solução**: -```r -# Install dependencies first -install.packages(c("rlang", "vctrs", "pillar")) - -# Then install tidyverse -install.packages("tidyverse") - -# Or install components individually -install.packages(c("dplyr", "ggplot2", "tidyr", "readr")) -``` - -### Problemas com RMarkdown - -**Problema**: O RMarkdown não renderiza - -**Solução**: -```r -# Install/update rmarkdown -install.packages("rmarkdown") - -# Install pandoc if needed -install.packages("pandoc") - -# For PDF output, install tinytex -install.packages("tinytex") -tinytex::install_tinytex() -``` - ---- - -## Problemas com a Aplicação de Questionários - -### Construção e Instalação - -**Problema**: `npm install` falha - -**Solução**: -```bash -# Clear npm cache -npm cache clean --force - -# Remove node_modules and package-lock.json -rm -rf node_modules package-lock.json - -# Reinstall -npm install - -# If still fails, try with legacy peer deps -npm install --legacy-peer-deps -``` - -**Problema**: Porta 8080 já está em uso - -**Solução**: -```bash -# Use different port -npm run serve -- --port 8081 - -# Or find and kill process using port 8080 -# On Linux/macOS: -lsof -ti:8080 | xargs kill -9 - -# On Windows: -netstat -ano | findstr :8080 -taskkill /PID /F -``` - -### Erros de Construção - -**Problema**: `npm run build` falha - -**Solução**: -```bash -# Check Node.js version (should be 14+) -node --version - -# Update Node.js if needed -# Then clean install -rm -rf node_modules package-lock.json -npm install -npm run build -``` - -**Problema**: Erros de linting impedem a construção - -**Solução**: -```bash -# Fix auto-fixable issues -npm run lint -- --fix - -# Or temporarily disable linting in build -# (not recommended for production) -``` - ---- - -## Problemas com Dados e Caminhos de Ficheiros - -### Problemas com Caminhos - -**Problema**: Ficheiros de dados não encontrados ao executar notebooks - -**Solução**: -1. **Execute sempre os notebooks a partir do diretório onde estão localizados** - ```bash - cd /path/to/lesson/folder - jupyter notebook - ``` - -2. **Verifique os caminhos relativos no código** - ```python - # Correct path from notebook location - df = pd.read_csv('../data/filename.csv') - - # Not from your terminal location - ``` - -3. **Use caminhos absolutos, se necessário** - ```python - import os - base_path = os.path.dirname(os.path.abspath(__file__)) - data_path = os.path.join(base_path, 'data', 'filename.csv') - ``` - -### Ficheiros de Dados em Falta - -**Problema**: Ficheiros de conjuntos de dados estão em falta - -**Solução**: -1. Verifique se os dados deveriam estar no repositório - a maioria dos conjuntos de dados está incluída -2. Algumas lições podem exigir o download de dados - consulte o README da lição -3. Certifique-se de que puxou as alterações mais recentes: - ```bash - git pull origin main - ``` - ---- - -## Mensagens de Erro Comuns - -### Erros de Memória - -**Erro**: `MemoryError` ou kernel falha ao processar dados - -**Solução**: -```python -# Load data in chunks -for chunk in pd.read_csv('large_file.csv', chunksize=10000): - process(chunk) - -# Or read only needed columns -df = pd.read_csv('file.csv', usecols=['col1', 'col2']) - -# Free memory when done -del large_dataframe -import gc -gc.collect() -``` - -### Avisos de Convergência - -**Aviso**: `ConvergenceWarning: Maximum number of iterations reached` - -**Solução**: -```python -from sklearn.linear_model import LogisticRegression - -# Increase max iterations -model = LogisticRegression(max_iter=1000) - -# Or scale your features first -from sklearn.preprocessing import StandardScaler -scaler = StandardScaler() -X_scaled = scaler.fit_transform(X) -``` - -### Problemas com Gráficos - -**Problema**: Gráficos não aparecem no Jupyter - -**Solução**: -```python -# Enable inline plotting -%matplotlib inline - -# Import pyplot -import matplotlib.pyplot as plt - -# Show plot explicitly -plt.plot(data) -plt.show() -``` - -**Problema**: Gráficos do Seaborn aparecem diferentes ou geram erros - -**Solução**: -```python -import warnings -warnings.filterwarnings('ignore', category=UserWarning) - -# Update to compatible version -# pip install --upgrade seaborn matplotlib -``` - -### Erros de Unicode/Codificação - -**Problema**: `UnicodeDecodeError` ao ler ficheiros - -**Solução**: -```python -# Specify encoding explicitly -df = pd.read_csv('file.csv', encoding='utf-8') - -# Or try different encoding -df = pd.read_csv('file.csv', encoding='latin-1') - -# For errors='ignore' to skip problematic characters -df = pd.read_csv('file.csv', encoding='utf-8', errors='ignore') -``` - ---- - -## Problemas de Desempenho - -### Execução Lenta de Notebooks - -**Problema**: Notebooks muito lentos para executar - -**Solução**: -1. **Reinicie o kernel para liberar memória**: `Kernel → Restart` -2. **Feche notebooks não utilizados** para liberar recursos -3. **Use amostras de dados menores para testes**: - ```python - # Work with subset during development - df_sample = df.sample(n=1000) - ``` -4. **Faça o perfil do seu código** para encontrar gargalos: - ```python - %time operation() # Time single operation - %timeit operation() # Time with multiple runs - ``` - -### Uso Elevado de Memória - -**Problema**: Sistema a ficar sem memória - -**Solução**: -```python -# Check memory usage -df.info(memory_usage='deep') - -# Optimize data types -df['column'] = df['column'].astype('int32') # Instead of int64 - -# Drop unnecessary columns -df = df[['col1', 'col2']] # Keep only needed columns - -# Process in batches -for batch in np.array_split(df, 10): - process(batch) -``` - ---- - -## Ambiente e Configuração - -### Problemas com Ambientes Virtuais - -**Problema**: Ambiente virtual não ativa - -**Solução**: -```bash -# Windows -python -m venv venv -venv\Scripts\activate.bat - -# macOS/Linux -python3 -m venv venv -source venv/bin/activate - -# Check if activated (should show venv name in prompt) -which python # Should point to venv python -``` - -**Problema**: Pacotes instalados, mas não encontrados no notebook - -**Solução**: -```bash -# Ensure notebook uses the correct kernel -# Install ipykernel in your venv -pip install ipykernel -python -m ipykernel install --user --name=ml-env --display-name="Python (ml-env)" - -# In Jupyter: Kernel → Change Kernel → Python (ml-env) -``` - -### Problemas com Git - -**Problema**: Não é possível puxar as alterações mais recentes - conflitos de merge - -**Solução**: -```bash -# Stash your changes -git stash - -# Pull latest -git pull origin main - -# Reapply your changes -git stash pop - -# If conflicts, resolve manually or: -git checkout --theirs path/to/file # Take remote version -git checkout --ours path/to/file # Keep your version -``` - -### Integração com o VS Code - -**Problema**: Notebooks Jupyter não abrem no VS Code - -**Solução**: -1. Instale a extensão Python no VS Code -2. Instale a extensão Jupyter no VS Code -3. Selecione o interpretador Python correto: `Ctrl+Shift+P` → "Python: Select Interpreter" -4. Reinicie o VS Code - ---- - -## Recursos Adicionais - -- **Discussões no Discord**: [Faça perguntas e partilhe soluções no canal #ml-for-beginners](https://aka.ms/foundry/discord) -- **Microsoft Learn**: [Módulos de ML para Iniciantes](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -- **Tutoriais em Vídeo**: [Playlist no YouTube](https://aka.ms/ml-beginners-videos) -- **Rastreador de Problemas**: [Reporte bugs](https://github.com/microsoft/ML-For-Beginners/issues) - ---- - -## Ainda com Problemas? - -Se tentou as soluções acima e ainda está a enfrentar problemas: - -1. **Pesquise problemas existentes**: [GitHub Issues](https://github.com/microsoft/ML-For-Beginners/issues) -2. **Verifique discussões no Discord**: [Discussões no Discord](https://aka.ms/foundry/discord) -3. **Abra um novo problema**: Inclua: - - O seu sistema operativo e versão - - Versão do Python/R - - Mensagem de erro (stack trace completo) - - Passos para reproduzir o problema - - O que já tentou - -Estamos aqui para ajudar! 🚀 - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original no seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se uma tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas resultantes do uso desta tradução. \ No newline at end of file diff --git a/translations/pt/docs/_sidebar.md b/translations/pt/docs/_sidebar.md deleted file mode 100644 index 75ce45aa5..000000000 --- a/translations/pt/docs/_sidebar.md +++ /dev/null @@ -1,57 +0,0 @@ - -- Introdução - - [Introdução ao Aprendizado Automático](../1-Introduction/1-intro-to-ML/README.md) - - [História do Aprendizado Automático](../1-Introduction/2-history-of-ML/README.md) - - [Aprendizado Automático e Justiça](../1-Introduction/3-fairness/README.md) - - [Técnicas de Aprendizado Automático](../1-Introduction/4-techniques-of-ML/README.md) - -- Regressão - - [Ferramentas Essenciais](../2-Regression/1-Tools/README.md) - - [Dados](../2-Regression/2-Data/README.md) - - [Regressão Linear](../2-Regression/3-Linear/README.md) - - [Regressão Logística](../2-Regression/4-Logistic/README.md) - -- Criar uma Aplicação Web - - [Aplicação Web](../3-Web-App/1-Web-App/README.md) - -- Classificação - - [Introdução à Classificação](../4-Classification/1-Introduction/README.md) - - [Classificadores 1](../4-Classification/2-Classifiers-1/README.md) - - [Classificadores 2](../4-Classification/3-Classifiers-2/README.md) - - [Aprendizado Automático Aplicado](../4-Classification/4-Applied/README.md) - -- Agrupamento - - [Visualizar os seus Dados](../5-Clustering/1-Visualize/README.md) - - [K-Means](../5-Clustering/2-K-Means/README.md) - -- Processamento de Linguagem Natural (NLP) - - [Introdução ao NLP](../6-NLP/1-Introduction-to-NLP/README.md) - - [Tarefas de NLP](../6-NLP/2-Tasks/README.md) - - [Tradução e Sentimento](../6-NLP/3-Translation-Sentiment/README.md) - - [Avaliações de Hotéis 1](../6-NLP/4-Hotel-Reviews-1/README.md) - - [Avaliações de Hotéis 2](../6-NLP/5-Hotel-Reviews-2/README.md) - -- Previsão de Séries Temporais - - [Introdução à Previsão de Séries Temporais](../7-TimeSeries/1-Introduction/README.md) - - [ARIMA](../7-TimeSeries/2-ARIMA/README.md) - - [SVR](../7-TimeSeries/3-SVR/README.md) - -- Aprendizado por Reforço - - [Q-Learning](../8-Reinforcement/1-QLearning/README.md) - - [Gym](../8-Reinforcement/2-Gym/README.md) - -- Aprendizado Automático no Mundo Real - - [Aplicações](../9-Real-World/1-Applications/README.md) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/for-teachers.md b/translations/pt/for-teachers.md deleted file mode 100644 index 7103b9b31..000000000 --- a/translations/pt/for-teachers.md +++ /dev/null @@ -1,37 +0,0 @@ - -## Para Educadores - -Gostaria de usar este currículo na sua sala de aula? Fique à vontade! - -Na verdade, pode utilizá-lo diretamente no GitHub, através do GitHub Classroom. - -Para isso, faça um fork deste repositório. Vai precisar criar um repositório para cada aula, então será necessário extrair cada pasta para um repositório separado. Dessa forma, [GitHub Classroom](https://classroom.github.com/classrooms) poderá identificar cada aula individualmente. - -Estas [instruções completas](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) irão ajudá-lo a configurar a sua sala de aula. - -## Utilizar o repositório como está - -Se preferir usar este repositório no formato atual, sem recorrer ao GitHub Classroom, isso também é possível. Apenas precisará comunicar aos seus alunos qual aula devem trabalhar em conjunto. - -Num formato online (Zoom, Teams ou outro), pode criar salas de grupo para os questionários e orientar os alunos para que estejam prontos para aprender. Depois, convide os alunos a realizar os questionários e submeter as respostas como 'issues' num momento específico. Pode fazer o mesmo com os trabalhos, caso deseje que os alunos colaborem de forma aberta. - -Se preferir um formato mais privado, peça aos seus alunos para fazerem fork do currículo, aula por aula, para os seus próprios repositórios GitHub como repositórios privados, e conceda-lhe acesso. Assim, poderão completar os questionários e trabalhos de forma privada e submetê-los através de issues no repositório da sua sala de aula. - -Existem várias formas de fazer isto funcionar num formato de sala de aula online. Por favor, informe-nos sobre o que funciona melhor para si! - -## Partilhe connosco a sua opinião! - -Queremos que este currículo funcione para si e para os seus alunos. Por favor, envie-nos o seu [feedback](https://forms.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR2humCsRZhxNuI79cm6n0hRUQzRVVU9VVlU5UlFLWTRLWlkyQUxORTg5WS4u). - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante ter em conta que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/quiz-app/README.md b/translations/pt/quiz-app/README.md deleted file mode 100644 index c0d33ebf7..000000000 --- a/translations/pt/quiz-app/README.md +++ /dev/null @@ -1,127 +0,0 @@ - -# Questionários - -Estes questionários são os questionários pré e pós-aula para o currículo de ML em https://aka.ms/ml-beginners - -## Configuração do projeto - -``` -npm install -``` - -### Compilar e recarregar automaticamente para desenvolvimento - -``` -npm run serve -``` - -### Compilar e minimizar para produção - -``` -npm run build -``` - -### Verificar e corrigir ficheiros - -``` -npm run lint -``` - -### Personalizar configuração - -Consulte [Referência de Configuração](https://cli.vuejs.org/config/). - -Créditos: Agradecimentos à versão original desta aplicação de questionários: https://github.com/arpan45/simple-quiz-vue - -## Implementação no Azure - -Aqui está um guia passo a passo para ajudar a começar: - -1. Faça um fork de um repositório GitHub -Certifique-se de que o código da sua aplicação web estático está no seu repositório GitHub. Faça um fork deste repositório. - -2. Crie uma Aplicação Web Estática no Azure -- Crie uma [conta Azure](http://azure.microsoft.com) -- Acesse o [portal Azure](https://portal.azure.com) -- Clique em “Criar um recurso” e procure por “Aplicação Web Estática”. -- Clique em “Criar”. - -3. Configure a Aplicação Web Estática -- Básico: - - Subscrição: Selecione a sua subscrição Azure. - - Grupo de Recursos: Crie um novo grupo de recursos ou utilize um existente. - - Nome: Forneça um nome para a sua aplicação web estática. - - Região: Escolha a região mais próxima dos seus utilizadores. - -- #### Detalhes de Implementação: - - Fonte: Selecione “GitHub”. - - Conta GitHub: Autorize o Azure a aceder à sua conta GitHub. - - Organização: Selecione a sua organização GitHub. - - Repositório: Escolha o repositório que contém a sua aplicação web estática. - - Branch: Selecione a branch da qual deseja implementar. - -- #### Detalhes de Construção: - - Predefinições de Construção: Escolha o framework com o qual a sua aplicação foi construída (por exemplo, React, Angular, Vue, etc.). - - Localização da Aplicação: Especifique a pasta que contém o código da sua aplicação (por exemplo, / se estiver na raiz). - - Localização da API: Caso tenha uma API, especifique a sua localização (opcional). - - Localização de Saída: Especifique a pasta onde o output da construção é gerado (por exemplo, build ou dist). - -4. Rever e Criar -Revise as suas configurações e clique em “Criar”. O Azure configurará os recursos necessários e criará um workflow de GitHub Actions no seu repositório. - -5. Workflow de GitHub Actions -O Azure criará automaticamente um ficheiro de workflow de GitHub Actions no seu repositório (.github/workflows/azure-static-web-apps-.yml). Este workflow irá gerir o processo de construção e implementação. - -6. Monitorizar a Implementação -Acesse o separador “Actions” no seu repositório GitHub. -Deverá ver um workflow em execução. Este workflow irá construir e implementar a sua aplicação web estática no Azure. -Assim que o workflow for concluído, a sua aplicação estará ativa no URL fornecido pelo Azure. - -### Exemplo de Ficheiro de Workflow - -Aqui está um exemplo de como o ficheiro de workflow de GitHub Actions pode parecer: -name: Azure Static Web Apps CI/CD -``` -on: - push: - branches: - - main - pull_request: - types: [opened, synchronize, reopened, closed] - branches: - - main - -jobs: - build_and_deploy_job: - runs-on: ubuntu-latest - name: Build and Deploy Job - steps: - - uses: actions/checkout@v2 - - name: Build And Deploy - id: builddeploy - uses: Azure/static-web-apps-deploy@v1 - with: - azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }} - repo_token: ${{ secrets.GITHUB_TOKEN }} - action: "upload" - app_location: "/quiz-app" # App source code path - api_location: ""API source code path optional - output_location: "dist" #Built app content directory - optional -``` - -### Recursos Adicionais -- [Documentação de Aplicações Web Estáticas no Azure](https://learn.microsoft.com/azure/static-web-apps/getting-started) -- [Documentação de GitHub Actions](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/sketchnotes/LICENSE.md b/translations/pt/sketchnotes/LICENSE.md deleted file mode 100644 index 2a26b668a..000000000 --- a/translations/pt/sketchnotes/LICENSE.md +++ /dev/null @@ -1,120 +0,0 @@ - -Direitos, então o banco de dados em que Você incluiu os conteúdos deve ser licenciado sob a mesma licença que esta Licença Pública; - - c. Você não pode oferecer ou impor quaisquer termos ou condições adicionais ou diferentes, ou aplicar Medidas Tecnológicas Eficazes ao banco de dados que restrinjam o exercício dos direitos concedidos sob esta Licença Pública. - -Seção 5 -- Isenção de Garantias e Limitação de Responsabilidade. - - a. Salvo conforme expressamente estabelecido nesta Licença Pública, na medida máxima permitida pela lei aplicável, o Licenciador oferece o Material Licenciado "como está" e "conforme disponível", e não faz representações ou garantias de qualquer tipo em relação ao Material Licenciado, seja expressa, implícita, estatutária ou de outra forma, incluindo, sem limitação, garantias de título, comerciabilidade, adequação a um propósito específico, não violação, ou ausência de defeitos latentes ou outros defeitos, precisão, ou a presença ou ausência de erros, sejam ou não detectáveis. Quando as isenções de garantias não forem permitidas integralmente, esta isenção pode não se aplicar a Você. - - b. Na medida máxima permitida pela lei aplicável, em nenhuma circunstância o Licenciador será responsável por qualquer teoria jurídica (incluindo, sem limitação, negligência) por quaisquer perdas, custos, despesas ou danos diretos, indiretos, especiais, punitivos, exemplares, incidentais, consequenciais ou outros decorrentes desta Licença Pública ou do uso do Material Licenciado, mesmo que o Licenciador tenha sido avisado da possibilidade de tais perdas, custos, despesas ou danos. Onde uma limitação de responsabilidade não for permitida integralmente, esta limitação pode não se aplicar a Você. - - c. A isenção de garantias e limitação de responsabilidade estabelecidas nesta Seção 5 devem ser interpretadas de forma a limitar o escopo da isenção e limitação ao máximo permitido pela lei aplicável. - -Seção 6 -- Termo e Rescisão. - - a. Este termo da Licença Pública começa quando Você aceita os Direitos Licenciados e continua enquanto os Direitos Autorais e Direitos Similares aplicáveis ao Material Licenciado permanecerem em vigor. No entanto, se Você não cumprir as condições desta Licença Pública, Seus direitos sob esta Licença Pública terminam automaticamente. - - b. Quando Seu direito de usar o Material Licenciado tiver terminado sob a Seção 6(a), ele será restabelecido: - - 1. automaticamente a partir da data em que a violação for corrigida, desde que seja dentro de 30 dias após Você ter tomado conhecimento da violação; ou - - 2. mediante notificação do Licenciador. - - Para evitar dúvidas, esta Seção 6(b) não afeta quaisquer direitos do Licenciador de buscar reparação por violações desta Licença Pública. - - c. Para evitar dúvidas, o Licenciador também pode oferecer o Material Licenciado sob termos ou condições separadas ou cessar a distribuição do Material Licenciado a qualquer momento; no entanto, fazer isso não encerra esta Licença Pública. - - d. As Seções 1, 5, 6, 7 e 8 sobrevivem à rescisão desta Licença Pública. - -Seção 7 -- Outras Condições. - - a. O Licenciador não será vinculado por quaisquer termos adicionais ou diferentes que Você oferecer. Qualquer tentativa de impor termos adicionais ou diferentes será considerada uma oferta de contrato separada que o Licenciador pode aceitar ou recusar a seu exclusivo critério. - - b. Se qualquer disposição desta Licença Pública for considerada inválida ou inexequível, isso não afetará a validade ou exequibilidade das disposições restantes desta Licença Pública. - - c. Nenhuma renúncia por parte do Licenciador de qualquer condição ou falha em cumprir qualquer condição desta Licença Pública será considerada uma renúncia de qualquer falha subsequente em cumprir a mesma condição ou qualquer outra condição. - -Seção 8 -- Interpretação. - - a. Para evitar dúvidas, esta Licença Pública não reduz, limita, restringe ou impõe condições ao uso do Material Licenciado que seja permitido sob exceções e limitações aos Direitos Autorais e Direitos Similares aplicáveis. - - b. Quando o Material Licenciado for uma base de dados ou parte de uma base de dados sujeita a Direitos de Base de Dados Sui Generis, esta Licença Pública será interpretada de forma a ser aplicável ao máximo permitido pela lei aplicável. - - c. Esta Licença Pública não deve ser interpretada como uma limitação ou renúncia de quaisquer direitos que não sejam Direitos Autorais e Direitos Similares aplicáveis ao Material Licenciado. - -Creative Commons Corporation não é parte desta Licença Pública e não oferece qualquer garantia em relação ao Material Licenciado. -Direitos, então a base de dados na qual Você possui Direitos de Base de Dados Sui Generis (mas não os seus conteúdos individuais) é Material Adaptado, - -incluindo para os propósitos da Secção 3(b); e -c. Você deve cumprir as condições da Secção 3(a) se Compartilhar toda ou uma parte substancial dos conteúdos da base de dados. - -Para evitar dúvidas, esta Secção 4 complementa e não substitui as suas obrigações sob esta Licença Pública onde os Direitos Licenciados incluem outros Direitos de Autor e Direitos Similares. - ---- - -Secção 5 -- Exclusão de Garantias e Limitação de Responsabilidade. - -a. SALVO SE O LICENCIADOR ASSUMIR SEPARADAMENTE, NA MEDIDA DO POSSÍVEL, O LICENCIADOR OFERECE O MATERIAL LICENCIADO TAL COMO ESTÁ E TAL COMO DISPONÍVEL, E NÃO FAZ REPRESENTAÇÕES OU GARANTIAS DE QUALQUER TIPO RELATIVAS AO MATERIAL LICENCIADO, SEJAM EXPRESSAS, IMPLÍCITAS, LEGAIS OU OUTRAS. ISTO INCLUI, SEM LIMITAÇÃO, GARANTIAS DE TITULARIDADE, COMERCIALIZAÇÃO, ADEQUAÇÃO A UM PROPÓSITO ESPECÍFICO, NÃO INFRAÇÃO, AUSÊNCIA DE DEFEITOS LATENTES OU OUTROS, PRECISÃO, OU A PRESENÇA OU AUSÊNCIA DE ERROS, SEJAM OU NÃO CONHECIDOS OU DETECTÁVEIS. ONDE EXCLUSÕES DE GARANTIAS NÃO SÃO PERMITIDAS TOTAL OU PARCIALMENTE, ESTA EXCLUSÃO PODE NÃO SE APLICAR A VOCÊ. - -b. NA MEDIDA DO POSSÍVEL, EM NENHUMA CIRCUNSTÂNCIA O LICENCIADOR SERÁ RESPONSÁVEL PERANTE VOCÊ SOB QUALQUER TEORIA LEGAL (INCLUINDO, SEM LIMITAÇÃO, NEGLIGÊNCIA) OU DE OUTRA FORMA POR QUAISQUER PERDAS DIRETAS, ESPECIAIS, INDIRETAS, INCIDENTAIS, CONSEQUENCIAIS, PUNITIVAS, EXEMPLARES OU OUTROS DANOS, CUSTOS, DESPESAS OU PREJUÍZOS DECORRENTES DESTA LICENÇA PÚBLICA OU DO USO DO MATERIAL LICENCIADO, MESMO QUE O LICENCIADOR TENHA SIDO INFORMADO DA POSSIBILIDADE DE TAIS PERDAS, CUSTOS, DESPESAS OU DANOS. ONDE UMA LIMITAÇÃO DE RESPONSABILIDADE NÃO É PERMITIDA TOTAL OU PARCIALMENTE, ESTA LIMITAÇÃO PODE NÃO SE APLICAR A VOCÊ. - -c. A exclusão de garantias e a limitação de responsabilidade acima devem ser interpretadas de forma que, na medida do possível, mais se aproximem de uma exclusão absoluta e renúncia de toda responsabilidade. - ---- - -Secção 6 -- Duração e Rescisão. - -a. Esta Licença Pública aplica-se durante o período dos Direitos de Autor e Direitos Similares licenciados aqui. No entanto, se Você não cumprir esta Licença Pública, os seus direitos sob esta Licença Pública terminam automaticamente. - -b. Quando o seu direito de usar o Material Licenciado tiver sido rescindido sob a Secção 6(a), ele será restabelecido: - -1. automaticamente na data em que a violação for corrigida, desde que seja corrigida dentro de 30 dias após a sua descoberta da violação; ou -2. mediante restabelecimento expresso pelo Licenciador. - -Para evitar dúvidas, esta Secção 6(b) não afeta qualquer direito que o Licenciador possa ter de buscar reparações pelas suas violações desta Licença Pública. - -c. Para evitar dúvidas, o Licenciador também pode oferecer o Material Licenciado sob termos ou condições separadas ou parar de distribuir o Material Licenciado a qualquer momento; no entanto, isso não terminará esta Licença Pública. - -d. As Secções 1, 5, 6, 7 e 8 sobrevivem à rescisão desta Licença Pública. - ---- - -Secção 7 -- Outros Termos e Condições. - -a. O Licenciador não será vinculado por quaisquer termos ou condições adicionais ou diferentes comunicados por Você, salvo se expressamente acordado. - -b. Quaisquer arranjos, entendimentos ou acordos relativos ao Material Licenciado não declarados aqui são separados e independentes dos termos e condições desta Licença Pública. - ---- - -Secção 8 -- Interpretação. - -a. Para evitar dúvidas, esta Licença Pública não reduz, limita, restringe ou impõe condições sobre qualquer uso do Material Licenciado que possa ser legalmente feito sem permissão sob esta Licença Pública. - -b. Na medida do possível, se qualquer disposição desta Licença Pública for considerada inexequível, ela será automaticamente reformada na medida mínima necessária para torná-la exequível. Se a disposição não puder ser reformada, ela será separada desta Licença Pública sem afetar a exequibilidade dos termos e condições restantes. - -c. Nenhum termo ou condição desta Licença Pública será renunciado e nenhuma falha em cumprir será consentida, salvo se expressamente acordado pelo Licenciador. - -d. Nada nesta Licença Pública constitui ou pode ser interpretado como uma limitação ou renúncia de quaisquer privilégios e imunidades que se aplicam ao Licenciador ou a Você, incluindo em relação aos processos legais de qualquer jurisdição ou autoridade. - ---- - -======================================================================= - -A Creative Commons não é parte das suas licenças públicas. Não obstante, a Creative Commons pode optar por aplicar uma das suas licenças públicas ao material que publica e, nesses casos, será considerada o “Licenciador”. O texto das licenças públicas da Creative Commons é dedicado ao domínio público sob a Dedicação ao Domínio Público CC0. Exceto para o propósito limitado de indicar que o material é compartilhado sob uma licença pública da Creative Commons ou conforme permitido pelas políticas da Creative Commons publicadas em creativecommons.org/policies, a Creative Commons não autoriza o uso da marca "Creative Commons" ou qualquer outra marca ou logótipo da Creative Commons sem o seu consentimento prévio por escrito, incluindo, sem limitação, em conexão com quaisquer modificações não autorizadas de qualquer uma das suas licenças públicas ou quaisquer outros arranjos, entendimentos ou acordos relativos ao uso do material licenciado. Para evitar dúvidas, este parágrafo não faz parte das licenças públicas. - -A Creative Commons pode ser contactada em creativecommons.org. - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file diff --git a/translations/pt/sketchnotes/README.md b/translations/pt/sketchnotes/README.md deleted file mode 100644 index 17dfafc57..000000000 --- a/translations/pt/sketchnotes/README.md +++ /dev/null @@ -1,21 +0,0 @@ - -Todas as sketchnotes do currículo podem ser descarregadas aqui. - -🖨 Para impressão em alta resolução, as versões TIFF estão disponíveis neste [repositório](https://github.com/girliemac/a-picture-is-worth-a-1000-words/tree/main/ml/tiff). - -🎨 Criado por: [Tomomi Imura](https://github.com/girliemac) (Twitter: [@girlie_mac](https://twitter.com/girlie_mac)) - -[![CC BY-SA 4.0](https://img.shields.io/badge/License-CC%20BY--SA%204.0-lightgrey.svg)](https://creativecommons.org/licenses/by-sa/4.0/) - ---- - -**Aviso Legal**: -Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes da utilização desta tradução. \ No newline at end of file