# Задача: Сценарии за анализ на данни В тази първа задача ви молим да помислите за някакъв реален процес или проблем в различни области и как можете да го подобрите, използвайки процеса на анализ на данни. Помислете за следното: 1. Какви данни можете да съберете? 1. Как бихте ги събрали? 1. Как бихте съхранили данните? Колко големи вероятно ще бъдат данните? 1. Какви прозрения бихте могли да получите от тези данни? Какви решения бихме могли да вземем въз основа на данните? Опитайте се да помислите за 3 различни проблема/процеса и опишете всяка от точките по-горе за всяка област. Ето някои области и проблеми, които могат да ви помогнат да започнете: 1. Как можете да използвате данни за подобряване на образователния процес за деца в училищата? 1. Как можете да използвате данни за контрол на ваксинацията по време на пандемия? 1. Как можете да използвате данни, за да сте сигурни, че сте продуктивни на работа? ## Инструкции Попълнете следната таблица (заменете предложените области с ваши собствени, ако е необходимо): | Област | Проблем | Какви данни да съберем | Как да съхраним данните | Какви прозрения/решения можем да направим | |--------|---------|------------------------|-------------------------|-------------------------------------------| | Образование | В университета обикновено има ниска посещаемост на лекции, и имаме хипотезата, че студентите, които посещават лекции, обикновено се справят по-добре на изпити. Искаме да стимулираме посещаемостта и да тестваме хипотезата. | Можем да проследим посещаемостта чрез снимки, направени от охранителната камера в класната стая, или чрез проследяване на bluetooth/wifi адресите на мобилните телефони на студентите в клас. Данните за изпитите вече са налични в университетската база данни. | Ако проследяваме изображения от охранителната камера - трябва да съхраним няколко (5-10) снимки по време на лекцията (неструктурирани данни), след което да използваме AI за идентифициране на лицата на студентите (конвертиране на данните в структурирана форма). | Можем да изчислим средните данни за посещаемост за всеки студент и да видим дали има някаква корелация с оценките от изпитите. Ще говорим повече за корелация в секцията [вероятности и статистика](../../04-stats-and-probability/README.md). За да стимулираме посещаемостта, можем да публикуваме седмичния рейтинг за посещаемост на училищния портал и да теглим награди сред тези с най-висока посещаемост. | | Ваксинация | | | | | | Продуктивност | | | | | > *Предоставяме само един отговор като пример, за да получите представа какво се очаква в тази задача.* ## Оценяване Отлично | Задоволително | Нуждае се от подобрение --- | --- | -- | Успява да идентифицира разумни източници на данни, начини за съхранение на данни и възможни решения/прозрения за всички области | Някои аспекти на решението не са подробно описани, съхранението на данни не е обсъдено, поне 2 области са описани | Описани са само части от решението за данни, разгледана е само една област. --- **Отказ от отговорност**: Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за недоразумения или погрешни интерпретации, произтичащи от използването на този превод.