# Задание: Сценарии использования Data Science В этом первом задании мы просим вас подумать о каком-либо реальном процессе или проблеме в различных областях, и о том, как вы можете улучшить их с помощью процесса Data Science. Подумайте о следующем: 1. Какие данные вы можете собрать? 1. Как вы будете их собирать? 1. Как вы будете хранить данные? Каков вероятный объем данных? 1. Какие выводы вы сможете сделать из этих данных? Какие решения можно будет принять на основе данных? Попробуйте рассмотреть 3 разные проблемы/процесса и опишите каждый из вышеуказанных пунктов для каждой области. Вот несколько примеров областей и проблем, которые могут помочь вам начать размышления: 1. Как можно использовать данные для улучшения образовательного процесса для детей в школах? 1. Как можно использовать данные для контроля вакцинации во время пандемии? 1. Как можно использовать данные, чтобы убедиться, что вы продуктивны на работе? ## Инструкции Заполните следующую таблицу (при необходимости замените предложенные области на свои собственные): | Область | Проблема | Какие данные собирать | Как хранить данные | Какие выводы/решения можно сделать | |---------|----------|------------------------|--------------------|------------------------------------| | Образование | В университете обычно низкая посещаемость лекций, и у нас есть гипотеза, что студенты, которые посещают лекции, в среднем лучше сдают экзамены. Мы хотим стимулировать посещаемость и проверить гипотезу. | Мы можем отслеживать посещаемость с помощью фотографий, сделанных камерой наблюдения в аудитории, или отслеживать bluetooth/wifi-адреса мобильных телефонов студентов в классе. Данные об экзаменах уже доступны в базе данных университета. | Если мы отслеживаем изображения с камер наблюдения, нам нужно хранить несколько (5-10) фотографий во время лекции (неструктурированные данные), а затем использовать ИИ для распознавания лиц студентов (преобразование данных в структурированную форму). | Мы можем вычислить средние данные о посещаемости для каждого студента и посмотреть, есть ли корреляция с оценками за экзамены. Мы подробнее поговорим о корреляции в разделе [вероятности и статистики](../../04-stats-and-probability/README.md). Чтобы стимулировать посещаемость студентов, мы можем публиковать еженедельный рейтинг посещаемости на портале университета и разыгрывать призы среди тех, у кого самая высокая посещаемость. | | Вакцинация | | | | | | Продуктивность | | | | | > *Мы предоставляем только один пример ответа, чтобы вы могли понять, что ожидается в этом задании.* ## Критерии оценки Превосходно | Удовлетворительно | Требует улучшений --- | --- | -- | Удалось определить разумные источники данных, способы их хранения и возможные выводы/решения для всех областей | Некоторые аспекты решения не детализированы, хранение данных не обсуждается, описано как минимум 2 области | Описаны только части решения, рассмотрена только одна область. --- **Отказ от ответственности**: Этот документ был переведен с использованием сервиса автоматического перевода [Co-op Translator](https://github.com/Azure/co-op-translator). Хотя мы стремимся к точности, пожалуйста, имейте в виду, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникшие в результате использования данного перевода.