# Tarefa: Cenários de Ciência de Dados Nesta primeira tarefa, pedimos que você pense em algum processo ou problema da vida real em diferentes domínios de problemas e como você pode melhorá-lo usando o processo de Ciência de Dados. Pense no seguinte: 1. Quais dados você pode coletar? 1. Como você os coletaria? 1. Como você armazenaria os dados? Qual seria o tamanho provável dos dados? 1. Quais insights você poderia obter desses dados? Quais decisões poderíamos tomar com base nos dados? Tente pensar em 3 problemas/processos diferentes e descreva cada um dos pontos acima para cada domínio de problema. Aqui estão alguns domínios de problemas e questões que podem ajudá-lo a começar a pensar: 1. Como você pode usar dados para melhorar o processo educacional de crianças nas escolas? 1. Como você pode usar dados para controlar a vacinação durante a pandemia? 1. Como você pode usar dados para garantir que está sendo produtivo no trabalho? ## Instruções Preencha a tabela a seguir (substitua os domínios de problemas sugeridos pelos seus próprios, se necessário): | Domínio do Problema | Problema | Quais dados coletar | Como armazenar os dados | Quais insights/decisões podemos tomar | |----------------------|----------|---------------------|-------------------------|---------------------------------------| | Educação | Na universidade, normalmente temos baixa frequência às aulas, e temos a hipótese de que estudantes que frequentam as aulas, em média, têm melhor desempenho nos exames. Queremos estimular a frequência e testar a hipótese. | Podemos rastrear a frequência por meio de fotos tiradas pela câmera de segurança na sala de aula ou rastreando os endereços bluetooth/wifi dos celulares dos estudantes na sala. Os dados dos exames já estão disponíveis no banco de dados da universidade. | Caso rastreemos imagens da câmera de segurança, precisamos armazenar algumas (5-10) fotografias durante a aula (dados não estruturados) e, em seguida, usar IA para identificar os rostos dos estudantes (converter os dados para formato estruturado). | Podemos calcular a frequência média de cada estudante e verificar se há alguma correlação com as notas dos exames. Falaremos mais sobre correlação na seção de [probabilidade e estatística](../../04-stats-and-probability/README.md). Para estimular a frequência dos estudantes, podemos publicar a classificação semanal de frequência no portal da escola e sortear prêmios entre os que tiverem maior frequência. | | Vacinação | | | | | | Produtividade | | | | | > *Fornecemos apenas uma resposta como exemplo, para que você tenha uma ideia do que é esperado nesta tarefa.* ## Rubrica Exemplar | Adequado | Precisa de Melhorias --- | --- | -- | Foi capaz de identificar fontes de dados razoáveis, formas de armazenar os dados e possíveis decisões/insights para todos os domínios de problemas | Alguns aspectos da solução não estão detalhados, o armazenamento de dados não é discutido, pelo menos 2 domínios de problemas são descritos | Apenas partes da solução de dados são descritas, apenas um domínio de problema é considerado. --- **Aviso Legal**: Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automatizadas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações equivocadas decorrentes do uso desta tradução.