# Tarefa: Cenários de Ciência de Dados Nesta primeira tarefa, pedimos que pense em algum processo ou problema da vida real em diferentes domínios de problemas, e como pode melhorá-lo utilizando o processo de Ciência de Dados. Pense no seguinte: 1. Que dados pode recolher? 1. Como os recolheria? 1. Como armazenaria os dados? Qual seria o provável volume dos dados? 1. Que insights poderia obter a partir desses dados? Que decisões poderíamos tomar com base nos dados? Tente pensar em 3 problemas/processos diferentes e descreva cada um dos pontos acima para cada domínio de problema. Aqui estão alguns domínios de problemas e questões que podem ajudá-lo a começar a pensar: 1. Como pode usar dados para melhorar o processo educativo das crianças nas escolas? 1. Como pode usar dados para controlar a vacinação durante a pandemia? 1. Como pode usar dados para garantir que está a ser produtivo no trabalho? ## Instruções Preencha a tabela seguinte (substitua os domínios de problemas sugeridos pelos seus próprios, se necessário): | Domínio do Problema | Problema | Que dados recolher | Como armazenar os dados | Que insights/decisões podemos tomar | |----------------------|----------|--------------------|--------------------------|-------------------------------------| | Educação | Na universidade, temos tipicamente baixa frequência às aulas, e temos a hipótese de que os estudantes que assistem às aulas, em média, têm melhor desempenho nos exames. Queremos estimular a frequência e testar a hipótese. | Podemos monitorizar a frequência através de fotografias tiradas pela câmara de segurança na sala de aula, ou rastreando os endereços bluetooth/wifi dos telemóveis dos estudantes na sala. Os dados dos exames já estão disponíveis na base de dados da universidade. | Caso monitorizemos imagens da câmara de segurança - precisamos armazenar algumas (5-10) fotografias durante a aula (dados não estruturados), e depois usar IA para identificar os rostos dos estudantes (converter os dados para formato estruturado). | Podemos calcular a frequência média de cada estudante e verificar se há alguma correlação com as notas dos exames. Falaremos mais sobre correlação na secção de [probabilidade e estatística](../../04-stats-and-probability/README.md). Para estimular a frequência dos estudantes, podemos publicar a classificação semanal de frequência no portal da escola e sortear prémios entre os que tiverem maior frequência. | | Vacinação | | | | | | Produtividade | | | | | > *Fornecemos apenas uma resposta como exemplo, para que possa ter uma ideia do que é esperado nesta tarefa.* ## Rubrica Exemplar | Adequado | Precisa de Melhorias --- | --- | --- | Foi capaz de identificar fontes de dados razoáveis, formas de armazenar os dados e possíveis decisões/insights para todos os domínios de problemas | Alguns aspetos da solução não estão detalhados, o armazenamento de dados não é discutido, pelo menos 2 domínios de problemas são descritos | Apenas partes da solução de dados são descritas, apenas um domínio de problema é considerado. **Aviso Legal**: Este documento foi traduzido utilizando o serviço de tradução por IA [Co-op Translator](https://github.com/Azure/co-op-translator). Embora nos esforcemos para garantir a precisão, é importante notar que traduções automáticas podem conter erros ou imprecisões. O documento original na sua língua nativa deve ser considerado a fonte autoritária. Para informações críticas, recomenda-se a tradução profissional realizada por humanos. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.