You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

4.3 KiB

Devoir : Scénarios en Science des Données

Dans ce premier devoir, nous vous demandons de réfléchir à un processus ou un problème réel dans différents domaines, et comment vous pourriez l'améliorer en utilisant le processus de la Science des Données. Pensez aux points suivants :

  1. Quelles données pouvez-vous collecter ?
  2. Comment les collecteriez-vous ?
  3. Comment stockeriez-vous ces données ? Quelle serait leur taille approximative ?
  4. Quels enseignements pourriez-vous tirer de ces données ? Quelles décisions pourrions-nous prendre sur la base de ces données ?

Essayez de réfléchir à 3 problèmes/processus différents et décrivez chacun des points ci-dessus pour chaque domaine.

Voici quelques domaines et problèmes pour vous aider à démarrer votre réflexion :

  1. Comment pouvez-vous utiliser les données pour améliorer le processus éducatif des enfants à l'école ?
  2. Comment pouvez-vous utiliser les données pour contrôler la vaccination pendant une pandémie ?
  3. Comment pouvez-vous utiliser les données pour vous assurer d'être productif au travail ?

Instructions

Remplissez le tableau suivant (remplacez les domaines suggérés par vos propres idées si nécessaire) :

Domaine Problème Quelles données collecter Comment stocker les données Quels enseignements/décisions pouvons-nous tirer
Éducation À l'université, nous avons généralement une faible participation aux cours, et nous avons l'hypothèse que les étudiants qui assistent aux cours réussissent mieux en moyenne aux examens. Nous voulons stimuler la participation et tester cette hypothèse. Nous pouvons suivre la participation grâce à des photos prises par la caméra de sécurité en classe, ou en suivant les adresses bluetooth/wifi des téléphones mobiles des étudiants en classe. Les données des examens sont déjà disponibles dans la base de données de l'université. Si nous utilisons les images des caméras de sécurité, nous devons stocker quelques (5-10) photographies pendant le cours (données non structurées), puis utiliser l'IA pour identifier les visages des étudiants (convertir les données en format structuré). Nous pouvons calculer les données de participation moyenne pour chaque étudiant et voir s'il existe une corrélation avec les notes des examens. Nous parlerons davantage de corrélation dans la section probabilité et statistiques. Pour stimuler la participation des étudiants, nous pouvons publier le classement hebdomadaire de participation sur le portail de l'école et tirer au sort des prix parmi ceux ayant la meilleure participation.
Vaccination
Productivité

Nous fournissons une réponse comme exemple, afin que vous puissiez avoir une idée de ce qui est attendu dans ce devoir.

Grille d'évaluation

Exemplaire Adéquat À améliorer
La personne a su identifier des sources de données raisonnables, des moyens de stockage des données et des décisions/enseignements possibles pour tous les domaines Certains aspects de la solution ne sont pas détaillés, le stockage des données n'est pas discuté, au moins 2 domaines sont décrits Seules certaines parties de la solution sont décrites, un seul domaine est considéré.

Avertissement :
Ce document a été traduit à l'aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de recourir à une traduction professionnelle réalisée par un humain. Nous déclinons toute responsabilité en cas de malentendus ou d'interprétations erronées résultant de l'utilisation de cette traduction.