20 KiB
Science des Données pour Débutants - Un Programme
Azure Cloud Advocates chez Microsoft sont ravis de proposer un programme de 10 semaines et 20 leçons entièrement dédié à la science des données. Chaque leçon comprend des quiz avant et après la leçon, des instructions écrites pour compléter la leçon, une solution et un devoir. Notre pédagogie basée sur les projets vous permet d'apprendre tout en construisant, une méthode éprouvée pour ancrer de nouvelles compétences.
Un grand merci à nos auteurs : Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Remerciements particuliers 🙏 à nos Microsoft Student Ambassadors auteurs, relecteurs et contributeurs de contenu, notamment Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
Science des Données pour Débutants - Sketchnote par @nitya |
🌐 Support Multilingue
Supporté via GitHub Action (Automatisé et Toujours à Jour)
Français | Espagnol | Allemand | Russe | Arabe | Persan (Farsi) | Ourdou | Chinois (Simplifié) | Chinois (Traditionnel, Macao) | Chinois (Traditionnel, Hong Kong) | Chinois (Traditionnel, Taïwan) | Japonais | Coréen | Hindi | Bengali | Marathi | Népalais | Punjabi (Gurmukhi) | Portugais (Portugal) | Portugais (Brésil) | Italien | Polonais | Turc | Grec | Thaï | Suédois | Danois | Norvégien | Finnois | Néerlandais | Hébreu | Vietnamien | Indonésien | Malais | Tagalog (Filipino) | Swahili | Hongrois | Tchèque | Slovaque | Roumain | Bulgare | Serbe (Cyrillique) | Croate | Slovène | Ukrainien | Birman (Myanmar)
Si vous souhaitez ajouter des langues supplémentaires, les langues supportées sont listées ici
Rejoignez Notre Communauté
Êtes-vous étudiant ?
Commencez avec les ressources suivantes :
- Page Hub Étudiant Sur cette page, vous trouverez des ressources pour débutants, des packs étudiants et même des moyens d'obtenir un bon pour une certification gratuite. C'est une page à mettre en favori et à consulter régulièrement, car nous changeons le contenu au moins une fois par mois.
- Microsoft Learn Student Ambassadors Rejoignez une communauté mondiale d'ambassadeurs étudiants, cela pourrait être votre porte d'entrée chez Microsoft.
Démarrage
Enseignants : nous avons inclus quelques suggestions sur la façon d'utiliser ce programme. Nous serions ravis de recevoir vos retours dans notre forum de discussion !
Étudiants : pour utiliser ce programme par vous-même, forkez le dépôt entier et complétez les exercices par vous-même, en commençant par un quiz pré-lecture. Ensuite, lisez le cours et complétez le reste des activités. Essayez de créer les projets en comprenant les leçons plutôt qu'en copiant le code de solution ; cependant, ce code est disponible dans les dossiers /solutions de chaque leçon orientée projet. Une autre idée serait de former un groupe d'étude avec des amis et de parcourir le contenu ensemble. Pour aller plus loin, nous recommandons Microsoft Learn.
Rencontrez l'Équipe
Gif par Mohit Jaisal
🎥 Cliquez sur l'image ci-dessus pour une vidéo sur le projet et les personnes qui l'ont créé !
Pédagogie
Nous avons choisi deux principes pédagogiques lors de la création de ce programme : s'assurer qu'il est basé sur des projets et qu'il inclut des quiz fréquents. À la fin de cette série, les étudiants auront appris les principes de base de la science des données, y compris les concepts éthiques, la préparation des données, différentes façons de travailler avec les données, la visualisation des données, l'analyse des données, des cas d'utilisation réels de la science des données, et plus encore.
En outre, un quiz à faible enjeu avant un cours fixe l'intention de l'étudiant d'apprendre un sujet, tandis qu'un second quiz après le cours garantit une meilleure rétention. Ce programme a été conçu pour être flexible et amusant et peut être suivi en totalité ou en partie. Les projets commencent petits et deviennent de plus en plus complexes à la fin du cycle de 10 semaines.
Retrouvez notre Code de Conduite, nos directives pour Contribuer et pour la Traduction. Nous apprécions vos retours constructifs !
Chaque leçon comprend :
- Sketchnote optionnel
- Vidéo complémentaire optionnelle
- Quiz d'échauffement avant la leçon
- Leçon écrite
- Pour les leçons basées sur des projets, guides étape par étape pour construire le projet
- Vérifications des connaissances
- Un défi
- Lecture complémentaire
- Devoir
- Quiz après la leçon
Une note sur les quiz : Tous les quiz sont contenus dans le dossier Quiz-App, pour un total de 40 quiz de trois questions chacun. Ils sont liés dans les leçons, mais l'application de quiz peut être exécutée localement ou déployée sur Azure ; suivez les instructions dans le dossier
quiz-app
. Ils sont progressivement localisés.
Leçons
![]() |
---|
Data Science pour les débutants : Plan - Sketchnote par @nitya |
Numéro de leçon | Sujet | Regroupement de leçons | Objectifs d'apprentissage | Leçon liée | Auteur |
---|---|---|---|---|---|
01 | Définir la science des données | Introduction | Apprenez les concepts de base de la science des données et comment elle est liée à l'intelligence artificielle, au machine learning et aux big data. | leçon vidéo | Dmitry |
02 | Éthique de la science des données | Introduction | Concepts, défis et cadres de l'éthique des données. | leçon | Nitya |
03 | Définir les données | Introduction | Comment les données sont classifiées et leurs sources courantes. | leçon | Jasmine |
04 | Introduction aux statistiques et probabilités | Introduction | Les techniques mathématiques de probabilité et de statistiques pour comprendre les données. | leçon vidéo | Dmitry |
05 | Travailler avec des données relationnelles | Travailler avec les données | Introduction aux données relationnelles et aux bases de l'exploration et de l'analyse des données relationnelles avec le langage SQL, également connu sous le nom de "see-quell". | leçon | Christopher |
06 | Travailler avec des données NoSQL | Travailler avec les données | Introduction aux données non relationnelles, leurs différents types et les bases de l'exploration et de l'analyse des bases de données documentaires. | leçon | Jasmine |
07 | Travailler avec Python | Travailler avec les données | Bases de l'utilisation de Python pour l'exploration des données avec des bibliothèques comme Pandas. Une compréhension fondamentale de la programmation Python est recommandée. | leçon vidéo | Dmitry |
08 | Préparation des données | Travailler avec les données | Techniques de nettoyage et de transformation des données pour gérer les défis liés aux données manquantes, inexactes ou incomplètes. | leçon | Jasmine |
09 | Visualiser des quantités | Visualisation des données | Apprenez à utiliser Matplotlib pour visualiser des données d'oiseaux 🦆 | leçon | Jen |
10 | Visualiser des distributions de données | Visualisation des données | Visualiser des observations et des tendances dans un intervalle. | leçon | Jen |
11 | Visualiser des proportions | Visualisation des données | Visualiser des pourcentages discrets et groupés. | leçon | Jen |
12 | Visualiser des relations | Visualisation des données | Visualiser des connexions et des corrélations entre des ensembles de données et leurs variables. | leçon | Jen |
13 | Visualisations significatives | Visualisation des données | Techniques et conseils pour rendre vos visualisations utiles pour résoudre des problèmes efficacement et obtenir des insights. | leçon | Jen |
14 | Introduction au cycle de vie de la science des données | Cycle de vie | Introduction au cycle de vie de la science des données et à sa première étape : l'acquisition et l'extraction des données. | leçon | Jasmine |
15 | Analyser | Cycle de vie | Cette phase du cycle de vie de la science des données se concentre sur les techniques d'analyse des données. | leçon | Jasmine |
16 | Communication | Cycle de vie | Cette phase du cycle de vie de la science des données se concentre sur la présentation des insights issus des données de manière compréhensible pour les décideurs. | leçon | Jalen |
17 | Science des données dans le cloud | Données dans le cloud | Cette série de leçons introduit la science des données dans le cloud et ses avantages. | leçon | Tiffany et Maud |
18 | Science des données dans le cloud | Données dans le cloud | Entraîner des modèles en utilisant des outils Low Code. | leçon | Tiffany et Maud |
19 | Science des données dans le cloud | Données dans le cloud | Déployer des modèles avec Azure Machine Learning Studio. | leçon | Tiffany et Maud |
20 | Science des données dans la nature | Dans la nature | Projets basés sur la science des données dans le monde réel. | leçon | Nitya |
GitHub Codespaces
Suivez ces étapes pour ouvrir cet exemple dans un Codespace :
- Cliquez sur le menu déroulant Code et sélectionnez l'option Ouvrir avec Codespaces.
- Sélectionnez + Nouveau codespace en bas du volet. Pour plus d'informations, consultez la documentation GitHub.
VSCode Remote - Containers
Suivez ces étapes pour ouvrir ce dépôt dans un conteneur en utilisant votre machine locale et VSCode avec l'extension VS Code Remote - Containers :
- Si c'est la première fois que vous utilisez un conteneur de développement, assurez-vous que votre système répond aux prérequis (par exemple, avoir Docker installé) dans la documentation de démarrage.
Pour utiliser ce dépôt, vous pouvez soit ouvrir le dépôt dans un volume Docker isolé :
Note : En coulisses, cela utilisera la commande Remote-Containers : Clone Repository in Container Volume... pour cloner le code source dans un volume Docker au lieu du système de fichiers local. Les volumes sont le mécanisme préféré pour persister les données des conteneurs.
Ou ouvrir une version localement clonée ou téléchargée du dépôt :
- Clonez ce dépôt sur votre système de fichiers local.
- Appuyez sur F1 et sélectionnez la commande Remote-Containers: Open Folder in Container....
- Sélectionnez la copie clonée de ce dossier, attendez que le conteneur démarre, et essayez les fonctionnalités.
Accès hors ligne
Vous pouvez exécuter cette documentation hors ligne en utilisant Docsify. Forkez ce dépôt, installez Docsify sur votre machine locale, puis dans le dossier racine de ce dépôt, tapez docsify serve
. Le site web sera servi sur le port 3000 de votre localhost : localhost:3000
.
Notez que les notebooks ne seront pas rendus via Docsify, donc lorsque vous devez exécuter un notebook, faites-le séparément dans VS Code en utilisant un kernel Python.
Autres programmes
Notre équipe produit d'autres programmes ! Découvrez :
- Generative AI pour les débutants
- Generative AI pour les débutants .NET
- Generative AI avec JavaScript
- Generative AI avec Java
- AI pour les débutants
- Science des données pour les débutants
- ML pour les débutants
- Cybersécurité pour les débutants
- Développement web pour les débutants
- IoT pour les débutants
- Développement XR pour les débutants
- Maîtriser GitHub Copilot pour la programmation en binôme
- Maîtriser GitHub Copilot pour les développeurs C#/.NET
- Choisissez votre propre aventure Copilot
Avertissement :
Ce document a été traduit à l'aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d'assurer l'exactitude, veuillez noter que les traductions automatisées peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d'origine doit être considéré comme la source faisant autorité. Pour des informations critiques, il est recommandé de recourir à une traduction professionnelle réalisée par un humain. Nous ne sommes pas responsables des malentendus ou des interprétations erronées résultant de l'utilisation de cette traduction.