18 KiB
Datenwissenschaft für Anfänger - Ein Lehrplan
Azure Cloud Advocates bei Microsoft freuen sich, einen 10-wöchigen, 20-teiligen Lehrplan rund um Datenwissenschaft anzubieten. Jede Lektion enthält Vor- und Nachtests, schriftliche Anleitungen zur Durchführung der Lektion, eine Lösung und eine Aufgabe. Unsere projektbasierte Pädagogik ermöglicht es Ihnen, durch praktisches Arbeiten zu lernen – eine bewährte Methode, um neue Fähigkeiten nachhaltig zu erlernen.
Ein herzliches Dankeschön an unsere Autoren: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 Besonderer Dank 🙏 an unsere Microsoft Student Ambassadors Autoren, Gutachter und Inhaltsbeiträger, insbesondere Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar, Vidushi Gupta, Jasleen Sondhi
![]() |
---|
Datenwissenschaft für Anfänger - Sketchnote von @nitya |
Ankündigung - Neuer Lehrplan zu Generativer KI veröffentlicht!
Wir haben gerade einen 12-teiligen Lehrplan zur Generativen KI veröffentlicht. Lernen Sie Themen wie:
- Prompting und Prompt-Engineering
- Text- und Bild-App-Generierung
- Suchanwendungen
Wie gewohnt gibt es Lektionen, Aufgaben, Wissensüberprüfungen und Herausforderungen.
Schauen Sie es sich an:
Sind Sie ein Student?
Starten Sie mit den folgenden Ressourcen:
- Student Hub Seite Auf dieser Seite finden Sie Ressourcen für Anfänger, Student Packs und sogar Möglichkeiten, einen kostenlosen Zertifizierungsgutschein zu erhalten. Diese Seite sollten Sie sich als Lesezeichen speichern und regelmäßig besuchen, da wir den Inhalt mindestens monatlich aktualisieren.
- Microsoft Learn Student Ambassadors Treten Sie einer globalen Gemeinschaft von Studentenbotschaftern bei – dies könnte Ihr Einstieg bei Microsoft sein.
Erste Schritte
Lehrer: Wir haben einige Vorschläge hinzugefügt, wie Sie diesen Lehrplan nutzen können. Wir freuen uns über Ihr Feedback in unserem Diskussionsforum!
Studenten: Um diesen Lehrplan eigenständig zu nutzen, forken Sie das gesamte Repository und bearbeiten Sie die Übungen selbstständig, beginnend mit einem Quiz vor der Vorlesung. Lesen Sie dann die Vorlesung und führen Sie die restlichen Aktivitäten durch. Versuchen Sie, die Projekte zu erstellen, indem Sie die Lektionen verstehen, anstatt den Lösungscode zu kopieren; dieser ist jedoch in den /solutions-Ordnern jeder projektorientierten Lektion verfügbar. Eine weitere Idee wäre, eine Lerngruppe mit Freunden zu bilden und den Inhalt gemeinsam durchzugehen. Für weiterführende Studien empfehlen wir Microsoft Learn.
Lernen Sie das Team kennen
Gif von Mohit Jaisal
🎥 Klicken Sie auf das Bild oben, um ein Video über das Projekt und die Personen dahinter anzusehen!
Pädagogik
Wir haben zwei pädagogische Grundsätze bei der Erstellung dieses Lehrplans gewählt: sicherzustellen, dass er projektbasiert ist, und häufige Quizfragen einzubauen. Am Ende dieser Serie werden die Studenten grundlegende Prinzipien der Datenwissenschaft gelernt haben, einschließlich ethischer Konzepte, Datenaufbereitung, verschiedener Arbeitsweisen mit Daten, Datenvisualisierung, Datenanalyse, realer Anwendungsfälle der Datenwissenschaft und mehr.
Darüber hinaus setzt ein niedrigschwelliges Quiz vor einer Klasse die Absicht des Studenten, ein Thema zu lernen, während ein zweites Quiz nach der Klasse die weitere Beibehaltung sicherstellt. Dieser Lehrplan wurde so gestaltet, dass er flexibel und unterhaltsam ist und ganz oder teilweise absolviert werden kann. Die Projekte beginnen klein und werden im Laufe des 10-wöchigen Zyklus zunehmend komplexer.
Finden Sie unseren Verhaltenskodex, Beitragsrichtlinien, Übersetzungsrichtlinien. Wir freuen uns über Ihr konstruktives Feedback!
Jede Lektion enthält:
- Optionale Sketchnote
- Optionales ergänzendes Video
- Warm-up-Quiz vor der Lektion
- Schriftliche Lektion
- Für projektbasierte Lektionen: Schritt-für-Schritt-Anleitungen zum Erstellen des Projekts
- Wissensüberprüfungen
- Eine Herausforderung
- Ergänzende Lektüre
- Aufgabe
- Quiz nach der Lektion
Eine Anmerkung zu den Quizfragen: Alle Quizfragen befinden sich im Quiz-App-Ordner, insgesamt 40 Quizfragen mit jeweils drei Fragen. Sie sind innerhalb der Lektionen verlinkt, aber die Quiz-App kann lokal ausgeführt oder in Azure bereitgestellt werden; folgen Sie den Anweisungen im
quiz-app
-Ordner. Sie werden schrittweise lokalisiert.
Lektionen
![]() |
---|
Datenwissenschaft für Anfänger: Roadmap - Sketchnote von @nitya |
Lektion Nummer | Thema | Lektionseinheit | Lernziele | Verlinkte Lektion | Autor |
---|---|---|---|---|---|
01 | Definition von Datenwissenschaft | Einführung | Lernen Sie die grundlegenden Konzepte der Datenwissenschaft und wie sie mit künstlicher Intelligenz, maschinellem Lernen und Big Data zusammenhängt. | Lektion Video | Dmitry |
02 | Ethik in der Datenwissenschaft | Einführung | Konzepte, Herausforderungen und Rahmenbedingungen der Datenethik. | Lektion | Nitya |
03 | Definition von Daten | Einführung | Wie Daten klassifiziert werden und ihre häufigsten Quellen. | Lektion | Jasmine |
04 | Einführung in Statistik & Wahrscheinlichkeit | Einführung | Die mathematischen Techniken der Wahrscheinlichkeit und Statistik, um Daten zu verstehen. | Lektion Video | Dmitry |
05 | Arbeiten mit relationalen Daten | Arbeiten mit Daten | Einführung in relationale Daten und die Grundlagen der Erkundung und Analyse relationaler Daten mit der Structured Query Language, auch bekannt als SQL (ausgesprochen „see-quell“). | Lektion | Christopher |
06 | Arbeiten mit NoSQL-Daten | Arbeiten mit Daten | Einführung in nicht-relationale Daten, ihre verschiedenen Typen und die Grundlagen der Erkundung und Analyse von Dokumentdatenbanken. | Lektion | Jasmine |
07 | Arbeiten mit Python | Arbeiten mit Daten | Grundlagen der Nutzung von Python zur Datenexploration mit Bibliotheken wie Pandas. Grundlegendes Verständnis der Python-Programmierung wird empfohlen. | Lektion Video | Dmitry |
08 | Datenvorbereitung | Arbeiten mit Daten | Themen zu Techniken der Datenbereinigung und -transformation, um Herausforderungen wie fehlende, ungenaue oder unvollständige Daten zu bewältigen. | Lektion | Jasmine |
09 | Mengen visualisieren | Datenvisualisierung | Lernen Sie, wie Sie mit Matplotlib Vogeldaten 🦆 visualisieren können. | Lektion | Jen |
10 | Verteilungen von Daten visualisieren | Datenvisualisierung | Beobachtungen und Trends innerhalb eines Intervalls visualisieren. | Lektion | Jen |
11 | Proportionen visualisieren | Datenvisualisierung | Diskrete und gruppierte Prozentsätze visualisieren. | Lektion | Jen |
12 | Beziehungen visualisieren | Datenvisualisierung | Verbindungen und Korrelationen zwischen Datensätzen und ihren Variablen visualisieren. | Lektion | Jen |
13 | Sinnvolle Visualisierungen | Datenvisualisierung | Techniken und Anleitungen, um Ihre Visualisierungen wertvoll für effektive Problemlösungen und Erkenntnisse zu machen. | Lektion | Jen |
14 | Einführung in den Lebenszyklus der Datenwissenschaft | Lebenszyklus | Einführung in den Lebenszyklus der Datenwissenschaft und den ersten Schritt der Datenbeschaffung und -extraktion. | Lektion | Jasmine |
15 | Analysieren | Lebenszyklus | Diese Phase des Lebenszyklus der Datenwissenschaft konzentriert sich auf Techniken zur Datenanalyse. | Lektion | Jasmine |
16 | Kommunikation | Lebenszyklus | Diese Phase des Lebenszyklus der Datenwissenschaft konzentriert sich darauf, die Erkenntnisse aus den Daten so zu präsentieren, dass Entscheidungsträger sie leichter verstehen können. | Lektion | Jalen |
17 | Datenwissenschaft in der Cloud | Cloud-Daten | Diese Serie von Lektionen führt in die Datenwissenschaft in der Cloud und ihre Vorteile ein. | Lektion | Tiffany und Maud |
18 | Datenwissenschaft in der Cloud | Cloud-Daten | Modelle mit Low-Code-Tools trainieren. | Lektion | Tiffany und Maud |
19 | Datenwissenschaft in der Cloud | Cloud-Daten | Modelle mit Azure Machine Learning Studio bereitstellen. | Lektion | Tiffany und Maud |
20 | Datenwissenschaft in der Praxis | In der Praxis | Datenwissenschaftsprojekte in der realen Welt. | Lektion | Nitya |
GitHub Codespaces
Folgen Sie diesen Schritten, um dieses Beispiel in einem Codespace zu öffnen:
- Klicken Sie auf das Code-Dropdown-Menü und wählen Sie die Option Mit Codespaces öffnen.
- Wählen Sie + Neuer Codespace unten im Fenster. Weitere Informationen finden Sie in der GitHub-Dokumentation.
VSCode Remote - Containers
Folgen Sie diesen Schritten, um dieses Repository in einem Container mit Ihrer lokalen Maschine und VSCode mithilfe der VS Code Remote - Containers-Erweiterung zu öffnen:
- Wenn Sie zum ersten Mal einen Entwicklungscontainer verwenden, stellen Sie bitte sicher, dass Ihr System die Voraussetzungen erfüllt (z. B. Docker installiert ist), wie in der Einführungsdokumentation beschrieben.
Um dieses Repository zu verwenden, können Sie entweder das Repository in einem isolierten Docker-Volume öffnen:
Hinweis: Im Hintergrund wird der Remote-Containers-Befehl Repository in Container-Volume klonen... verwendet, um den Quellcode in einem Docker-Volume anstelle des lokalen Dateisystems zu klonen. Volumes sind das bevorzugte Mechanismus zur Persistierung von Containerdaten.
Oder öffnen Sie eine lokal geklonte oder heruntergeladene Version des Repositorys:
- Klonen Sie dieses Repository auf Ihr lokales Dateisystem.
- Drücken Sie F1 und wählen Sie den Befehl Remote-Containers: Ordner im Container öffnen....
- Wählen Sie die geklonte Kopie dieses Ordners aus, warten Sie, bis der Container gestartet ist, und probieren Sie es aus.
Offline-Zugriff
Sie können diese Dokumentation offline mit Docsify ausführen. Forken Sie dieses Repository, installieren Sie Docsify auf Ihrem lokalen Rechner, und geben Sie dann im Stammordner dieses Repositorys docsify serve
ein. Die Website wird auf Port 3000 auf Ihrem localhost bereitgestellt: localhost:3000
.
Hinweis: Notebooks werden nicht über Docsify gerendert. Wenn Sie ein Notebook ausführen müssen, tun Sie dies separat in VS Code mit einem Python-Kernel.
Hilfe gesucht!
Wenn Sie das gesamte Curriculum oder Teile davon übersetzen möchten, folgen Sie bitte unserem Übersetzungsleitfaden.
Weitere Curricula
Unser Team erstellt weitere Curricula! Schauen Sie sich an:
- Generative KI für Anfänger
- Generative KI für Anfänger .NET
- Generative KI mit JavaScript
- Generative KI mit Java
- KI für Anfänger
- Datenwissenschaft für Anfänger
- ML für Anfänger
- Cybersicherheit für Anfänger
- Webentwicklung für Anfänger
- IoT für Anfänger
- XR-Entwicklung für Anfänger
- GitHub Copilot für Pair-Programming meistern
- GitHub Copilot für C#/.NET-Entwickler meistern
- Wählen Sie Ihr eigenes Copilot-Abenteuer
Haftungsausschluss:
Dieses Dokument wurde mit dem KI-Übersetzungsdienst Co-op Translator übersetzt. Obwohl wir uns um Genauigkeit bemühen, weisen wir darauf hin, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als maßgebliche Quelle betrachtet werden. Für kritische Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die sich aus der Nutzung dieser Übersetzung ergeben.