|
|
7 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 8 months ago | |
| 2-Working-With-Data | 8 months ago | |
| 3-Data-Visualization | 8 months ago | |
| 4-Data-Science-Lifecycle | 8 months ago | |
| 5-Data-Science-In-Cloud | 8 months ago | |
| 6-Data-Science-In-Wild | 8 months ago | |
| docs | 8 months ago | |
| examples | 7 months ago | |
| quiz-app | 8 months ago | |
| sketchnotes | 8 months ago | |
| AGENTS.md | 7 months ago | |
| CODE_OF_CONDUCT.md | 8 months ago | |
| CONTRIBUTING.md | 8 months ago | |
| README.md | 7 months ago | |
| SECURITY.md | 8 months ago | |
| SUPPORT.md | 8 months ago | |
| for-teachers.md | 8 months ago | |
README.md
数据科学入门 - 课程大纲
微软的 Azure 云倡导者团队很高兴为大家提供一个为期 10 周、共 20 节课的课程,内容涵盖数据科学的方方面面。每节课都包括课前和课后测验、完成课程的书面指导、解决方案以及作业。我们的项目式教学法让您在实践中学习,这是一种经过验证的技能学习方式。
衷心感谢我们的作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特别感谢 🙏 我们的 微软学生大使 作者、审阅者和内容贡献者, 特别是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi。
![]() |
|---|
| 数据科学入门 - 速写图由 @nitya 绘制 |
🌐 多语言支持
通过 GitHub Action 支持(自动更新且始终保持最新)
法语 | 西班牙语 | 德语 | 俄语 | 阿拉伯语 | 波斯语 | 乌尔都语 | 中文(简体) | 中文(繁体,澳门) | 中文(繁体,香港) | 中文(繁体,台湾) | 日语 | 韩语 | 印地语 | 孟加拉语 | 马拉地语 | 尼泊尔语 | 旁遮普语(古木基文) | 葡萄牙语(葡萄牙) | 葡萄牙语(巴西) | 意大利语 | 波兰语 | 土耳其语 | 希腊语 | 泰语 | 瑞典语 | 丹麦语 | 挪威语 | 芬兰语 | 荷兰语 | 希伯来语 | 越南语 | 印尼语 | 马来语 | 他加禄语(菲律宾语) | 斯瓦希里语 | 匈牙利语 | 捷克语 | 斯洛伐克语 | 罗马尼亚语 | 保加利亚语 | 塞尔维亚语(西里尔文) | 克罗地亚语 | 斯洛文尼亚语 | 乌克兰语 | 缅甸语(缅甸)
如果您希望支持其他翻译语言,请查看 这里
加入我们的社区
我们正在进行一个 Discord 的 AI 学习系列活动,了解更多并加入我们 AI 学习系列,活动时间为 2025 年 9 月 18 日至 30 日。您将学习使用 GitHub Copilot 进行数据科学的技巧。
您是学生吗?
从以下资源开始:
- 学生中心页面 在此页面,您可以找到入门资源、学生礼包,甚至获取免费认证券的方法。建议您将此页面加入书签并定期查看,因为我们至少每月更新一次内容。
- 微软学习学生大使 加入全球学生大使社区,这可能是您进入微软的途径。
入门指南
完全初学者:刚接触数据科学?从我们的 初学者示例 开始!这些简单且注释详尽的示例将帮助您在深入学习完整课程之前理解基础知识。
学生:如果您想独立使用此课程,请分叉整个仓库并自行完成练习,从课前测验开始。然后阅读课程内容并完成其余活动。尝试通过理解课程内容来创建项目,而不是直接复制解决方案代码;不过,解决方案代码可以在每个项目课程的 /solutions 文件夹中找到。另一个建议是与朋友组成学习小组,共同学习内容。进一步学习推荐使用 微软学习。
团队介绍
Gif 制作: Mohit Jaisal
🎥 点击上方图片观看关于项目及其创建者的视频!
教学法
在设计此课程时,我们选择了两个教学原则:确保课程以项目为基础,并包含频繁的测验。通过本系列课程,学生将学习数据科学的基本原理,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的实际应用案例等。
此外,课前的低压力测验可以让学生专注于学习主题,而课后的测验则有助于进一步巩固知识。此课程设计灵活有趣,可以完整学习,也可以部分学习。项目从简单开始,到 10 周课程结束时逐渐变得复杂。
每节课包括:
- 可选速写图
- 可选补充视频
- 课前热身测验
- 书面课程内容
- 对于基于项目的课程,提供逐步指导以完成项目
- 知识检查
- 挑战任务
- 补充阅读材料
- 作业
- 课后测验
关于测验的说明:所有测验都包含在 Quiz-App 文件夹中,共有 40 个测验,每个测验包含三个问题。它们可以从课程中链接访问,也可以在本地运行或部署到 Azure;请按照
quiz-app文件夹中的说明操作。这些测验正在逐步进行本地化。
🎓 面向初学者的示例
数据科学新手? 我们创建了一个特别的 示例目录,其中包含简单且注释详尽的代码,帮助您快速入门:
- 🌟 Hello World - 您的第一个数据科学程序
- 📂 加载数据 - 学习如何读取和探索数据集
- 📊 简单分析 - 计算统计数据并发现模式
- 📈 基础可视化 - 创建图表和图形
- 🔬 真实项目 - 从头到尾的完整工作流程
每个示例都包含详细的注释,解释每一步,非常适合绝对初学者!
👉 从示例开始 👈
课程
![]() |
|---|
| 数据科学入门:路线图 - 速写笔记由 @nitya 绘制 |
| 课程编号 | 主题 | 课程分组 | 学习目标 | 链接课程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定义数据科学 | 简介 | 学习数据科学的基本概念及其与人工智能、机器学习和大数据的关系。 | 课程 视频 | Dmitry |
| 02 | 数据科学伦理 | 简介 | 数据伦理的概念、挑战和框架。 | 课程 | Nitya |
| 03 | 定义数据 | 简介 | 数据的分类及其常见来源。 | 课程 | Jasmine |
| 04 | 统计与概率简介 | 简介 | 使用概率和统计的数学技术来理解数据。 | 课程 视频 | Dmitry |
| 05 | 使用关系数据 | 数据处理 | 介绍关系数据以及使用结构化查询语言(SQL,发音为“see-quell”)探索和分析关系数据的基础知识。 | 课程 | Christopher |
| 06 | 使用 NoSQL 数据 | 数据处理 | 介绍非关系数据的各种类型以及探索和分析文档数据库的基础知识。 | 课程 | Jasmine |
| 07 | 使用 Python | 数据处理 | 使用 Python 进行数据探索的基础知识,包括 Pandas 等库。建议具备 Python 编程的基础知识。 | 课程 视频 | Dmitry |
| 08 | 数据准备 | 数据处理 | 数据清理和转换技术,处理缺失、不准确或不完整数据的挑战。 | 课程 | Jasmine |
| 09 | 可视化数量 | 数据可视化 | 学习如何使用 Matplotlib 可视化鸟类数据 🦆 | 课程 | Jen |
| 10 | 可视化数据分布 | 数据可视化 | 可视化区间内的观察和趋势。 | 课程 | Jen |
| 11 | 可视化比例 | 数据可视化 | 可视化离散和分组百分比。 | 课程 | Jen |
| 12 | 可视化关系 | 数据可视化 | 可视化数据集及其变量之间的连接和相关性。 | 课程 | Jen |
| 13 | 有意义的可视化 | 数据可视化 | 提供技术和指导,使您的可视化在解决问题和洞察方面更有价值。 | 课程 | Jen |
| 14 | 数据科学生命周期简介 | 生命周期 | 数据科学生命周期的介绍及其第一步:数据的获取和提取。 | 课程 | Jasmine |
| 15 | 数据分析 | 生命周期 | 数据科学生命周期的这一阶段专注于数据分析技术。 | 课程 | Jasmine |
| 16 | 数据沟通 | 生命周期 | 数据科学生命周期的这一阶段专注于以易于决策者理解的方式呈现数据洞察。 | 课程 | Jalen |
| 17 | 云端数据科学 | 云数据 | 这一系列课程介绍了云端数据科学及其优势。 | 课程 | Tiffany 和 Maud |
| 18 | 云端数据科学 | 云数据 | 使用低代码工具训练模型。 | 课程 | Tiffany 和 Maud |
| 19 | 云端数据科学 | 云数据 | 使用 Azure Machine Learning Studio 部署模型。 | 课程 | Tiffany 和 Maud |
| 20 | 数据科学实战 | 实战 | 数据科学驱动的真实世界项目。 | 课程 | Nitya |
GitHub Codespaces
按照以下步骤在 Codespace 中打开此示例:
- 点击代码下拉菜单,选择“Open with Codespaces”选项。
- 在面板底部选择 + New codespace。 更多信息,请查看 GitHub 文档。
VSCode Remote - Containers
按照以下步骤使用本地机器和 VSCode 的 VS Code Remote - Containers 扩展在容器中打开此仓库:
- 如果这是您第一次使用开发容器,请确保您的系统满足前置要求(例如安装了 Docker),请参考 入门文档。
要使用此仓库,您可以选择在隔离的 Docker 卷中打开仓库:
注意:在底层,这将使用 Remote-Containers: Clone Repository in Container Volume... 命令将源代码克隆到 Docker 卷中,而不是本地文件系统。卷 是持久化容器数据的首选机制。
或者打开本地克隆或下载的仓库版本:
- 将此仓库克隆到您的本地文件系统。
- 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
- 选择此文件夹的克隆副本,等待容器启动,然后尝试操作。
离线访问
您可以使用 Docsify 离线运行此文档。Fork 此仓库,在本地机器上 安装 Docsify,然后在此仓库的根文件夹中输入 docsify serve。网站将在本地的 3000 端口上运行:localhost:3000。
注意,笔记本文件不会通过 Docsify 渲染,因此当您需要运行笔记本时,请在 VS Code 中单独运行 Python 内核。
其他课程
我们的团队还制作了其他课程!查看以下内容:
- Edge AI for Beginners
- AI Agents for Beginners
- Generative AI for Beginners
- Generative AI for Beginners .NET
- Generative AI with JavaScript
- Generative AI with Java
- AI for Beginners
- Data Science for Beginners
- Bash for Beginners
- ML for Beginners
- Cybersecurity for Beginners
- Web Dev for Beginners
- IoT for Beginners
- Machine Learning for Beginners
- XR Development for Beginners
- Mastering GitHub Copilot for AI Paired Programming
- XR Development for Beginners
- Mastering GitHub Copilot for C#/.NET Developers
- Choose Your Own Copilot Adventure
获取帮助
如果您遇到困难或对构建 AI 应用有任何疑问,请加入:
免责声明:
本文档使用AI翻译服务 Co-op Translator 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于关键信息,建议使用专业人工翻译。我们对因使用此翻译而产生的任何误解或误读不承担责任。



