|
|
3 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 3 months ago | |
| 2-Working-With-Data | 3 months ago | |
| 3-Data-Visualization | 3 months ago | |
| 4-Data-Science-Lifecycle | 3 months ago | |
| 5-Data-Science-In-Cloud | 3 months ago | |
| 6-Data-Science-In-Wild | 3 months ago | |
| docs | 3 months ago | |
| examples | 3 months ago | |
| quiz-app | 3 months ago | |
| sketchnotes | 3 months ago | |
| .co-op-translator.json | 3 months ago | |
| AGENTS.md | 3 months ago | |
| CODE_OF_CONDUCT.md | 3 months ago | |
| CONTRIBUTING.md | 3 months ago | |
| INSTALLATION.md | 3 months ago | |
| README.md | 3 months ago | |
| SECURITY.md | 3 months ago | |
| SUPPORT.md | 3 months ago | |
| TROUBLESHOOTING.md | 3 months ago | |
| USAGE.md | 3 months ago | |
| for-teachers.md | 3 months ago | |
README.md
面向初学者的数据科学课程
微软的 Azure 云倡导者很高兴提供一个为期 10 周、包含 20 节课的完整数据科学课程。每节课都包括课前和课后测验、完成课程的书面指导、解决方案以及作业。我们基于项目的教学法让你在构建项目的同时学习,这是新技能“扎根”的有效方式。
衷心感谢我们的作者: Jasmine Greenaway,Dmitry Soshnikov,Nitya Narasimhan,Jalen McGee,Jen Looper,Maud Levy,Tiffany Souterre,Christopher Harrison。
🙏 特别感谢我们的 Microsoft 学生大使 作者、审阅者和内容贡献者, 尤其是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 面向初学者的数据科学 - 由 @nitya 绘制的思维导图 |
🌐 多语言支持
通过 GitHub Action 支持(自动且始终保持最新)
阿拉伯语 | 孟加拉语 | 保加利亚语 | 缅甸语 (Myanmar) | 中文(简体) | 中文(繁体,香港) | 中文(繁体,澳门) | 中文(繁体,台湾) | 克罗地亚语 | 捷克语 | 丹麦语 | 荷兰语 | 爱沙尼亚语 | 芬兰语 | 法语 | 德语 | 希腊语 | 希伯来语 | 印地语 | 匈牙利语 | 印度尼西亚语 | 意大利语 | 日语 | 坎纳达语 | 韩语 | 立陶宛语 | 马来语 | 马拉雅拉姆语 | 马拉地语 | 尼泊尔语 | 尼日利亚皮钦语 | 挪威语 | 波斯语 (法尔西语) | 波兰语 | 葡萄牙语(巴西) | 葡萄牙语 (葡萄牙) | 旁遮普语 (Gurmukhi) | 罗马尼亚语 | 俄语 | 塞尔维亚语 (西里尔字母) | 斯洛伐克语 | 斯洛文尼亚语 | 西班牙语 | 斯瓦希里语 | 瑞典语 | 塔加洛语 (菲律宾语) | 泰米尔语 | 泰卢固语 | 泰语 | 土耳其语 | 乌克兰语 | 乌尔都语 | 越南语
偏好本地克隆?
该仓库包含 50 多种语言的翻译,显著增加了下载大小。若想克隆时不包含翻译,请使用稀疏检出:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'这样可以让你更快下载,同时获得完成课程所需的一切内容。
如果你希望支持更多翻译语言,支持列表见 这里
加入我们的社区
我们正在进行 Discord 上的“与 AI 学习”系列,详情及加入请访问 Learn with AI Series,时间为 2025 年 9 月 18 日至 30 日。你将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。
你是学生吗?
请从以下资源开始:
- 学生中心页面 在此页面,你将找到初学者资源、学生包,甚至还有获取免费证书优惠券的方法。这是你值得收藏并定期查看的一页,因为我们至少每月更换内容。
- Microsoft Learn 学生大使 加入学生大使全球社区,这可能是你进入微软的途径。
入门指南
📚 文档
👨🎓 适合学生
完全初学者:对数据科学新手?从我们的初学者友好示例开始吧!这些简单且注释丰富的示例将帮助你掌握基础知识,然后再深入完整课程。 学生:想独立使用此课程,请 fork 整个仓库并独立完成练习,从课前测验开始。然后阅读讲义并完成后续活动。尝试通过理解课程内容完成项目,而不是直接复制解决方案代码;不过,这些代码在各项目导向课程的 /solutions 文件夹中可用。另一种方法是和朋友组成学习小组,一起学习内容。想进一步学习,我们推荐 Microsoft Learn。
快速开始:
- 查看 安装指南 安装环境
- 阅读 使用指南 学习如何使用课程
- 从第一课开始,按顺序学习
- 加入我们的 Discord 社区 寻求支持
👩🏫 适合教师
团队介绍
动图作者 Mohit Jaisal
🎥 点击上方图片观看关于项目及其创建者的视频!
教学法
我们在构建课程时选择了两个教学原则:确保课程基于项目,并包含频繁的测验。在本系列课程结束时,学生将学会数据科学的基本原理,包括伦理概念、数据准备、不同的数据处理方法、数据可视化、数据分析、数据科学的实际应用案例等。
此外,课前的低压力测验帮助学生树立学习主题的意图,课后的测验确保知识的进一步巩固。该课程设计灵活且有趣,可以全部学习也可以部分学习。项目从小型开始,逐渐在10周周期结束时变得更加复杂。
每节课包括:
- 可选的草图笔记
- 可选的补充视频
- 课前热身测验
- 书面课程
- 基于项目的课程,有逐步项目构建指南
- 知识检查
- 挑战
- 补充阅读
- 作业
- 课后测验
关于测验的说明:所有测验均包含在 Quiz-App 文件夹中,共有40个测验,每个测验3个问题。课程中提供了链接,测验应用也可以本地运行或部署到 Azure;请参照
quiz-app文件夹中的说明。测验内容正在逐步本地化。
🎓 初学者友好示例
刚接触数据科学? 我们创建了一个特别的示例目录,提供简单且注释详细的代码,助你入门:
- 🌟 Hello World - 你的第一个数据科学程序
- 📂 加载数据 - 学习读取与探索数据集
- 📊 简单分析 - 计算统计量、发现模式
- 📈 基础可视化 - 创建图表与图形
- 🔬 实际项目 - 从头到尾完成完整工作流
每个示例均包含详细注释,逐步解释每个步骤,非常适合初学者!
👉 从示例开始 👈
课程列表
![]() |
|---|
| 数据科学初学者路线图 - 草图笔记作者 @nitya |
| 课程编号 | 主题 | 课程分组 | 学习目标 | 关联课程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定义数据科学 | 介绍 | 了解数据科学背后的基本概念及其与人工智能、机器学习和大数据的关系。 | 课程 视频 | Dmitry |
| 02 | 数据科学伦理 | 介绍 | 数据伦理的概念、挑战与框架。 | 课程 | Nitya |
| 03 | 定义数据 | 介绍 | 数据的分类及其常见来源。 | 课程 | Jasmine |
| 04 | 统计与概率简介 | 介绍 | 使用概率与统计的数学技巧理解数据。 | 课程 视频 | Dmitry |
| 05 | 关系型数据处理 | 数据处理 | 介绍关系型数据及如何使用结构化查询语言(SQL,读作“see-quell”)探索和分析关系型数据的基础。 | 课程 | Christopher |
| 06 | 非关系型数据处理 | 数据处理 | 介绍非关系型数据及其各种类型,及文档数据库的基础探索与分析。 | 课程 | Jasmine |
| 07 | Python 数据处理 | 数据处理 | 使用 Python 及 Pandas 等库进行数据探索的基础。建议具备 Python 编程基础。 | 课程 视频 | Dmitry |
| 08 | 数据准备 | 数据处理 | 涉及数据清洗与转换技术,处理缺失、不准确或不完整数据的挑战。 | 课程 | Jasmine |
| 09 | 数量可视化 | 数据可视化 | 学习使用 Matplotlib 可视化鸟类数据 🦆 | 课程 | Jen |
| 10 | 数据分布可视化 | 数据可视化 | 可视化观测值和区间内的趋势。 | 课程 | Jen |
| 11 | 比例可视化 | 数据可视化 | 可视化离散和分组百分比。 | 课程 | Jen |
| 12 | 关系可视化 | 数据可视化 | 可视化数据集合及变量间的联系与相关性。 | 课程 | Jen |
| 13 | 有意义的可视化 | 数据可视化 | 提供制作有效问题解决和洞察的可视化的技巧和指导。 | 课程 | Jen |
| 14 | 数据科学生命周期简介 | 生命周期 | 介绍数据科学生命周期及其第一步:数据获取与提取。 | 课程 | Jasmine |
| 15 | 分析阶段 | 生命周期 | 数据科学生命周期的分析阶段,侧重数据分析技巧。 | 课程 | Jasmine |
| 16 | 交流阶段 | 生命周期 | 此阶段强调以便于决策者理解的方式展示数据洞察。 | 课程 | Jalen |
| 17 | 云端数据科学简介 | 云端数据 | 介绍云端数据科学及其优势。 | 课程 | Tiffany 和 Maud |
| 18 | 云端数据科学 | 云端数据 | 使用低代码工具训练模型。 | 课程 | Tiffany 和 Maud |
| 19 | 云端数据科学 | 云端数据 | 使用 Azure 机器学习工作室部署模型。 | 课程 | Tiffany 和 Maud |
| 20 | 实战中的数据科学 | 实战 | 现实世界中的数据科学项目。 | 课程 | Nitya |
GitHub Codespaces
按以下步骤在 Codespace 中打开此示例:
- 点击 Code 下拉菜单,选择“Open with Codespaces”选项。
- 在面板底部选择 + New codespace。 更多信息请查看 GitHub 文档。
VSCode 远程 - 容器
按以下步骤使用您本地的 VSCode 远程 - 容器扩展,在容器中打开此仓库:
- 如果是首次使用开发容器,请确保您的系统满足先决条件(例如安装了 Docker),详见入门文档。
使用此仓库,您可以选择在隔离的 Docker 卷中打开仓库:
注意:此操作底层将使用 Remote-Containers 的 Clone Repository in Container Volume... 命令,将源代码克隆到 Docker 卷中,而非本地文件系统。卷是持久化容器数据的首选机制。
或者打开本地克隆或下载的仓库版本:
- 将此仓库克隆到本地文件系统。
- 按 F1,选择 Remote-Containers: Open Folder in Container... 命令。
- 选择克隆的文件夹,等待容器启动,然后开始使用。
离线访问
您可以使用 Docsify 离线浏览本文档。Fork 本仓库,在本地机器上安装 Docsify,然后在仓库根目录输入 docsify serve。网站将在本地主机的3000端口提供服务:localhost:3000。
注意,Jupyter 笔记本不会通过 Docsify 渲染,需要运行笔记本时,请在 VS Code 中使用 Python 内核单独运行。
其他课程体系
我们团队还制作了其他课程!敬请查看:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心学习
Copilot 系列
获取帮助
遇到问题? 请查看我们的Troubleshooting Guide,了解常见问题的解决方案。
如果你遇到卡顿或对构建 AI 应用有任何疑问,欢迎加入其他学习者和经验丰富的开发者,一起讨论 MCP。这里是一个支持性的社区,欢迎提问并自由分享知识。
如果你在构建过程中有产品反馈或遇到错误,请访问:
免责声明:
本文件由AI翻译服务Co-op Translator翻译完成。虽然我们尽力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。以原文的母语版本为权威参考。如涉及重要信息,建议使用专业人工翻译。我们不对因使用本翻译而引起的任何误解或误释承担责任。



