|
|
2 weeks ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 2 weeks ago | |
| 2-Working-With-Data | 2 weeks ago | |
| 3-Data-Visualization | 2 weeks ago | |
| 4-Data-Science-Lifecycle | 2 weeks ago | |
| 5-Data-Science-In-Cloud | 2 weeks ago | |
| 6-Data-Science-In-Wild | 2 weeks ago | |
| docs | 5 months ago | |
| examples | 4 months ago | |
| quiz-app | 5 months ago | |
| sketchnotes | 2 weeks ago | |
| AGENTS.md | 4 months ago | |
| CODE_OF_CONDUCT.md | 5 months ago | |
| CONTRIBUTING.md | 2 weeks ago | |
| INSTALLATION.md | 4 months ago | |
| README.md | 2 weeks ago | |
| SECURITY.md | 5 months ago | |
| SUPPORT.md | 5 months ago | |
| TROUBLESHOOTING.md | 4 months ago | |
| USAGE.md | 4 months ago | |
| for-teachers.md | 5 months ago | |
README.md
面向初学者的数据科学课程
微软 Azure 云推广者很高兴提供一个为期 10 周、共 20 课的数据科学课程。每节课包括课前和课后测验、完成课程的书面指导、解决方案和作业。我们的项目驱动教学法使你在构建的过程中学习,这是一种经证实的新技能“扎根”的方法。
衷心感谢我们的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison。
🙏 特别感谢 🙏 我们的 Microsoft 学生大使 作者、审稿人和内容贡献者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 面向初学者的数据科学 - 由 @nitya 绘制的手绘笔记 |
🌐 多语言支持
通过 GitHub Action 支持(自动且始终最新)
阿拉伯语 | 孟加拉语 | 保加利亚语 | 缅甸语(缅甸) | 中文(简体) | 中文(繁体,香港) | 中文(繁体,澳门) | 中文(繁体,台湾) | 克罗地亚语 | 捷克语 | 丹麦语 | 荷兰语 | 爱沙尼亚语 | 芬兰语 | 法语 | 德语 | 希腊语 | 希伯来语 | 印地语 | 匈牙利语 | 印度尼西亚语 | 意大利语 | 日语 | 卡纳达语 | 韩语 | 立陶宛语 | 马来语 | 马拉雅拉姆语 | 马拉地语 | 尼泊尔语 | 尼日利亚皮钦语 | 挪威语 | 波斯语(法尔西语) | 波兰语 | 葡萄牙语(巴西) | 葡萄牙语(葡萄牙) | 旁遮普语(古鲁姆奇) | 罗马尼亚语 | 俄语 | 塞尔维亚语(西里尔字母) | 斯洛伐克语 | 斯洛文尼亚语 | 西班牙语 | 斯瓦希里语 | 瑞典语 | 塔加洛语(菲律宾语) | 泰米尔语 | 泰卢固语 | 泰语 | 土耳其语 | 乌克兰语 | 乌尔都语 | 越南语
更喜欢本地克隆?
此仓库包括 50 多种语言翻译,显著增加下载大小。要克隆时不包含翻译,请使用稀疏检出:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'这样你就能获得完成课程所需的一切,下载速度更快。
如果您希望支持额外的翻译语言,详情见 这里
加入我们的社区
我们正在进行 Discord AI 学习系列,了解详情并加入我们,AI 学习系列,时间为 2025 年 9 月 18 日至 30 日。你将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。
你是学生吗?
使用以下资源开始:
- 学生中心页面 本页面包含初学者资源、学生包,甚至还有获取免费证书凭证的方法。建议将此页面加入书签并定期查看,因为我们至少每月更新内容。
- 微软学习学生大使 加入全球学生大使社区,这或许是你进入微软的途径。
开始
📚 文档
👨🎓 针对学生
完全初学者:刚接触数据科学?请从我们适合初学者的示例开始!这些简单且注释详细的示例将帮助你在深入课程前理解基础概念。 学生:如要自行使用此课程,请fork整个仓库并自行完成练习,从课前测验开始。然后阅读课程内容并完成其他活动。尝试通过理解课程来创建项目,而非仅仅复制解决方案代码;不过,每个项目导向课程的 /solutions 文件夹中均提供了解决方案代码。另一种方式是与朋友组成学习小组,共同学习内容。欲进一步学习,推荐使用 Microsoft Learn。
快速开始:
- 查阅 安装指南 设置开发环境
- 查看 使用指南 学习如何使用课程
- 从第 1 课开始,按顺序完成
- 加入我们的 Discord 社区 寻求帮助
👩🏫 针对教师
团队介绍
动图来自 Mohit Jaisal
🎥 点击上方图片观看关于该项目及其创建者的视频!
教学理念
我们在构建此课程时选择了两个教学原则:确保课程以项目为基础,并且包含频繁的测验。在本系列课程结束时,学生将学会数据科学的基本原理,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的真实案例等。
另外,课前的低风险测验可以帮助学生设定学习主题的意向,而课后的第二次测验则有助于巩固知识。该课程设计灵活且有趣,可以全部学习或部分学习。项目从小型开始,到10周课程末变得越来越复杂。
每节课程包含:
- 可选的手绘笔记
- 可选的补充视频
- 课前热身测验
- 文字课程
- 对于项目课程,提供逐步构建项目的指南
- 知识点检测
- 挑战任务
- 补充阅读材料
- 作业
- 课后测验
关于测验的说明:所有测验都存放在 Quiz-App 文件夹中,共40个测验,每个测验三道题。测验链接嵌入课程,但测验应用也可以本地运行或部署到 Azure;请参照
quiz-app文件夹中的说明。这些测验正在逐步完成本地化。
🎓 适合初学者的示例
刚接触数据科学? 我们专门创建了一个示例目录,其中包含简单且注释详尽的代码,帮助你快速入门:
- 🌟 Hello World - 你的第一个数据科学程序
- 📂 加载数据 - 学习如何读取和探索数据集
- 📊 简单分析 - 计算统计数据并发现模式
- 📈 基础可视化 - 创建图表和图形
- 🔬 真实项目 - 从头到尾的完整工作流程
每个示例均附有详细注释,讲解每一步,非常适合完全初学者!
👉 从示例开始 👈
课程列表
![]() |
|---|
| 初学者数据科学路线图 - 手绘笔记来自 @nitya |
| 课程编号 | 主题 | 课程分组 | 学习目标 | 课程链接 | 作者 |
|---|---|---|---|---|---|
| 01 | 定义数据科学 | 介绍 | 学习数据科学的基本概念及其与人工智能、机器学习和大数据的关联。 | 课程 视频 | Dmitry |
| 02 | 数据科学伦理 | 介绍 | 数据伦理的概念、挑战与框架。 | 课程 | Nitya |
| 03 | 定义数据 | 介绍 | 数据的分类及其常见来源。 | 课程 | Jasmine |
| 04 | 统计与概率入门 | 介绍 | 使用概率与统计的数学技术理解数据。 | 课程 视频 | Dmitry |
| 05 | 关系数据处理 | 数据操作 | 关系数据入门,使用结构化查询语言(SQL)探索和分析关系数据基础。 | 课程 | Christopher |
| 06 | 非SQL数据处理 | 数据操作 | 非关系数据介绍、各种类型及文档数据库的探索和分析基础。 | 课程 | Jasmine |
| 07 | Python数据操作 | 数据操作 | 使用Python和Pandas等库进行数据探索的基础,推荐具备基础Python编程知识。 | 课程 视频 | Dmitry |
| 08 | 数据准备 | 数据操作 | 数据清洗和转换技术,处理缺失、不准确或不完整数据的挑战。 | 课程 | Jasmine |
| 09 | 数量可视化 | 数据可视化 | 学习使用 Matplotlib 可视化鸟类数据 🦆 | 课程 | Jen |
| 10 | 数据分布可视化 | 数据可视化 | 可视化区间内的观测与趋势。 | 课程 | Jen |
| 11 | 比例可视化 | 数据可视化 | 离散和分组百分比的可视化。 | 课程 | Jen |
| 12 | 关系可视化 | 数据可视化 | 可视化数据集及变量间的连接和相关性。 | 课程 | Jen |
| 13 | 有意义的可视化 | 数据可视化 | 制作有价值的可视化技术与指导,有效支持问题解决与洞察。 | 课程 | Jen |
| 14 | 数据科学生命周期介绍 | 生命周期 | 数据科学生命周期介绍及其首个步骤:数据获取与提取。 | 课程 | Jasmine |
| 15 | 数据分析 | 生命周期 | 数据科学生命周期中分析数据的技术。 | 课程 | Jasmine |
| 16 | 结果沟通 | 生命周期 | 数据科学生命周期中将数据洞察以便决策者易于理解的方式呈现。 | 课程 | Jalen |
| 17 | 云端数据科学 | 云端数据 | 介绍云端数据科学及其优势。 | 课程 | Tiffany 和 Maud |
| 18 | 云端低代码模型训练 | 云端数据 | 使用低代码工具训练模型。 | 课程 | Tiffany 和 Maud |
| 19 | Azure机器学习模型部署 | 云端数据 | 使用 Azure 机器学习工作室部署模型。 | 课程 | Tiffany 和 Maud |
| 20 | 真实世界中的数据科学 | 实践应用 | 真实世界的数据科学项目实例。 | 课程 | Nitya |
GitHub Codespaces
按以下步骤在 Codespace 中打开此示例:
- 点击 Code 下拉菜单,选择“Open with Codespaces”选项。
- 在面板底部选择“+ New codespace”。 更多信息请查阅 GitHub 文档。
VSCode 远程容器
使用本地机器和 VSCode 通过 VS Code Remote - Containers 扩展打开此仓库的容器,步骤如下:
- 如果是首次使用开发容器,请确保系统满足先决条件(例如安装了 Docker),详情参见 入门文档。
使用此仓库时,您可以选择在隔离的 Docker 卷中打开仓库:
注意:底层将使用 Remote-Containers 的 Clone Repository in Container Volume... 命令在 Docker 卷中克隆源代码,而非本地文件系统。卷 是持久化容器数据的首选方式。
或者打开本地克隆或下载的仓库版本:
- 将仓库克隆到本地文件系统。
- 按 F1,选择 Remote-Containers: Open Folder in Container... 命令。
- 选择克隆的文件夹,等待容器启动,然后开始使用。
离线访问
您可以使用 Docsify 离线运行本文档。Fork 此仓库,在本地安装 Docsify(安装指南),然后在仓库根目录输入 docsify serve。网站将通过本地的 3000 端口提供服务:localhost:3000。
注意,笔记本文件不会通过 Docsify 渲染,当你需要运行笔记本时,请在 VS Code 中使用 Python 内核单独操作。
其他课程
我们的团队还出品其他课程!请查看:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心学习
Copilot 系列
获取帮助
遇到问题? 查看我们的故障排除指南以获取常见问题的解决方案。
如果遇到困难或对构建 AI 应用有任何疑问,欢迎加入学习者及有经验开发者的讨论社区,交流 MCP 相关内容。这里是一个支持性强的社区,欢迎提问并自由分享知识。
如果有产品反馈或在构建过程中遇到错误,请访问:
免责声明:
本文件使用 AI 翻译服务 Co-op Translator 进行翻译。尽管我们力求准确,但请注意,自动翻译可能包含错误或不准确之处。请以原文(母语版本)为权威来源。对于重要信息,建议使用专业人工翻译。对于因使用本翻译而产生的任何误解或误读,我们不承担任何责任。



