|
|
5 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | 6 months ago | |
| 2-Working-With-Data | 6 months ago | |
| 3-Data-Visualization | 8 months ago | |
| 4-Data-Science-Lifecycle | 8 months ago | |
| 5-Data-Science-In-Cloud | 8 months ago | |
| 6-Data-Science-In-Wild | 8 months ago | |
| docs | 8 months ago | |
| examples | 7 months ago | |
| quiz-app | 8 months ago | |
| sketchnotes | 8 months ago | |
| AGENTS.md | 7 months ago | |
| CODE_OF_CONDUCT.md | 8 months ago | |
| CONTRIBUTING.md | 7 months ago | |
| INSTALLATION.md | 7 months ago | |
| README.md | 5 months ago | |
| SECURITY.md | 8 months ago | |
| SUPPORT.md | 8 months ago | |
| TROUBLESHOOTING.md | 7 months ago | |
| USAGE.md | 7 months ago | |
| for-teachers.md | 8 months ago | |
README.md
数据科学入门 - 课程大纲
微软 Azure 云倡导团队很高兴为大家提供一个为期10周、共20节课的课程,内容涵盖数据科学的方方面面。每节课包括课前和课后测验、完成课程的书面指导、解决方案以及作业。我们的项目式教学法让您在实践中学习,这是一种让新技能“扎根”的有效方式。
衷心感谢我们的作者: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特别感谢 🙏 我们的 Microsoft Student Ambassador 作者、审阅者和内容贡献者, 尤其是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi。
![]() |
|---|
| 数据科学入门 - 速写图由 @nitya 绘制 |
🌐 多语言支持
通过 GitHub Action 支持(自动更新且始终保持最新)
阿拉伯语 | 孟加拉语 | 保加利亚语 | 缅甸语 | 中文(简体) | 中文(繁体,香港) | 中文(繁体,澳门) | 中文(繁体,台湾) | 克罗地亚语 | 捷克语 | 丹麦语 | 荷兰语 | 爱沙尼亚语 | 芬兰语 | 法语 | 德语 | 希腊语 | 希伯来语 | 印地语 | 匈牙利语 | 印尼语 | 意大利语 | 日语 | 韩语 | 立陶宛语 | 马来语 | 马拉地语 | 尼泊尔语 | 尼日利亚皮钦语 | 挪威语 | 波斯语 | 波兰语 | 葡萄牙语(巴西) | 葡萄牙语(葡萄牙) | 旁遮普语(古木基文) | 罗马尼亚语 | 俄语 | 塞尔维亚语(西里尔文) | 斯洛伐克语 | 斯洛文尼亚语 | 西班牙语 | 斯瓦希里语 | 瑞典语 | 他加禄语(菲律宾语) | 泰米尔语 | 泰语 | 土耳其语 | 乌克兰语 | 乌尔都语 | 越南语
如果您希望支持其他语言,支持的语言列表请查看 这里
加入我们的社区
我们正在进行一个 Discord AI 学习系列活动,了解更多并加入我们 AI 学习系列,活动时间为 2025 年 9 月 18 日至 30 日。您将学习使用 GitHub Copilot 进行数据科学的技巧和方法。
你是学生吗?
通过以下资源开始学习:
- 学生中心页面 在此页面,您可以找到入门资源、学生包,甚至获取免费认证券的方法。建议您将此页面加入书签并定期查看,因为我们至少每月更新内容。
- Microsoft Learn 学生大使 加入全球学生大使社区,这可能是您进入微软的途径。
开始学习
📚 文档
👨🎓 面向学生
完全初学者:数据科学新手?从我们的初学者友好示例开始!这些简单且注释详尽的示例将帮助您在深入学习课程之前理解基础知识。 学生:如果您想独立使用此课程,请分叉整个仓库并独立完成练习,从课前测验开始。然后阅读课程内容并完成其他活动。尝试通过理解课程内容来创建项目,而不是直接复制解决方案代码;不过,解决方案代码可以在每个项目课程的 /solutions 文件夹中找到。另一个建议是与朋友组成学习小组,共同学习内容。进一步学习,我们推荐 Microsoft Learn。
快速开始:
- 查看 安装指南 以设置您的环境
- 阅读 使用指南 了解如何使用课程
- 从第1课开始,按顺序学习
- 加入我们的 Discord 社区 寻求支持
👩🏫 面向教师
团队介绍
Gif 制作: Mohit Jaisal
🎥 点击上方图片观看关于项目及其创建者的视频!
教学法
我们在设计这套课程时选择了两个教学原则:确保课程以项目为基础,并包含频繁的测验。在本系列课程结束时,学生将学习数据科学的基本原理,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的实际应用案例等。
此外,课前的低压力测验可以帮助学生明确学习主题的目标,而课后的第二次测验则有助于进一步巩固知识。这套课程设计灵活有趣,可以完整学习,也可以选择部分内容。项目从简单开始,到10周课程结束时逐渐变得复杂。
每节课包括:
- 可选的手绘笔记
- 可选的补充视频
- 课前热身测验
- 书面课程内容
- 对于基于项目的课程,提供逐步指导如何完成项目
- 知识检查
- 挑战任务
- 补充阅读材料
- 作业
- 课后测验
关于测验的说明:所有测验都包含在Quiz-App文件夹中,共有40个测验,每个测验包含三个问题。测验链接嵌入在课程中,但测验应用可以在本地运行或部署到Azure;请按照
quiz-app文件夹中的说明操作。测验正在逐步进行本地化。
🎓 初学者友好的示例
数据科学新手? 我们创建了一个特别的示例目录,其中包含简单且注释详尽的代码,帮助您入门:
- 🌟 Hello World - 您的第一个数据科学程序
- 📂 加载数据 - 学习如何读取和探索数据集
- 📊 简单分析 - 计算统计数据并发现模式
- 📈 基础可视化 - 创建图表和图形
- 🔬 实际项目 - 从头到尾的完整工作流程
每个示例都包含详细的注释,解释每一步,非常适合绝对初学者!
👉 从示例开始 👈
课程
![]() |
|---|
| 数据科学初学者:路线图 - 手绘笔记由 @nitya |
| 课程编号 | 主题 | 课程分组 | 学习目标 | 课程链接 | 作者 |
|---|---|---|---|---|---|
| 01 | 定义数据科学 | 简介 | 学习数据科学的基本概念及其与人工智能、机器学习和大数据的关系。 | 课程 视频 | Dmitry |
| 02 | 数据科学伦理 | 简介 | 数据伦理概念、挑战与框架。 | 课程 | Nitya |
| 03 | 定义数据 | 简介 | 数据的分类及其常见来源。 | 课程 | Jasmine |
| 04 | 统计与概率简介 | 简介 | 使用概率和统计的数学技术来理解数据。 | 课程 视频 | Dmitry |
| 05 | 使用关系型数据 | 数据处理 | 关系型数据简介以及使用结构化查询语言(SQL,发音为“see-quell”)探索和分析关系型数据的基础知识。 | 课程 | Christopher |
| 06 | 使用NoSQL数据 | 数据处理 | 非关系型数据简介、其各种类型以及探索和分析文档数据库的基础知识。 | 课程 | Jasmine |
| 07 | 使用Python | 数据处理 | 使用Python进行数据探索的基础知识,涉及如Pandas等库。建议具备Python编程的基础知识。 | 课程 视频 | Dmitry |
| 08 | 数据准备 | 数据处理 | 数据清理和转换技术,处理缺失、不准确或不完整数据的挑战。 | 课程 | Jasmine |
| 09 | 可视化数量 | 数据可视化 | 学习如何使用Matplotlib可视化鸟类数据 🦆 | 课程 | Jen |
| 10 | 可视化数据分布 | 数据可视化 | 可视化区间内的观察和趋势。 | 课程 | Jen |
| 11 | 可视化比例 | 数据可视化 | 可视化离散和分组百分比。 | 课程 | Jen |
| 12 | 可视化关系 | 数据可视化 | 可视化数据集及其变量之间的连接和相关性。 | 课程 | Jen |
| 13 | 有意义的可视化 | 数据可视化 | 提供技术和指导,使您的可视化在解决问题和洞察方面更有价值。 | 课程 | Jen |
| 14 | 数据科学生命周期简介 | 生命周期 | 数据科学生命周期简介及其第一步:数据获取和提取。 | 课程 | Jasmine |
| 15 | 数据分析 | 生命周期 | 数据科学生命周期的这一阶段专注于数据分析技术。 | 课程 | Jasmine |
| 16 | 数据沟通 | 生命周期 | 数据科学生命周期的这一阶段专注于以便于决策者理解的方式呈现数据洞察。 | 课程 | Jalen |
| 17 | 云端数据科学 | 云数据 | 本系列课程介绍云端数据科学及其优势。 | 课程 | Tiffany 和 Maud |
| 18 | 云端数据科学 | 云数据 | 使用低代码工具训练模型。 | 课程 | Tiffany 和 Maud |
| 19 | 云端数据科学 | 云数据 | 使用Azure Machine Learning Studio部署模型。 | 课程 | Tiffany 和 Maud |
| 20 | 野外数据科学 | 野外数据科学 | 数据科学驱动的实际项目。 | 课程 | Nitya |
GitHub Codespaces
按照以下步骤在Codespace中打开此示例:
- 点击“Code”下拉菜单,选择“Open with Codespaces”选项。
- 在面板底部选择“+ New codespace”。 更多信息,请查看GitHub文档。
VSCode Remote - Containers
按照以下步骤使用本地机器和VSCode通过VS Code Remote - Containers扩展打开此仓库:
- 如果这是您第一次使用开发容器,请确保您的系统满足前提条件(例如安装了Docker),请参考入门文档。
要使用此仓库,您可以选择在隔离的Docker卷中打开仓库:
注意:在底层,这将使用Remote-Containers: **Clone Repository in Container Volume...**命令将源代码克隆到Docker卷中,而不是本地文件系统。卷是持久化容器数据的首选机制。
或者打开本地克隆或下载的仓库版本:
- 将此仓库克隆到您的本地文件系统。
- 按F1并选择**Remote-Containers: Open Folder in Container...**命令。
- 选择此文件夹的克隆副本,等待容器启动并尝试操作。
离线访问
您可以使用Docsify离线运行此文档。Fork此仓库,在您的本地机器上安装Docsify,然后在此仓库的根文件夹中输入docsify serve。网站将在您的本地主机的3000端口上运行:localhost:3000。
注意,笔记本文件不会通过Docsify渲染,因此当您需要运行笔记本时,请在VS Code中单独运行Python内核。
其他课程
我们的团队还制作了其他课程!查看以下内容:
Azure / Edge / MCP / Agents
生成式 AI 系列
核心学习
Copilot 系列
获取帮助
遇到问题? 请查看我们的 故障排除指南,了解常见问题的解决方案。
如果您在构建 AI 应用时遇到困难或有任何问题,可以加入学习者和经验丰富的开发者的讨论社区。这里是一个支持性的社区,欢迎提问并自由分享知识。
如果您有产品反馈或在构建过程中遇到错误,请访问:
免责声明:
本文档使用AI翻译服务Co-op Translator进行翻译。尽管我们努力确保准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档为权威来源。对于关键信息,建议使用专业人工翻译。因使用本翻译而引起的任何误解或误读,我们概不负责。



