|
|
2 months ago | |
|---|---|---|
| .. | ||
| 1-Introduction | ||
| 2-Working-With-Data | 2 months ago | |
| 3-Data-Visualization | ||
| 4-Data-Science-Lifecycle | ||
| 5-Data-Science-In-Cloud | ||
| 6-Data-Science-In-Wild | ||
| docs | ||
| examples | ||
| quiz-app | ||
| sketchnotes | ||
| AGENTS.md | ||
| CODE_OF_CONDUCT.md | ||
| CONTRIBUTING.md | ||
| INSTALLATION.md | ||
| README.md | 2 months ago | |
| SECURITY.md | ||
| SUPPORT.md | ||
| TROUBLESHOOTING.md | ||
| USAGE.md | ||
| for-teachers.md | ||
README.md
面向初学者的数据科学 - 课程
Azure 云倡导者团队很高兴提供一个为期 10 周、共 20 节课的完整数据科学课程。每节课都包括课前和课后测验、完成课程的书面说明、一个解答以及一个作业。我们的项目驱动教学法允许你在构建的同时学习,这是一种经验证的使新技能“牢固掌握”的方法。
衷心感谢我们的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特别感谢 🙏 我们的 Microsoft Student Ambassador 作者、评审和内容贡献者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| 面向初学者的数据科学 - 草图笔记,作者 @nitya |
🌐 多语言支持
通过 GitHub Action 支持(自动且始终最新)
阿拉伯语 | 孟加拉语 | 保加利亚语 | 缅甸语(缅甸) | 中文(简体) | 中文(繁体,香港) | 中文(繁体,澳门) | 中文(繁体,台湾) | 克罗地亚语 | 捷克语 | 丹麦语 | 荷兰语 | 爱沙尼亚语 | 芬兰语 | 法语 | 德语 | 希腊语 | 希伯来语 | 印地语 | 匈牙利语 | 印尼语 | 意大利语 | 日语 | 卡纳达语 | 韩语 | 立陶宛语 | 马来语 | 马拉雅拉姆语 | 马拉地语 | 尼泊尔语 | 尼日利亚皮钦语 | 挪威语 | 波斯语(法尔西) | 波兰语 | 葡萄牙语(巴西) | 葡萄牙语(葡萄牙) | 旁遮普语(古尔穆基) | 罗马尼亚语 | 俄语 | 塞尔维亚语(西里尔文) | 斯洛伐克语 | 斯洛文尼亚语 | 西班牙语 | 斯瓦希里语 | 瑞典语 | 塔加洛语(菲律宾语) | 泰米尔语 | 泰卢固语 | 泰语 | 土耳其语 | 乌克兰语 | 乌尔都语 | 越南语
如果你希望支持更多翻译语言,已支持语言列表见 这里
加入我们的社区
我们正在进行一个 Discord 的 “与 AI 一起学习” 系列,了解更多并于 2025 年 9 月 18 日至 30 日加入我们,访问 Learn with AI Series。你将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。
你是学生吗?
从以下资源开始:
- 学生中心页面 在此页面,你会找到入门资源、学生包,甚至获得免费证书凭证的方法。你会希望将此页面加入书签并不时查看,因为我们至少每月会更换一次内容。
- Microsoft Learn 学生大使 加入全球的学生大使社区,这可能是你进入微软的途径。
开始使用
📚 文档
👨🎓 学生
完全初学者:对数据科学完全陌生?从我们的面向初学者的示例开始!这些简单且注释充分的示例将帮助你在深入完整课程之前掌握基本概念。
学生:如果你想自行使用本课程,请 fork 整个仓库并独立完成练习,从课前测验开始。然后阅读讲义并完成其余活动。尝试通过理解课程内容来创建项目,而不是直接复制解答代码;不过,每个以项目为导向的课程的 /solutions 文件夹中都有相应代码可供参考。另一个主意是与朋友组建学习小组,共同学习内容。若需进一步学习,我们推荐 Microsoft Learn。
快速开始:
- 查看 安装指南 以设置你的环境
- 浏览 使用指南 以了解如何使用该课程
- 从第 1 课开始并按顺序学习
- 加入我们的 Discord 社区 寻求支持
👩🏫 教师
教师:我们已在 for-teachers.md 中包含了一些使用本课程的建议。我们很乐意在 讨论论坛 中收到你的反馈!
团队介绍
GIF 来自 Mohit Jaisal
🎥 点击上方图片观看关于该项目及其创建团队的视频!
教学法
我们在构建本课程时选择了两个教学原则:确保以项目为基础,并包含频繁的小测验。到本系列结束时,学生将掌握数据科学的基本原则,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的真实世界用例等。
此外,课堂前的一次低风险小测验可以帮助学生为学习某个主题设定意图,而课后的第二次小测验则有助于巩固记忆。该课程设计灵活且有趣,可全部或部分学习。项目从小型开始,并在 10 周周期结束时逐渐变得复杂。
每节课包含:
- 可选的手绘速记图
- 可选的补充视频
- 课前热身小测验
- 书面课程
- 对于基于项目的课程,逐步的项目构建指南
- 知识检测
- 挑战
- 补充阅读
- 作业
- 课后小测验
关于小测验的一点说明:所有小测验都包含在 Quiz-App 文件夹中,共 40 个小测验,每个小测验包含三道题。它们在课程内有链接,但测验应用可以在本地运行或部署到 Azure;请按照
quiz-app文件夹中的说明操作。它们正在逐步实现本地化。
🎓 面向初学者的示例
刚接触数据科学? 我们创建了一个专门的 示例目录,包含简单且注释详尽的代码,帮助你入门:
- 🌟 Hello World - 你的第一个数据科学程序
- 📂 加载数据 - 学习读取和探索数据集
- 📊 简单分析 - 计算统计量并发现模式
- 📈 基础可视化 - 创建图表和图形
- 🔬 真实项目 - 从头到尾的完整工作流程
每个示例都包含详细注释,解释每一步,适合完全的初学者!
👉 从示例开始 👈
课程
![]() |
|---|
| 面向初学者的数据科学:路线图 - 速写图 由 @nitya |
| 课程编号 | 主题 | 课程分组 | 学习目标 | 关联课程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定义数据科学 | Introduction | 了解数据科学的基本概念以及它与人工智能、机器学习和大数据的关系。 | 课程 视频 | Dmitry |
| 02 | 数据科学伦理 | Introduction | 数据伦理的概念、挑战与框架。 | 课程 | Nitya |
| 03 | 定义数据 | Introduction | 数据如何分类及其常见来源。 | 课程 | Jasmine |
| 04 | 统计学与概率导论 | Introduction | 使用概率和统计的数学技术来理解数据。 | 课程 视频 | Dmitry |
| 05 | 关系型数据处理 | Working With Data | 介绍关系型数据以及使用结构化查询语言(Structured Query Language,亦称 SQL,发音为 “see-quell”)探索和分析关系型数据的基础知识。 | 课程 | Christopher |
| 06 | 非关系型数据处理 | Working With Data | 介绍非关系型数据、其各种类型以及探索和分析文档数据库的基础知识。 | 课程 | Jasmine |
| 07 | 使用 Python | Working With Data | 使用 Python 进行数据探索的基础知识,涉及 Pandas 等库。建议具备 Python 编程的基础理解。 | 课程 视频 | Dmitry |
| 08 | 数据准备 | Working With Data | 关于清洗和转换数据的技术,以处理缺失、不准确或不完整数据的挑战。 | 课程 | Jasmine |
| 09 | 数量可视化 | Data Visualization | 学习如何使用 Matplotlib 可视化鸟类数据 🦆 | 课程 | Jen |
| 10 | 数据分布可视化 | Data Visualization | 可视化区间内的观测值和趋势。 | 课程 | Jen |
| 11 | 比例可视化 | Data Visualization | 可视化离散和分组的百分比。 | 课程 | Jen |
| 12 | 关系可视化 | Data Visualization | 可视化数据集及其变量之间的连接和相关性。 | 课程 | Jen |
| 13 | 有意义的可视化 | Data Visualization | 制作有助于有效问题解决和洞察的可视化的技术与指导。 | 课程 | Jen |
| 14 | 数据科学生命周期导论 | Lifecycle | 介绍数据科学生命周期及其获取和提取数据的第一步。 | 课程 | Jasmine |
| 15 | 分析 | Lifecycle | 数据科学生命周期中专注于分析数据的阶段。 | 课程 | Jasmine |
| 16 | 沟通 | Lifecycle | 数据科学生命周期中专注于以便决策者更易理解的方式呈现数据洞察的阶段。 | 课程 | Jalen |
| 17 | 云端数据科学 | Cloud Data | 本系列课程介绍云端数据科学及其优势。 | 课程 | Tiffany and Maud |
| 18 | 云端数据科学 | Cloud Data | 使用低代码工具训练模型。 | 课程 | Tiffany and Maud |
| 19 | 云端数据科学 | Cloud Data | 使用 Azure Machine Learning Studio 部署模型。 | 课程 | Tiffany and Maud |
| 20 | 实战中的数据科学 | In the Wild | 真实世界中的数据科学驱动项目。 | 课程 | Nitya |
GitHub Codespaces
按照以下步骤在 Codespace 中打开此示例:
- 点击 Code 下拉菜单并选择 “Open with Codespaces” 选项。
- 在窗格底部选择 + New codespace。 有关更多信息,请查看 GitHub 文档。
VSCode Remote - Containers
按照以下步骤使用本地机器和 VSCode(使用 VS Code Remote - Containers 扩展)在容器中打开此仓库:
- 如果这是你第一次使用开发容器,请确保你的系统满足入门文档中的先决条件(例如已安装 Docker)。
要使用此仓库,你可以选择在隔离的 Docker 卷中打开仓库:
注意:在底层,这将使用 Remote-Containers: Clone Repository in Container Volume... 命令将源代码克隆到 Docker 卷中,而不是本地文件系统。Volumes 是持久化容器数据的首选机制。
或者打开本地克隆或下载的仓库副本:
- 将此仓库克隆到你的本地文件系统。
- 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
- 选择该文件夹的克隆副本,等待容器启动,然后开始试用。
离线访问
你可以使用 Docsify 离线运行本文档。Fork 此仓库,在本地机器上安装 Docsify,然后在此仓库的根文件夹中输入 docsify serve。网站将在本地的 3000 端口提供服务:localhost:3000。
注意,Docsify 不会渲染笔记本文件,因此当你需要运行笔记本时,请在运行 Python 内核的 VS Code 中单独运行。
其他课程
我们的团队还制作其他课程!查看:
LangChain
Azure / Edge / MCP / Agents
生成式 AI 系列
核心学习
Copilot 系列
获取帮助
遇到问题? 请查看我们的 故障排除指南 以获取常见问题的解决方案。
如果您在构建 AI 应用时遇到困难或有任何问题。加入与其他学习者和有经验的开发者一起讨论 MCP。这里是一个支持性的社区,欢迎提问并自由分享知识。
如果您在构建过程中有产品反馈或遇到错误,请访问:
免责声明: 本文件使用 AI 翻译服务 Co-op Translator 翻译。虽然我们力求准确,但请注意自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于重要信息,建议使用专业人工翻译。对于因使用本翻译而产生的任何误解或曲解,我们不承担任何责任。



