17 KiB
数据科学入门 - 课程大纲
Azure Cloud Advocates团队很高兴为大家提供一个为期10周、共20节课的课程,全面介绍数据科学。每节课都包含课前和课后测验、完成课程的书面指导、解决方案以及作业。我们的项目式教学法让您在实践中学习,这是一种让新技能牢固掌握的有效方法。
衷心感谢我们的作者们: Jasmine Greenaway、Dmitry Soshnikov、Nitya Narasimhan、Jalen McGee、Jen Looper、Maud Levy、Tiffany Souterre、Christopher Harrison。
🙏 特别感谢 🙏 我们的 Microsoft Student Ambassador 作者、审阅者和内容贡献者们, 特别是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi。
![]() |
---|
数据科学入门 - 速写笔记由 @nitya 绘制 |
🌐 多语言支持
通过 GitHub Action 支持(自动更新且始终保持最新)
法语 | 西班牙语 | 德语 | 俄语 | 阿拉伯语 | 波斯语 | 乌尔都语 | 中文(简体) | 中文(繁体,澳门) | 中文(繁体,香港) | 中文(繁体,台湾) | 日语 | 韩语 | 印地语 | 孟加拉语 | 马拉地语 | 尼泊尔语 | 旁遮普语(古木基文) | 葡萄牙语(葡萄牙) | 葡萄牙语(巴西) | 意大利语 | 波兰语 | 土耳其语 | 希腊语 | 泰语 | 瑞典语 | 丹麦语 | 挪威语 | 芬兰语 | 荷兰语 | 希伯来语 | 越南语 | 印尼语 | 马来语 | 他加禄语(菲律宾语) | 斯瓦希里语 | 匈牙利语 | 捷克语 | 斯洛伐克语 | 罗马尼亚语 | 保加利亚语 | 塞尔维亚语(西里尔文) | 克罗地亚语 | 斯洛文尼亚语 | 乌克兰语 | 缅甸语
如果您希望支持其他翻译语言,请查看 这里
加入我们的社区
您是学生吗?
通过以下资源开始学习:
- 学生中心页面 在此页面,您可以找到入门资源、学生礼包,甚至获取免费认证券的方法。此页面值得收藏,并定期查看,因为我们至少每月更新内容。
- Microsoft Learn 学生大使 加入全球学生大使社区,这可能是您进入微软的途径。
入门指南
学生们:如果您想独立使用此课程,请将整个仓库分叉并自行完成练习,从课前测验开始。然后阅读课程内容并完成其他活动。尝试通过理解课程内容来创建项目,而不是直接复制解决方案代码;不过,这些代码可以在每个项目课程的 /solutions 文件夹中找到。另一个建议是与朋友组成学习小组,共同学习内容。对于进一步学习,我们推荐 Microsoft Learn。
团队介绍
Gif 制作人 Mohit Jaisal
🎥 点击上方图片观看关于项目及其创建者的视频!
教学法
我们在设计此课程时选择了两个教学原则:确保课程是基于项目的,并且包含频繁的测验。在本系列课程结束时,学生将学习数据科学的基本原理,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的实际应用案例等。
此外,课前的低压力测验可以让学生专注于学习主题,而课后的第二次测验则有助于进一步巩固知识。此课程设计灵活有趣,可以完整学习,也可以部分学习。项目从简单开始,到10周课程结束时逐渐变得复杂。
每节课程包括:
- 可选的手绘笔记
- 可选的补充视频
- 课前热身测验
- 书面课程
- 对于基于项目的课程,提供逐步指导如何构建项目
- 知识检查
- 挑战任务
- 补充阅读材料
- 作业
- 课后测验
关于测验的说明:所有测验都包含在 Quiz-App 文件夹中,共有 40 个测验,每个测验包含三个问题。测验链接嵌入在课程中,但测验应用可以在本地运行或部署到 Azure;请按照
quiz-app
文件夹中的说明操作。这些测验正在逐步进行本地化。
课程列表
![]() |
---|
数据科学入门:路线图 - 手绘笔记由 @nitya |
课程编号 | 主题 | 课程分组 | 学习目标 | 课程链接 | 作者 |
---|---|---|---|---|---|
01 | 数据科学定义 | 简介 | 学习数据科学的基本概念,以及它与人工智能、机器学习和大数据的关系。 | 课程 视频 | Dmitry |
02 | 数据科学伦理 | 简介 | 数据伦理的概念、挑战与框架。 | 课程 | Nitya |
03 | 数据定义 | 简介 | 数据的分类及其常见来源。 | 课程 | Jasmine |
04 | 统计与概率简介 | 简介 | 使用概率和统计的数学技术来理解数据。 | 课程 视频 | Dmitry |
05 | 使用关系型数据 | 数据操作 | 关系型数据简介,以及使用结构化查询语言(SQL,发音为“see-quell”)探索和分析关系型数据的基础知识。 | 课程 | Christopher |
06 | 使用 NoSQL 数据 | 数据操作 | 非关系型数据简介、其各种类型以及探索和分析文档数据库的基础知识。 | 课程 | Jasmine |
07 | 使用 Python | 数据操作 | 使用 Python 进行数据探索的基础知识,包括 Pandas 等库。建议具备 Python 编程的基础知识。 | 课程 视频 | Dmitry |
08 | 数据准备 | 数据操作 | 数据清理和转换技术,处理缺失、不准确或不完整数据的相关主题。 | 课程 | Jasmine |
09 | 可视化数量 | 数据可视化 | 学习如何使用 Matplotlib 可视化鸟类数据 🦆 | 课程 | Jen |
10 | 可视化数据分布 | 数据可视化 | 可视化区间内的观察结果和趋势。 | 课程 | Jen |
11 | 可视化比例 | 数据可视化 | 可视化离散和分组百分比。 | 课程 | Jen |
12 | 可视化关系 | 数据可视化 | 可视化数据集及其变量之间的连接和相关性。 | 课程 | Jen |
13 | 有意义的可视化 | 数据可视化 | 提供有效问题解决和洞察的可视化技术和指导。 | 课程 | Jen |
14 | 数据科学生命周期简介 | 生命周期 | 数据科学生命周期简介及其第一步:数据获取和提取。 | 课程 | Jasmine |
15 | 数据分析 | 生命周期 | 数据科学生命周期的这一阶段专注于数据分析技术。 | 课程 | Jasmine |
16 | 数据沟通 | 生命周期 | 数据科学生命周期的这一阶段专注于以易于决策者理解的方式呈现数据洞察。 | 课程 | Jalen |
17 | 云端数据科学 | 云端数据 | 这一系列课程介绍了云端数据科学及其优势。 | 课程 | Tiffany 和 Maud |
18 | 云端数据科学 | 云端数据 | 使用低代码工具训练模型。 | 课程 | Tiffany 和 Maud |
19 | 云端数据科学 | 云端数据 | 使用 Azure Machine Learning Studio 部署模型。 | 课程 | Tiffany 和 Maud |
20 | 野外数据科学 | 野外数据 | 数据科学驱动的真实世界项目。 | 课程 | Nitya |
GitHub Codespaces
按照以下步骤在 Codespace 中打开此示例:
- 点击代码下拉菜单,选择“Open with Codespaces”选项。
- 在面板底部选择 + New codespace。 有关更多信息,请查看 GitHub 文档。
VSCode Remote - Containers
按照以下步骤使用本地机器和 VSCode 的 VS Code Remote - Containers 扩展在容器中打开此仓库:
- 如果这是您第一次使用开发容器,请确保您的系统满足前置条件(例如安装了 Docker),请参考 入门文档。
要使用此仓库,您可以选择在隔离的 Docker 卷中打开仓库:
注意:底层将使用 Remote-Containers: Clone Repository in Container Volume... 命令将源代码克隆到 Docker 卷中,而不是本地文件系统。卷 是持久化容器数据的首选机制。
或者打开本地克隆或下载的仓库版本:
- 将此仓库克隆到您的本地文件系统。
- 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
- 选择克隆的文件夹,等待容器启动,然后尝试操作。
离线访问
您可以使用 Docsify 离线运行此文档。Fork 此仓库,在本地机器上 安装 Docsify,然后在此仓库的根文件夹中输入 docsify serve
。网站将通过 localhost 的 3000 端口提供服务:localhost:3000
。
注意,笔记本文件不会通过 Docsify 渲染,因此当您需要运行笔记本时,请在 VS Code 中单独运行 Python 内核。
其他课程
我们的团队还制作了其他课程!请查看:
- 生成式 AI 入门
- 生成式 AI 入门 .NET
- 使用 JavaScript 的生成式 AI
- 使用 Java 的生成式 AI
- AI 入门
- 数据科学入门
- 机器学习入门
- 网络安全入门
- Web 开发入门
- 物联网入门
- XR 开发入门
- 掌握 GitHub Copilot 进行配对编程
- 掌握 GitHub Copilot 进行 C#/.NET 开发
- 选择你的 Copilot 冒险
免责声明:
本文档使用AI翻译服务 Co-op Translator 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于重要信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。