You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/zh
localizeflow[bot] 7cfb1adaa8
chore(i18n): sync translations with latest source changes (chunk 1/1, 55 files)
2 months ago
..
1-Introduction
2-Working-With-Data chore(i18n): sync translations with latest source changes (chunk 2/10, 100 files) 2 months ago
3-Data-Visualization
4-Data-Science-Lifecycle
5-Data-Science-In-Cloud
6-Data-Science-In-Wild
docs
examples
quiz-app
sketchnotes
AGENTS.md
CODE_OF_CONDUCT.md
CONTRIBUTING.md
INSTALLATION.md
README.md chore(i18n): sync translations with latest source changes (chunk 1/1, 55 files) 2 months ago
SECURITY.md
SUPPORT.md
TROUBLESHOOTING.md
USAGE.md
for-teachers.md

README.md

面向初学者的数据科学 - 课程

在 GitHub Codespaces 中打开

GitHub 许可证 GitHub 贡献者 GitHub 问题 GitHub 拉取请求 欢迎提交拉取请求

GitHub 关注者 GitHub Forks GitHub 星标

Microsoft Foundry Discord

Microsoft Foundry 开发者论坛

Azure 云倡导者团队很高兴提供一个为期 10 周、共 20 节课的完整数据科学课程。每节课都包括课前和课后测验、完成课程的书面说明、一个解答以及一个作业。我们的项目驱动教学法允许你在构建的同时学习,这是一种经验证的使新技能“牢固掌握”的方法。

衷心感谢我们的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 特别感谢 🙏 我们的 Microsoft Student Ambassador 作者、评审和内容贡献者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

草图笔记 - 作者 @sketchthedocs https://sketchthedocs.dev
面向初学者的数据科学 - 草图笔记,作者 @nitya

🌐 多语言支持

通过 GitHub Action 支持(自动且始终最新)

阿拉伯语 | 孟加拉语 | 保加利亚语 | 缅甸语(缅甸) | 中文(简体) | 中文(繁体,香港) | 中文(繁体,澳门) | 中文(繁体,台湾) | 克罗地亚语 | 捷克语 | 丹麦语 | 荷兰语 | 爱沙尼亚语 | 芬兰语 | 法语 | 德语 | 希腊语 | 希伯来语 | 印地语 | 匈牙利语 | 印尼语 | 意大利语 | 日语 | 卡纳达语 | 韩语 | 立陶宛语 | 马来语 | 马拉雅拉姆语 | 马拉地语 | 尼泊尔语 | 尼日利亚皮钦语 | 挪威语 | 波斯语(法尔西) | 波兰语 | 葡萄牙语(巴西) | 葡萄牙语(葡萄牙) | 旁遮普语(古尔穆基) | 罗马尼亚语 | 俄语 | 塞尔维亚语(西里尔文) | 斯洛伐克语 | 斯洛文尼亚语 | 西班牙语 | 斯瓦希里语 | 瑞典语 | 塔加洛语(菲律宾语) | 泰米尔语 | 泰卢固语 | 泰语 | 土耳其语 | 乌克兰语 | 乌尔都语 | 越南语

如果你希望支持更多翻译语言,已支持语言列表见 这里

加入我们的社区

Microsoft Foundry Discord

我们正在进行一个 Discord 的 “与 AI 一起学习” 系列,了解更多并于 2025 年 9 月 18 日至 30 日加入我们,访问 Learn with AI Series。你将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。

与 AI 一起学习 系列

你是学生吗?

从以下资源开始:

  • 学生中心页面 在此页面,你会找到入门资源、学生包,甚至获得免费证书凭证的方法。你会希望将此页面加入书签并不时查看,因为我们至少每月会更换一次内容。
  • Microsoft Learn 学生大使 加入全球的学生大使社区,这可能是你进入微软的途径。

开始使用

📚 文档

👨‍🎓 学生

完全初学者:对数据科学完全陌生?从我们的面向初学者的示例开始!这些简单且注释充分的示例将帮助你在深入完整课程之前掌握基本概念。
学生:如果你想自行使用本课程,请 fork 整个仓库并独立完成练习,从课前测验开始。然后阅读讲义并完成其余活动。尝试通过理解课程内容来创建项目,而不是直接复制解答代码;不过,每个以项目为导向的课程的 /solutions 文件夹中都有相应代码可供参考。另一个主意是与朋友组建学习小组,共同学习内容。若需进一步学习,我们推荐 Microsoft Learn

快速开始:

  1. 查看 安装指南 以设置你的环境
  2. 浏览 使用指南 以了解如何使用该课程
  3. 从第 1 课开始并按顺序学习
  4. 加入我们的 Discord 社区 寻求支持

👩‍🏫 教师

教师:我们已在 for-teachers.md 中包含了一些使用本课程的建议。我们很乐意在 讨论论坛 中收到你的反馈!

团队介绍

宣传视频

GIF 来自 Mohit Jaisal

🎥 点击上方图片观看关于该项目及其创建团队的视频!

教学法

我们在构建本课程时选择了两个教学原则:确保以项目为基础,并包含频繁的小测验。到本系列结束时,学生将掌握数据科学的基本原则,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的真实世界用例等。

此外,课堂前的一次低风险小测验可以帮助学生为学习某个主题设定意图,而课后的第二次小测验则有助于巩固记忆。该课程设计灵活且有趣,可全部或部分学习。项目从小型开始,并在 10 周周期结束时逐渐变得复杂。

查阅我们的 行为准则贡献指南翻译 指南。我们欢迎你的建设性反馈!

每节课包含:

  • 可选的手绘速记图
  • 可选的补充视频
  • 课前热身小测验
  • 书面课程
  • 对于基于项目的课程,逐步的项目构建指南
  • 知识检测
  • 挑战
  • 补充阅读
  • 作业
  • 课后小测验

关于小测验的一点说明:所有小测验都包含在 Quiz-App 文件夹中,共 40 个小测验,每个小测验包含三道题。它们在课程内有链接,但测验应用可以在本地运行或部署到 Azure请按照 quiz-app 文件夹中的说明操作。它们正在逐步实现本地化。

🎓 面向初学者的示例

刚接触数据科学? 我们创建了一个专门的 示例目录,包含简单且注释详尽的代码,帮助你入门:

  • 🌟 Hello World - 你的第一个数据科学程序
  • 📂 加载数据 - 学习读取和探索数据集
  • 📊 简单分析 - 计算统计量并发现模式
  • 📈 基础可视化 - 创建图表和图形
  • 🔬 真实项目 - 从头到尾的完整工作流程

每个示例都包含详细注释,解释每一步,适合完全的初学者!

👉 从示例开始 👈

课程

 速写图 由 @sketchthedocs https://sketchthedocs.dev
面向初学者的数据科学:路线图 - 速写图 由 @nitya
课程编号 主题 课程分组 学习目标 关联课程 作者
01 定义数据科学 Introduction 了解数据科学的基本概念以及它与人工智能、机器学习和大数据的关系。 课程 视频 Dmitry
02 数据科学伦理 Introduction 数据伦理的概念、挑战与框架。 课程 Nitya
03 定义数据 Introduction 数据如何分类及其常见来源。 课程 Jasmine
04 统计学与概率导论 Introduction 使用概率和统计的数学技术来理解数据。 课程 视频 Dmitry
05 关系型数据处理 Working With Data 介绍关系型数据以及使用结构化查询语言Structured Query Language亦称 SQL发音为 “see-quell”探索和分析关系型数据的基础知识。 课程 Christopher
06 非关系型数据处理 Working With Data 介绍非关系型数据、其各种类型以及探索和分析文档数据库的基础知识。 课程 Jasmine
07 使用 Python Working With Data 使用 Python 进行数据探索的基础知识,涉及 Pandas 等库。建议具备 Python 编程的基础理解。 课程 视频 Dmitry
08 数据准备 Working With Data 关于清洗和转换数据的技术,以处理缺失、不准确或不完整数据的挑战。 课程 Jasmine
09 数量可视化 Data Visualization 学习如何使用 Matplotlib 可视化鸟类数据 🦆 课程 Jen
10 数据分布可视化 Data Visualization 可视化区间内的观测值和趋势。 课程 Jen
11 比例可视化 Data Visualization 可视化离散和分组的百分比。 课程 Jen
12 关系可视化 Data Visualization 可视化数据集及其变量之间的连接和相关性。 课程 Jen
13 有意义的可视化 Data Visualization 制作有助于有效问题解决和洞察的可视化的技术与指导。 课程 Jen
14 数据科学生命周期导论 Lifecycle 介绍数据科学生命周期及其获取和提取数据的第一步。 课程 Jasmine
15 分析 Lifecycle 数据科学生命周期中专注于分析数据的阶段。 课程 Jasmine
16 沟通 Lifecycle 数据科学生命周期中专注于以便决策者更易理解的方式呈现数据洞察的阶段。 课程 Jalen
17 云端数据科学 Cloud Data 本系列课程介绍云端数据科学及其优势。 课程 Tiffany and Maud
18 云端数据科学 Cloud Data 使用低代码工具训练模型。 课程 Tiffany and Maud
19 云端数据科学 Cloud Data 使用 Azure Machine Learning Studio 部署模型。 课程 Tiffany and Maud
20 实战中的数据科学 In the Wild 真实世界中的数据科学驱动项目。 课程 Nitya

GitHub Codespaces

按照以下步骤在 Codespace 中打开此示例:

  1. 点击 Code 下拉菜单并选择 “Open with Codespaces” 选项。
  2. 在窗格底部选择 + New codespace。 有关更多信息,请查看 GitHub 文档

VSCode Remote - Containers

按照以下步骤使用本地机器和 VSCode使用 VS Code Remote - Containers 扩展)在容器中打开此仓库:

  1. 如果这是你第一次使用开发容器,请确保你的系统满足入门文档中的先决条件(例如已安装 Docker

要使用此仓库,你可以选择在隔离的 Docker 卷中打开仓库:

注意:在底层,这将使用 Remote-Containers: Clone Repository in Container Volume... 命令将源代码克隆到 Docker 卷中,而不是本地文件系统。Volumes 是持久化容器数据的首选机制。

或者打开本地克隆或下载的仓库副本:

  • 将此仓库克隆到你的本地文件系统。
  • 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
  • 选择该文件夹的克隆副本,等待容器启动,然后开始试用。

离线访问

你可以使用 Docsify 离线运行本文档。Fork 此仓库,在本地机器上安装 Docsify,然后在此仓库的根文件夹中输入 docsify serve。网站将在本地的 3000 端口提供服务:localhost:3000

注意Docsify 不会渲染笔记本文件,因此当你需要运行笔记本时,请在运行 Python 内核的 VS Code 中单独运行。

其他课程

我们的团队还制作其他课程!查看:

LangChain

适合初学者的 LangChain4j 适合初学者的 LangChain.js


Azure / Edge / MCP / Agents

AZD 入门 Edge AI 入门 MCP 入门 AI 代理 入门


生成式 AI 系列

生成式 AI 入门 生成式 AI (.NET) 生成式 AI (Java) 生成式 AI (JavaScript)


核心学习

机器学习入门 数据科学入门 人工智能入门 网络安全入门 Web 开发入门 物联网入门 XR 开发入门


Copilot 系列

AI 配对编程 Copilot 用于 C#/.NET 的 Copilot Copilot 冒险

获取帮助

遇到问题? 请查看我们的 故障排除指南 以获取常见问题的解决方案。

如果您在构建 AI 应用时遇到困难或有任何问题。加入与其他学习者和有经验的开发者一起讨论 MCP。这里是一个支持性的社区欢迎提问并自由分享知识。

Microsoft Foundry Discord

如果您在构建过程中有产品反馈或遇到错误,请访问:

Microsoft Foundry 开发者论坛


免责声明: 本文件使用 AI 翻译服务 Co-op Translator 翻译。虽然我们力求准确,但请注意自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于重要信息,建议使用专业人工翻译。对于因使用本翻译而产生的任何误解或曲解,我们不承担任何责任。