You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
8.7 KiB
8.7 KiB
使用指南
本指南提供了使用《数据科学入门》课程的示例和常见工作流程。
目录
如何使用本课程
本课程设计灵活,可通过多种方式使用:
- 自学:根据自己的节奏独立完成课程
- 课堂教学:作为结构化课程进行指导教学
- 学习小组:与同伴协作学习
- 工作坊形式:短期强化学习
学习课程内容
每节课遵循一致的结构,以最大化学习效果:
课程结构
- 课前测验:测试现有知识
- 手绘笔记(可选):关键概念的视觉总结
- 视频(可选):补充视频内容
- 书面课程:核心概念和解释
- Jupyter Notebook:动手编码练习
- 作业:练习所学内容
- 课后测验:巩固理解
课程学习示例流程
# 1. Navigate to the lesson directory
cd 1-Introduction/01-defining-data-science
# 2. Read the README.md
# Open README.md in your browser or editor
# 3. Take the pre-lesson quiz
# Click the quiz link in the README
# 4. Open the Jupyter notebook (if available)
jupyter notebook
# 5. Complete the exercises in the notebook
# 6. Work on the assignment
# 7. Take the post-lesson quiz
使用 Jupyter Notebooks
启动 Jupyter
# Activate your virtual environment
source venv/bin/activate # On macOS/Linux
# OR
venv\Scripts\activate # On Windows
# Start Jupyter from the repository root
jupyter notebook
运行 Notebook 单元格
- 执行单元格:按
Shift + Enter或点击“运行”按钮 - 运行所有单元格:从菜单中选择“Cell” → “Run All”
- 重启内核:如果遇到问题,选择“Kernel” → “Restart”
示例:在 Notebook 中处理数据
# Import required libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Load a dataset
df = pd.read_csv('data/sample.csv')
# Explore the data
df.head()
df.info()
df.describe()
# Create a visualization
plt.figure(figsize=(10, 6))
plt.plot(df['column_name'])
plt.title('Sample Visualization')
plt.xlabel('X-axis Label')
plt.ylabel('Y-axis Label')
plt.show()
保存您的工作
- Jupyter 会定期自动保存
- 手动保存:按
Ctrl + S(macOS 上为Cmd + S) - 您的进度保存在
.ipynb文件中
使用测验应用程序
本地运行测验应用程序
# Navigate to quiz app directory
cd quiz-app
# Start the development server
npm run serve
# Access at http://localhost:8080
参加测验
- 课前测验链接位于每节课顶部
- 课后测验链接位于每节课底部
- 每个测验包含 3 个问题
- 测验旨在巩固学习,而非全面测试
测验编号
- 测验编号为 0-39(共 40 个测验)
- 每节课通常有课前和课后测验
- 测验 URL 包含测验编号:
https://ff-quizzes.netlify.app/en/ds/quiz/0
常见工作流程
工作流程 1:完全初学者路径
# 1. Set up your environment (see INSTALLATION.md)
# 2. Start with Lesson 1
cd 1-Introduction/01-defining-data-science
# 3. For each lesson:
# - Take pre-lesson quiz
# - Read the lesson content
# - Work through the notebook
# - Complete the assignment
# - Take post-lesson quiz
# 4. Progress through all 20 lessons sequentially
工作流程 2:特定主题学习
如果您对某个特定主题感兴趣:
# Example: Focus on Data Visualization
cd 3-Data-Visualization
# Explore lessons 9-13:
# - Lesson 9: Visualizing Quantities
# - Lesson 10: Visualizing Distributions
# - Lesson 11: Visualizing Proportions
# - Lesson 12: Visualizing Relationships
# - Lesson 13: Meaningful Visualizations
工作流程 3:基于项目的学习
# 1. Review the Data Science Lifecycle lessons (14-16)
cd 4-Data-Science-Lifecycle
# 2. Work through a real-world example (Lesson 20)
cd ../6-Data-Science-In-Wild/20-Real-World-Examples
# 3. Apply concepts to your own project
工作流程 4:基于云的数据科学
# Learn about cloud data science (Lessons 17-19)
cd 5-Data-Science-In-Cloud
# 17: Introduction to Cloud Data Science
# 18: Low-Code ML Tools
# 19: Azure Machine Learning Studio
自学者提示
保持条理
# Create a learning journal
mkdir my-learning-journal
# For each lesson, create notes
echo "# Lesson 1 Notes" > my-learning-journal/lesson-01-notes.md
定期练习
- 每天或每周安排固定时间学习
- 每周至少完成一节课
- 定期复习之前的课程
参与社区
- 加入 Discord 社区
- 参与 Discord 中的 #Data-Science-for-Beginners 频道 Discord Discussions
- 分享您的学习进度并提出问题
创建自己的项目
完成课程后,将概念应用到个人项目中:
# Example: Analyze your own dataset
import pandas as pd
# Load your own data
my_data = pd.read_csv('my-project/data.csv')
# Apply techniques learned
# - Data cleaning (Lesson 8)
# - Exploratory data analysis (Lesson 7)
# - Visualization (Lessons 9-13)
# - Analysis (Lesson 15)
教师提示
课堂设置
- 查看 for-teachers.md 获取详细指导
- 设置共享环境(GitHub Classroom 或 Codespaces)
- 建立沟通渠道(Discord、Slack 或 Teams)
课程计划
建议的 10 周课程安排:
- 第 1-2 周:介绍(第 1-4 课)
- 第 3-4 周:数据处理(第 5-8 课)
- 第 5-6 周:数据可视化(第 9-13 课)
- 第 7-8 周:数据科学生命周期(第 14-16 课)
- 第 9 周:云数据科学(第 17-19 课)
- 第 10 周:实际应用与最终项目(第 20 课)
运行 Docsify 以离线访问
# Serve documentation locally for classroom use
docsify serve
# Students can access at localhost:3000
# No internet required after initial setup
作业评分
- 检查学生的 Notebook 是否完成练习
- 通过测验分数检查理解情况
- 使用数据科学生命周期原则评估最终项目
创建作业
# Example custom assignment template
"""
Assignment: [Topic]
Objective: [Learning goal]
Dataset: [Provide or have students find one]
Tasks:
1. Load and explore the dataset
2. Clean and prepare the data
3. Create at least 3 visualizations
4. Perform analysis
5. Communicate findings
Deliverables:
- Jupyter notebook with code and explanations
- Written summary of findings
"""
离线使用
下载资源
# Clone the entire repository
git clone https://github.com/microsoft/Data-Science-For-Beginners.git
# Download datasets in advance
# Most datasets are included in the repository
本地运行文档
# Serve with Docsify
docsify serve
# Access at localhost:3000
本地运行测验应用程序
cd quiz-app
npm run serve
访问翻译内容
翻译版本支持 40 多种语言:
# Access translated lessons
cd translations/fr # French
cd translations/es # Spanish
cd translations/de # German
# ... and many more
每种翻译版本的结构与英文版保持一致。
其他资源
继续学习
- Microsoft Learn - 更多学习路径
- Student Hub - 学生资源
- Azure AI Foundry - 社区论坛
相关课程
获取帮助
- 查看 TROUBLESHOOTING.md 了解常见问题
- 搜索 GitHub Issues
- 加入我们的 Discord
- 查看 CONTRIBUTING.md 以报告问题或贡献内容
免责声明:
本文档使用AI翻译服务 Co-op Translator 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于关键信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。