You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "4e0f1773b9bee1be3b28f9fe2c71b3de",
"translation_date": "2025-08-25T16:56:01+00:00",
"source_file": "1-Introduction/01-defining-data-science/assignment.md",
"language_code": "zh"
}
-->
# 作业:数据科学场景
在本次作业中,我们希望你思考一些现实生活中的流程或问题,涉及不同的问题领域,并考虑如何通过数据科学流程来改进它们。请思考以下问题:
1. 你可以收集哪些数据?
1. 你将如何收集这些数据?
1. 你将如何存储这些数据?数据的规模可能有多大?
1. 你可能从这些数据中获得哪些洞察?基于这些数据,我们可以做出哪些决策?
尝试思考三个不同的问题/流程,并针对每个问题领域描述上述每个要点。
以下是一些可以帮助你开始思考的问题领域和问题:
1. 如何利用数据改进学校中儿童的教育过程?
1. 如何利用数据在疫情期间控制疫苗接种?
1. 如何利用数据确保自己在工作中保持高效?
## 指导
填写下表(如果需要,可以用你自己的问题领域替换建议的问题领域):
| 问题领域 | 问题 | 收集哪些数据 | 如何存储数据 | 我们可以做出的洞察/决策 |
|----------|------|--------------|--------------|--------------------------|
| 教育 | | | | |
| 疫苗接种 | | | | |
| 工作效率 | | | | |
## 评分标准
优秀 | 合格 | 需要改进
--- | --- | -- |
能够为所有问题领域识别出合理的数据来源、数据存储方式以及可能的决策/洞察 | 解决方案的某些方面缺乏细节,未讨论数据存储,至少描述了两个问题领域 | 仅描述了部分数据解决方案,仅考虑了一个问题领域。
** 免责声明**:
本文档使用AI翻译服务 [Co-op Translator ](https://github.com/Azure/co-op-translator ) 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。原始语言的文档应被视为权威来源。对于关键信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。