You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/4-Data-Science-Lifecycle/14-Introduction/translations/assignment.zh-cn.md

23 lines
1.4 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 获得一组数据集
一位客户向你的团队寻求帮助,调查一位出租车乘客在纽约市的季节性消费习惯。
他们想知道:**纽约市黄色出租车乘客在冬夏两季是否会给司机更多小费?**
你的团队正处于数据科学生命周期的[捕获](../Readme.md#Capturing)阶段,而你正在处理数据集。有笔记本和[数据](../../../data/taxi.csv)可供你探索。
在这个目录中, [笔记本](../notebook.ipynb)利用Python加载来自[纽约市出租车和豪华轿车委员会](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets)的黄色出租车出行数据。
你也可以用文本编辑器或电子表格软件如Excel来打开出租车数据文件。
## 指示
- 评估数据集中的数据是否能帮助回答问题。
- 探索[纽约市开放数据目录](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93)。确定一个可以帮助回答客户问题的额外数据集。
- 写下三个你会问客户的问题,以更清晰、更好理解客户的问题。
查询[数据字典](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf)和[用户指南](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf)以获得更多关于数据的信息。
## 评分表
优秀|一般|需要改进
---|---|--|