# 获得一组数据集 一位客户向你的团队寻求帮助,调查一位出租车乘客在纽约市的季节性消费习惯。 他们想知道:**纽约市黄色出租车乘客在冬夏两季是否会给司机更多小费?** 你的团队正处于数据科学生命周期的[捕获](../Readme.md#Capturing)阶段,而你正在处理数据集。有笔记本和[数据](../../../data/taxi.csv)可供你探索。 在这个目录中, [笔记本](../notebook.ipynb)利用Python加载来自[纽约市出租车和豪华轿车委员会](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets)的黄色出租车出行数据。 你也可以用文本编辑器或电子表格软件,如Excel来打开出租车数据文件。 ## 指示 - 评估数据集中的数据是否能帮助回答问题。 - 探索[纽约市开放数据目录](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93)。确定一个可以帮助回答客户问题的额外数据集。 - 写下三个你会问客户的问题,以更清晰、更好理解客户的问题。 查询[数据字典](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf)和[用户指南](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf)以获得更多关于数据的信息。 ## 评分表 优秀|一般|需要改进 ---|---|--|