You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Data-Science-For-Beginners/translations/zh/4-Data-Science-Lifecycle/15-analyzing/assignment.md

34 lines
2.0 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

<!--
CO_OP_TRANSLATOR_METADATA:
{
"original_hash": "fcc7547171f4530f159676dd73ed772e",
"translation_date": "2025-08-25T17:47:42+00:00",
"source_file": "4-Data-Science-Lifecycle/15-analyzing/assignment.md",
"language_code": "zh"
}
-->
# 探索答案
这是上一节课[作业](../14-Introduction/assignment.md)的延续,我们之前简单浏览了数据集。现在我们将更深入地研究这些数据。
客户想知道的问题是:**纽约市的黄色出租车乘客在冬季还是夏季给司机的小费更多?**
您的团队目前处于数据科学生命周期的[分析](README.md)阶段负责对数据集进行探索性数据分析。您已获得一个包含2019年1月和7月200笔出租车交易的笔记本和数据集。
## 指导说明
在此目录中,有一个[笔记本](../../../../4-Data-Science-Lifecycle/15-analyzing/assignment.ipynb)和来自[出租车与豪华轿车委员会](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets)的数据。有关数据的更多信息,请参考[数据字典](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf)和[用户指南](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf)。
使用本课中的一些技术在笔记本中进行自己的EDA可以添加单元格并回答以下问题
- 数据中还有哪些因素可能会影响小费金额?
- 哪些列最有可能不需要用来回答客户的问题?
- 根据目前提供的信息,数据是否显示出任何季节性小费行为的证据?
## 评分标准
优秀 | 合格 | 需要改进
--- | --- | ---
**免责声明**
本文档使用AI翻译服务 [Co-op Translator](https://github.com/Azure/co-op-translator) 进行翻译。尽管我们努力确保翻译的准确性,但请注意,自动翻译可能包含错误或不准确之处。应以原始语言的文档作为权威来源。对于重要信息,建议使用专业人工翻译。我们不对因使用此翻译而产生的任何误解或误读承担责任。