You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
2.8 KiB
2.8 KiB
答えを探る
これは前回のレッスンの課題の続きで、データセットを簡単に見たところから始まります。今回はデータをさらに深く掘り下げていきます。
再度、クライアントが知りたい質問は次のとおりです:
ニューヨーク市のイエロータクシーの乗客は、冬と夏のどちらで運転手にチップを多く渡すのか?
あなたのチームはデータサイエンスライフサイクルの分析段階にあり、データセットに対して探索的データ分析(EDA)を行う責任があります。2019年1月と7月の200件のタクシー取引が含まれたノートブックとデータセットが提供されています。
手順
このディレクトリにはノートブックとタクシー&リムジン委員会からのデータが含まれています。データに関する詳細は、データセットの辞書およびユーザーガイドを参照してください。
このレッスンで学んだいくつかの手法を使って、ノートブック内で独自のEDAを行い(必要に応じてセルを追加してください)、以下の質問に答えてください:
- チップ額に影響を与える可能性のある他の要因は何ですか?
- クライアントの質問に答えるために不要と思われる列はどれですか?
- 現時点で提供されている情報に基づいて、季節ごとのチップ行動に関する証拠がデータに見られますか?
評価基準
優秀 | 適切 | 改善が必要 |
---|
免責事項:
この文書は、AI翻訳サービス Co-op Translator を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知ください。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当方は責任を負いません。