# 課題: データサイエンスのシナリオ この最初の課題では、現実のプロセスや問題について考え、それをデータサイエンスのプロセスを使ってどのように改善できるかを考えてもらいます。以下の点について考えてみてください: 1. どのようなデータを収集できるか? 1. どのようにデータを収集するか? 1. データをどのように保存するか?データの規模はどのくらいになりそうか? 1. このデータからどのような洞察を得られるか?そのデータに基づいてどのような意思決定が可能か? 3つの異なる問題やプロセスについて考え、それぞれの問題領域について上記のポイントを説明してください。 以下は、考え始めるための問題領域と問題の例です: 1. 学校で子どもたちの教育プロセスを改善するために、データをどのように活用できるか? 1. パンデミック中のワクチン接種を管理するために、データをどのように活用できるか? 1. 職場での生産性を確保するために、データをどのように活用できるか? ## 指示 以下の表を埋めてください(必要に応じて、提案された問題領域を自分のものに置き換えてください): | 問題領域 | 問題 | 収集するデータ | データの保存方法 | 得られる洞察/意思決定 | |----------|------|----------------|------------------|-----------------------| | 教育 | 大学では講義への出席率が低い傾向があり、講義に出席する学生の方が平均的に試験で良い成績を収めるという仮説があります。出席率を向上させ、この仮説を検証したいと考えています。 | 教室内で撮影された防犯カメラの写真や、教室内での学生のモバイル端末のBluetooth/Wi-Fiアドレスを追跡することで出席を記録できます。試験データはすでに大学のデータベースに存在します。 | 防犯カメラの画像を追跡する場合、授業中に数枚(5~10枚)の写真を保存する必要があります(非構造化データ)。その後、AIを使用して学生の顔を識別し、データを構造化形式に変換します。 | 各学生の平均出席データを計算し、それが試験の成績と相関があるかどうかを確認できます。相関については[確率と統計](../../04-stats-and-probability/README.md)のセクションで詳しく説明します。出席率を向上させるために、毎週の出席率ランキングを学校のポータルに公開し、出席率が最も高い学生の中から抽選で賞品を提供することができます。 | | ワクチン接種 | | | | | | 生産性 | | | | | > *この課題で期待される内容を理解してもらうために、1つの回答例を提供しています。* ## 評価基準 優秀 | 適切 | 改善が必要 --- | --- | -- | すべての問題領域について、合理的なデータソース、データの保存方法、可能な意思決定/洞察を特定できている | 解決策の一部が詳細に欠けている、データ保存についての議論がない、少なくとも2つの問題領域が説明されている | データソリューションの一部のみが説明されている、1つの問題領域しか考慮されていない **免責事項**: この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知ください。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤った解釈について、当方は一切の責任を負いません。