You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
3.1 KiB
3.1 KiB
作業:數據科學情境
在這份作業中,我們希望你思考一些真實生活中的流程或問題,並探討如何使用數據科學流程來改進它。請思考以下問題:
- 你可以收集哪些數據?
- 你會如何收集這些數據?
- 你會如何存儲這些數據?這些數據的規模可能有多大?
- 你可能從這些數據中獲得哪些洞察?基於這些數據,我們可以做出哪些決策?
試著思考三個不同的問題或流程,並針對每個問題領域描述上述的每個要點。
以下是一些問題領域和問題,幫助你開始思考:
- 如何使用數據來改善學校中兒童的教育流程?
- 如何使用數據來控制疫情期間的疫苗接種?
- 如何使用數據來確保自己在工作中保持高效?
指導
填寫以下表格(如果需要,可以替換建議的問題領域為你自己的問題領域):
問題領域 | 問題 | 收集哪些數據 | 如何存儲數據 | 我們可以做出的洞察/決策 |
---|---|---|---|---|
教育 | 在大學中,通常課堂出席率較低,我們假設出席課堂的學生在考試中表現更好。我們希望刺激出席率並測試這一假設。 | 我們可以通過教室內的安全攝像頭拍攝的照片,或追蹤學生手機的藍牙/無線網絡地址來記錄出席情況。考試數據已經存儲在大學的數據庫中。 | 如果我們追蹤安全攝像頭的照片——我們需要存儲一些(5-10張)課堂期間拍攝的照片(非結構化數據),然後使用人工智能識別學生的面部(將數據轉換為結構化形式)。 | 我們可以計算每位學生的平均出席率,並查看是否與考試成績有任何相關性。我們會在概率與統計部分中進一步討論相關性。為了刺激學生出席率,我們可以在學校門戶網站上發布每週出席率排名,並在出席率最高的學生中抽獎。 |
疫苗接種 | ||||
生產力 |
我們僅提供一個答案作為示例,以便你了解此作業的期望。
評分標準
卓越 | 合格 | 需要改進 |
---|---|---|
能夠為所有問題領域識別合理的數據來源、存儲方式以及可能的決策/洞察 | 解決方案的某些方面未詳細說明,未討論數據存儲,至少描述了兩個問題領域 | 僅描述部分數據解決方案,僅考慮了一個問題領域。 |
免責聲明:
本文件使用 AI 翻譯服務 Co-op Translator 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原文文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤讀概不負責。