You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

3.2 KiB

作業:數據科學情境

在這次的作業中,我們希望你思考一些現實生活中的流程或問題,涵蓋不同的問題領域,並考慮如何利用數據科學流程來改進它們。請思考以下問題:

  1. 你可以收集哪些數據?
  2. 你會如何收集這些數據?
  3. 你會如何儲存這些數據?這些數據的規模可能有多大?
  4. 你可能從這些數據中獲得哪些洞察?我們可以根據這些數據做出哪些決策?

試著思考三個不同的問題/流程,並針對每個問題領域描述上述每一點。

以下是一些問題領域和問題,幫助你開始思考:

  1. 如何利用數據改進學校中兒童的教育流程?
  2. 如何利用數據在疫情期間控制疫苗接種?
  3. 如何利用數據確保自己在工作中保持高效?

指導說明

請填寫以下表格(如果需要,可以用自己的問題領域替代建議的問題領域):

問題領域 問題 收集哪些數據 如何儲存數據 我們可以做出的洞察/決策
教育 在大學中,我們通常發現課堂出勤率較低,我們假設出勤率較高的學生在考試中的表現會更好。我們希望提高出勤率並驗證這一假設。 我們可以通過課堂上的監控攝像頭拍攝的照片來追蹤出勤率,或者通過追蹤學生手機的藍牙/WiFi 地址來記錄出勤情況。考試數據已經存儲在大學的數據庫中。 如果我們追蹤監控攝像頭的圖像我們需要儲存一些5-10 張)課堂期間的照片(非結構化數據),然後使用 AI 識別學生的臉部(將數據轉換為結構化形式)。 我們可以計算每位學生的平均出勤率,並查看是否與考試成績有任何相關性。我們會在概率與統計部分進一步討論相關性。為了提高學生的出勤率,我們可以在學校門戶網站上發布每週出勤排名,並在出勤率最高的學生中抽獎。
疫苗接種
生產力

我們提供了一個答案作為範例,讓你了解這次作業的期望。

評分標準

優秀 合格 需要改進
能夠為所有問題領域識別出合理的數據來源、數據儲存方式以及可能的決策/洞察 解決方案的某些方面不夠詳細,未討論數據儲存,至少描述了 2 個問題領域 僅描述了部分數據解決方案,僅考慮了一個問題領域。

免責聲明
本文件使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋不承擔責任。