You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
2.4 KiB
2.4 KiB
使用 Python 進行數據處理的作業
在這份作業中,我們將要求您詳細說明我們在挑戰中開始開發的代碼。作業分為兩部分:
COVID-19 傳播建模
- 在一個圖表中繪製 5-6 個不同國家的 R 圖表進行比較,或者使用多個並排的圖表。
- 查看死亡人數和康復人數與感染病例數之間的相關性。
- 通過視覺化比較感染率和死亡率,找出疾病通常持續的時間,並尋找一些異常情況。您可能需要查看不同國家的數據來得出結論。
- 計算致死率以及其隨時間的變化。您可能需要考慮疾病的持續天數,將一個時間序列進行偏移後再進行計算。
COVID-19 論文分析
- 構建不同藥物的共現矩陣,查看哪些藥物經常一起出現(即在同一摘要中提到)。您可以修改用於構建藥物和診斷共現矩陣的代碼。
- 使用熱圖可視化此矩陣。
- 作為進階目標,使用 chord diagram 可視化藥物的共現情況。這個庫 可能會幫助您繪製弦圖。
- 作為另一個進階目標,使用正則表達式提取不同藥物的劑量(例如 每天服用 400mg 氯喹 中的 400mg),並構建一個數據框架,顯示不同藥物的不同劑量。注意:考慮藥物名稱附近的數值。
評分標準
卓越 | 合格 | 需要改進 |
---|---|---|
所有任務均完成,並附有圖形說明和解釋,包括至少完成一個進階目標 | 完成超過 5 項任務,但未嘗試進階目標,或結果不夠清晰 | 完成少於 5 項(但超過 3 項)任務,且可視化未能有效展示重點 |
免責聲明:
本文件使用 AI 翻譯服務 Co-op Translator 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解讀概不負責。