You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
2.4 KiB
2.4 KiB
使用 Python 進行數據處理的作業
在這份作業中,我們將要求您詳細說明我們在挑戰中開始開發的代碼。作業分為兩部分:
COVID-19 傳播模型
- 在一個圖中繪製 5-6 個不同國家的 R 圖表進行比較,或者使用多個並排的圖表。
- 查看死亡人數和康復人數與感染病例數之間的關聯。
- 通過視覺上比較感染率和死亡率,並尋找一些異常情況,找出典型疾病持續的時間。您可能需要查看不同國家的數據來得出結論。
- 計算致死率以及其隨時間的變化。您可能需要考慮疾病持續的天數,將一個時間序列進行偏移後再進行計算。
COVID-19 論文分析
- 建立不同藥物的共現矩陣,並查看哪些藥物經常一起出現(即在同一摘要中提到)。您可以修改用於建立藥物和診斷共現矩陣的代碼。
- 使用熱圖可視化此矩陣。
- 作為額外目標,使用 chord diagram 可視化藥物的共現情況。此庫 可能有助於您繪製 chord diagram。
- 作為另一個額外目標,使用正則表達式提取不同藥物的劑量(例如 400mg 在 每天服用 400mg 氯喹 中),並建立一個數據框,顯示不同藥物的不同劑量。注意:考慮與藥物名稱在文本中接近的數值。
評分標準
卓越 | 合格 | 需要改進 |
---|---|---|
所有任務均完成,並進行圖形化展示和解釋,包括至少完成一個額外目標 | 完成超過 5 項任務,但未嘗試額外目標,或結果不清晰 | 完成少於 5 項(但超過 3 項)任務,且可視化未能有效展示重點 |
免責聲明:
本文件使用 AI 翻譯服務 Co-op Translator 進行翻譯。我們致力於提供準確的翻譯,但請注意,自動翻譯可能包含錯誤或不準確之處。應以原始語言的文件作為權威來源。對於關鍵資訊,建議尋求專業人工翻譯。我們對因使用此翻譯而產生的任何誤解或錯誤解讀概不負責。