You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
2.4 KiB
2.4 KiB
使用 Python 處理數據的作業
在這份作業中,我們將要求你詳細說明我們在挑戰中開始開發的代碼。作業分為兩部分:
COVID-19 傳播模型
- 在一個圖表中繪製 5-6 個不同國家的 R 圖表進行比較,或者使用多個並排的圖表。
- 查看死亡人數和康復人數如何與感染病例數量相關。
- 通過視覺上相關感染率和死亡率並尋找一些異常,找出典型疾病持續的時間。你可能需要查看不同國家的數據來得出結論。
- 計算致死率以及它隨時間的變化。你可能需要考慮疾病持續的天數,將一個時間序列進行移位後再進行計算。
COVID-19 論文分析
- 建立不同藥物的共現矩陣,查看哪些藥物經常一起出現(即在同一摘要中提到)。你可以修改用於建立藥物和診斷共現矩陣的代碼。
- 使用熱圖可視化這個矩陣。
- 作為額外挑戰,使用 chord diagram 可視化藥物的共現情況。這個庫 可能可以幫助你繪製弦圖。
- 作為另一個額外挑戰,使用正則表達式提取不同藥物的劑量(例如 400mg 在 每天服用 400mg 氯喹 中),並建立一個數據框,顯示不同藥物的不同劑量。注意:考慮與藥物名稱在文本中接近的數值。
評分標準
卓越 | 合格 | 需要改進 |
---|---|---|
所有任務完成,圖形化展示並解釋清楚,包括至少完成一個額外挑戰 | 完成超過 5 項任務,但未嘗試額外挑戰,或者結果不清晰 | 完成少於 5 項(但超過 3 項)任務,且可視化未能有效展示重點 |
免責聲明:
本文件已使用人工智能翻譯服務 Co-op Translator 進行翻譯。儘管我們致力於提供準確的翻譯,請注意自動翻譯可能包含錯誤或不準確之處。原始語言的文件應被視為權威來源。對於重要資訊,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或錯誤解釋概不負責。