You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
35 lines
3.1 KiB
35 lines
3.1 KiB
<!--
|
|
CO_OP_TRANSLATOR_METADATA:
|
|
{
|
|
"original_hash": "dc8f035ce92e4eaa078ab19caa68267a",
|
|
"translation_date": "2025-08-25T16:31:55+00:00",
|
|
"source_file": "2-Working-With-Data/07-python/assignment.md",
|
|
"language_code": "ko"
|
|
}
|
|
-->
|
|
# 파이썬을 활용한 데이터 처리 과제
|
|
|
|
이 과제에서는 우리가 도전 과제에서 개발하기 시작한 코드를 확장하여 작성해 보도록 하겠습니다. 과제는 두 부분으로 구성되어 있습니다:
|
|
|
|
## COVID-19 확산 모델링
|
|
|
|
- [ ] 5-6개 국가의 *R* 그래프를 한 그래프에 비교하거나, 여러 그래프를 나란히 배치하여 그리기
|
|
- [ ] 사망자 수와 회복자 수가 감염자 수와 어떻게 상관관계가 있는지 확인하기
|
|
- [ ] 감염률과 사망률을 시각적으로 비교하여 전형적인 질병 지속 기간을 알아내고, 이상치를 찾아보기. 이를 위해 여러 국가의 데이터를 살펴볼 필요가 있을 수 있음.
|
|
- [ ] 치명률을 계산하고 시간이 지남에 따라 어떻게 변화하는지 확인하기. *질병의 지속 기간(일 단위)을 고려하여 한 시계열 데이터를 이동시킨 후 계산하는 것이 유용할 수 있음*
|
|
|
|
## COVID-19 논문 분석
|
|
|
|
- [ ] 다양한 약물의 동시 발생 행렬(co-occurrence matrix)을 작성하고, 어떤 약물들이 자주 함께 언급되는지 확인하기 (예: 하나의 초록에서 언급된 경우). 약물 및 진단에 대한 동시 발생 행렬을 작성하는 코드를 수정할 수 있음.
|
|
- [ ] 이 행렬을 히트맵으로 시각화하기.
|
|
- [ ] 추가 목표로, [코드 다이어그램](https://en.wikipedia.org/wiki/Chord_diagram)을 사용하여 약물의 동시 발생을 시각화하기. [이 라이브러리](https://pypi.org/project/chord/)가 코드 다이어그램을 그리는 데 도움이 될 수 있음.
|
|
- [ ] 또 다른 추가 목표로, 정규 표현식을 사용하여 다양한 약물의 복용량(예: *하루에 클로로퀸 400mg 복용*에서 **400mg**)을 추출하고, 약물별로 다른 복용량을 보여주는 데이터프레임을 작성하기. **참고**: 약물 이름과 가까운 텍스트 영역에 있는 숫자 값을 고려할 것.
|
|
|
|
## 평가 기준
|
|
|
|
우수 | 적절 | 개선 필요
|
|
--- | --- | -- |
|
|
모든 작업이 완료되고, 그래프와 함께 설명되며, 최소한 두 가지 추가 목표 중 하나를 포함 | 5개 이상의 작업이 완료되었으나 추가 목표는 시도되지 않았거나 결과가 명확하지 않음 | 3개 이상 5개 미만의 작업이 완료되었으며, 시각화가 요점을 설명하는 데 도움이 되지 않음
|
|
|
|
**면책 조항**:
|
|
이 문서는 AI 번역 서비스 [Co-op Translator](https://github.com/Azure/co-op-translator)를 사용하여 번역되었습니다. 정확성을 위해 최선을 다하고 있지만, 자동 번역에는 오류나 부정확성이 포함될 수 있습니다. 원본 문서의 원어 버전을 권위 있는 출처로 간주해야 합니다. 중요한 정보의 경우, 전문적인 인간 번역을 권장합니다. 이 번역 사용으로 인해 발생하는 오해나 잘못된 해석에 대해 책임을 지지 않습니다. |