# 소당뇨병 연구 이 과제에서 우리는 [여기](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html)에서 가져온 당뇨병 환자의 작은 데이터셋으로 작업할 것입니다. | | AGE | SEX | BMI | BP | S1 | S2 | S3 | S4 | S5 | S6 | Y | |---|-----|-----|-----|----|----|----|----|----|----|----|----| | 0 | 59 | 2 | 32.1 | 101. | 157 | 93.2 | 38.0 | 4. | 4.8598 | 87 | 151 | | 1 | 48 | 1 | 21.6 | 87.0 | 183 | 103.2 | 70. | 3. | 3.8918 | 69 | 75 | | 2 | 72 | 2 | 30.5 | 93.0 | 156 | 93.6 | 41.0 | 4.0 | 4. | 85 | 141 | | ... | ... | ... | ... | ...| ...| ...| ...| ...| ...| ...| ... | ## 지침 * jupyter notebook 환경에서 [과제노트](assignment.ipynb) 열기 * notebook 에 나열된 모든 작업, 즉: [ ] 모든 값의 평균값과 분산 계산 [ ] 성별에 따른 BMI, BP 및 Y에 대한 플롯 상자 그림 [ ] 연령, 성별, BMI 및 Y 변수의 분포는 무엇입니까? [ ] 다른 변수와 질병 진행 사이의 상관 관계 테스트(Y) [ ] 당뇨병 진행 정도가 남녀 간에 다르다는 가설 검정 ## 기준표 모범 | 충분 | 개선 필요 --- | --- | -- | 필요한 모든 작업이 완료되고 그래픽으로 설명 및 설명 되어 있음 | 대부분의 작업이 완료되었으며 그래프 및/또는 얻은 값의 설명이나 요약이 누락되었습니다. | 평균/분산 계산 및 기본 도표와 같은 기본 작업만 완료되어 있으며 데이터에서 결론이 내려지지 않습니다.