# 小規模な糖尿病研究 この課題では、[こちら](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html)から取得した糖尿病患者の小規模なデータセットを使用します。 | | 年齢 (AGE) | 性別 (SEX) | BMI | 血圧 (BP) | S1 | S2 | S3 | S4 | S5 | S6 | Y | |---|------------|------------|-----|-----------|----|----|----|----|----|----|----| | 0 | 59 | 2 | 32.1| 101. | 157| 93.2| 38.0| 4. | 4.8598| 87 | 151 | | 1 | 48 | 1 | 21.6| 87.0 | 183| 103.2| 70. | 3. | 3.8918| 69 | 75 | | 2 | 72 | 2 | 30.5| 93.0 | 156| 93.6| 41.0| 4.0 | 4. | 85 | 141 | | ... | ... | ... | ... | ... | ...| ... | ... | ... | ... | ...| ... | ## 指示 * [assignment notebook](../../../../1-Introduction/04-stats-and-probability/assignment.ipynb) をjupyter notebook環境で開いてください。 * ノートブックに記載されているすべてのタスクを完了してください。具体的には以下の内容です: * [ ] すべての値の平均値と分散を計算する * [ ] 性別ごとにBMI、BP、Yのボックスプロットを作成する * [ ] 年齢、性別、BMI、Y変数の分布を調べる * [ ] 各変数と病気の進行度 (Y) の相関をテストする * [ ] 糖尿病の進行度が男性と女性で異なるという仮説を検証する ## 評価基準 優秀 | 適切 | 改善が必要 --- | --- | -- | すべての必要なタスクが完了し、グラフで視覚化され、説明が付いている | ほとんどのタスクが完了しているが、グラフや得られた値からの説明や考察が不足している | 平均値や分散の計算、基本的なプロットなどの基本的なタスクのみが完了しており、データからの結論がない **免責事項**: この文書は、AI翻訳サービス [Co-op Translator](https://github.com/Azure/co-op-translator) を使用して翻訳されています。正確性を追求しておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知ください。元の言語で記載された文書が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。この翻訳の使用に起因する誤解や誤解釈について、当社は責任を負いません。