@ -121,10 +121,10 @@ Scikit-learnは、モデルを構築し、評価を行って実際に利用す
組み込みの [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) には、糖尿病に関する442サンプルのデータが含まれており、10個の変数が含まれています。
age: 年齢
bmi: ボディマス指数
bp: 平均血圧
s1 tc: T細胞(白血球の一種)
- age: 年齢
- bmi: ボディマス指数
- bp: 平均血圧
- s1 tc: T細胞(白血球の一種)
✅ このデータセットには、糖尿病に関する研究に重要な変数として「性別」の概念が含まれています。多くの医療データセットには、このようなバイナリ分類が含まれています。このような分類が、人口のある部分を治療から排除する可能性があることについて、少し考えてみましょう。