From 25909253d2ddb425224428324d0188183fc2cbfd Mon Sep 17 00:00:00 2001 From: Jay Patel <59785863+jaypatel31@users.noreply.github.com> Date: Wed, 4 Aug 2021 19:29:00 +0530 Subject: [PATCH] Update README.ja.md --- .../4-techniques-of-ML/translations/README.ja.md | 10 +++++++--- 1 file changed, 7 insertions(+), 3 deletions(-) diff --git a/1-Introduction/4-techniques-of-ML/translations/README.ja.md b/1-Introduction/4-techniques-of-ML/translations/README.ja.md index 0e0a1bca9..b964781de 100644 --- a/1-Introduction/4-techniques-of-ML/translations/README.ja.md +++ b/1-Introduction/4-techniques-of-ML/translations/README.ja.md @@ -40,9 +40,13 @@ ✅ データを集めて処理した後は、その形で意図した質問に対応できるかどうかを確認してみましょう。[クラスタリング](../../../5-Clustering/1-Visualize/README.md) の講義でわかるように、データは与えられたタスクに対して上手く機能しないかもしれません! -### 特徴量の選択 +### 機能とターゲット + +フィーチャは、データの測定可能なプロパティです。多くのデータセットでは、'日付' 'サイズ' や '色' のような列見出しとして表現されます。通常、コードでは `X` として表されるフィーチャ変数は、モデルのトレーニングに使用される入力変数を表します -[特徴](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) とは、測定可能なデータの特性のことです。多くのデータセットでは、「日付」「大きさ」「色」などの列の見出しとして表されています。コード上では `y` で表されることが多い特徴量は、データに関する次のような質問への回答を意味します。「12月はどんな **色** のカボチャが一番安いか?」「サンフランシスコでは、どの地域が最も不動産の **価格** が高いか?」 +ターゲットは、予測しようとしているものです。ターゲットは通常、コードで`y`として表され、あなたのデータを尋ねようとしている質問に対する答えを表します:12月に、どの色のカボチャが最も安くなりますか?サンフランシスコでは、どの地域が最高の不動産価格を持つでしょうか?ターゲットはラベル属性とも呼ばれることもあります。 + +### 特徴量の選択 🎓 **特徴選択と特徴抽出** モデルを構築する際にどの変数を選ぶべきかは、どうすればわかるでしょうか?最も性能の高いモデルのためには、適した変数を選択する特徴選択や特徴抽出のプロセスをたどることになるでしょう。しかし、これらは同じものではありません。「特徴抽出は元の特徴の機能から新しい特徴を作成するのに対し、特徴選択は特徴の一部を返すものです。」 ([出典](https://wikipedia.org/wiki/Feature_selection)) @@ -68,7 +72,7 @@ ### モデルを学習する -訓練データを用意したので、モデルを作成するためにそれを「適合」させる準備が整いました。多くの機械学習ライブラリには 'model.fit' というコードがあることに気づくでしょう。データを(通常は 'X' で表す)値の配列と(通常は 'y' で表す)特徴量として渡すときです。 +トレーニングデータを使用して、モデルを作成するために「フィット」する準備が整いました。多くの ML ライブラリでは、コード 'model.fit' が見つかります - この時点で、値の配列 (通常は `X`) とターゲット変数 (通常は `y`) として機能変数を送信します。 ### モデルを評価する