Fix some bugs (#334)

* Update README.zh-cn.md * Update README.zh-cn.md * Update README.zh-cn.md * Update assignment.zh-cn.md * Update README.zh-cn.md * Update assignment.zh-cn.md * Update README.zh-cn.md * Update assignment.zh-cn.md * Update README.ja.md * Update README.ko.md * Update README.md
4 years ago · 155de356ad
parent b1ea79a476
commit 155de356ad
10 changed files with 46 additions and 45 deletions
--- a/2-Regression/1-Tools/README.md
+++ b/2-Regression/1-Tools/README.md
@ -116,10 +116,10 @@ Import some libraries to help with your tasks.

 The built-in [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) includes 442 samples of data around diabetes, with 10 feature variables, some of which include:

-age: age in years
-bmi: body mass index
-bp: average blood pressure
-s1 tc: T-Cells (a type of white blood cells)
+- age: age in years
+- bmi: body mass index
+- bp: average blood pressure
+- s1 tc: T-Cells (a type of white blood cells)

 ✅ This dataset includes the concept of 'sex' as a feature variable important to research around diabetes. Many medical datasets include this type of binary classification. Think a bit about how categorizations such as this might exclude certain parts of a population from treatments.

--- a/2-Regression/1-Tools/translations/README.ja.md
+++ b/2-Regression/1-Tools/translations/README.ja.md
@ -121,10 +121,10 @@ Scikit-learnは、モデルを構築し、評価を行って実際に利用す

 組み込みの [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) には、糖尿病に関する442サンプルのデータが含まれており、10個の変数が含まれています。

-age: 年齢
-bmi: ボディマス指数
-bp: 平均血圧
-s1 tc: T細胞（白血球の一種）
+- age: 年齢
+- bmi: ボディマス指数
+- bp: 平均血圧
+- s1 tc: T細胞（白血球の一種）

 ✅ このデータセットには、糖尿病に関する研究に重要な変数として「性別」の概念が含まれています。多くの医療データセットには、このようなバイナリ分類が含まれています。このような分類が、人口のある部分を治療から排除する可能性があることについて、少し考えてみましょう。

--- a/2-Regression/1-Tools/translations/README.ko.md
+++ b/2-Regression/1-Tools/translations/README.ko.md
@ -115,10 +115,10 @@ Scikit-learn 사용하면 올바르게 모델을 만들고 사용하기 위해

 빌트-인된 [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset)은 당뇨에 대한 442개의 데이터 샘플이 있고, 10개의 feature 변수가 있으며, 그 일부는 아래와 같습니다:

-age: age in years
-bmi: body mass index
-bp: average blood pressure
-s1 tc: T-Cells (a type of white blood cells)
+- age: age in years
+- bmi: body mass index
+- bp: average blood pressure
+- s1 tc: T-Cells (a type of white blood cells)

 ✅ 이 데이터셋에는 당뇨를 연구할 때 중요한 feature 변수인 '성' 컨셉이 포함되어 있습니다. 많은 의학 데이터셋에는 binary classification의 타입이 포함됩니다. 이처럼 categorizations이 치료에서 인구의 특정 파트를 제외할 수 있는 방법에 대하여 조금 고민해보세요.

--- a/2-Regression/1-Tools/translations/README.zh-cn.md
+++ b/2-Regression/1-Tools/translations/README.zh-cn.md
@ -30,7 +30,7 @@

   > 通过学习这一系列的 [学习模块](https://docs.microsoft.com/users/jenlooper-2911/collections/mp1pagggd5qrq7?WT.mc_id=academic-15963-cxa) 熟悉 Python

-3. **按照 [这些说明] 安装 Scikit learn**(https://scikit-learn.org/stable/install.html)。由于你需要确保使用 Python3，因此建议你使用虚拟环境。注意，如果你是在 M1 Mac 上安装这个库，在上面链接的页面上有特别的说明。
+3. **按照 [这些说明](https://scikit-learn.org/stable/install.html) 安装 Scikit learn**。由于你需要确保使用 Python3，因此建议你使用虚拟环境。注意，如果你是在 M1 Mac 上安装这个库，在上面链接的页面上有特别的说明。

 4. **安装 Jupyter Notebook**。你需要 [安装 Jupyter 包](https://pypi.org/project/jupyter/)。

@ -112,10 +112,10 @@ Scikit-learn 使构建模型和评估它们的使用变得简单。它主要侧

 内置的 [糖尿病数据集](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) 包含 442 个围绕糖尿病的数据样本，具有 10 个特征变量，其中包括：

-age：岁数
-bmi：体重指数
-bp：平均血压
-s1 tc：T 细胞（一种白细胞）
+- age：岁数
+- bmi：体重指数
+- bp：平均血压
+- s1 tc：T 细胞（一种白细胞）

 ✅ 该数据集包括“性别”的概念，作为对糖尿病研究很重要的特征变量。许多医学数据集包括这种类型的二元分类。想一想诸如此类的分类如何将人群的某些部分排除在治疗之外。

@ -204,4 +204,4 @@ s1 tc：T 细胞（一种白细胞）

 ## 任务  

-[不同的数据集](../assignment.md)
+[不同的数据集](./assignment.zh-cn.md)
--- a/2-Regression/2-Data/translations/README.zh-cn.md
+++ b/2-Regression/2-Data/translations/README.zh-cn.md
@ -1,6 +1,6 @@
 # 使用 Scikit-learn 构建回归模型：准备和可视化数据

-> ![数据可视化信息图](../images/data-visualization.png)
+![数据可视化信息图](../images/data-visualization.png)
 > 作者 [Dasani Madipalli](https://twitter.com/dasani_decoded)

 ## [课前测](https://white-water-09ec41f0f.azurestaticapps.net/quiz/11/)
@ -38,7 +38,7 @@

 ## 练习 - 分析南瓜数据

-让我们使用 [Pandas](https://pandas.pydata.org/)，（“Python 数据分析”的意思）一个非常有用的工具，用于分析和准备南瓜数据。
+让我们使用 [Pandas](https://pandas.pydata.org/)，（“Python 数据分析” Python Data Analysis 的意思）一个非常有用的工具，用于分析和准备南瓜数据。

 ### 首先，检查遗漏的日期

@ -200,4 +200,4 @@

 ## 任务

-[探索可视化](../assignment.md)
+[探索可视化](./assignment.zh-cn.md)
--- a/2-Regression/3-Linear/translations/README.zh-cn.md
+++ b/2-Regression/3-Linear/translations/README.zh-cn.md
@ -24,6 +24,7 @@
 - 什么时候买南瓜最好？
 - 一箱微型南瓜的价格是多少？
 - 我应该买半蒲式耳还是 1 1/9 蒲式耳？
+
 让我们继续深入研究这些数据。

 在上一课中，你创建了一个 Pandas dataframe 并用原始数据集的一部分填充它，按蒲式耳标准化定价。但是，通过这样做，你只能收集大约 400 个数据点，而且只能收集秋季月份的数据。
@ -337,4 +338,4 @@ Scikit-learn 包含一个用于构建多项式回归模型的有用 API - `make_

 ## 任务

-[构建模型](../assignment.md)
+[构建模型](./assignment.zh-cn.md)
--- a/2-Regression/4-Logistic/translations/README.zh-cn.md
+++ b/2-Regression/4-Logistic/translations/README.zh-cn.md
@ -297,4 +297,4 @@ print(auc)

 ## 任务

-[重试此回归](../assignment.md)
+[重试此回归](./assignment.zh-cn.md)