Fix some bugs (#334)

* Update README.zh-cn.md

* Update README.zh-cn.md

* Update README.zh-cn.md

* Update assignment.zh-cn.md

* Update README.zh-cn.md

* Update assignment.zh-cn.md

* Update README.zh-cn.md

* Update assignment.zh-cn.md

* Update README.ja.md

* Update README.ko.md

* Update README.md
pull/335/head
Flex Zhong 3 years ago committed by GitHub
parent b1ea79a476
commit 155de356ad
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

@ -116,10 +116,10 @@ Import some libraries to help with your tasks.
The built-in [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) includes 442 samples of data around diabetes, with 10 feature variables, some of which include:
age: age in years
bmi: body mass index
bp: average blood pressure
s1 tc: T-Cells (a type of white blood cells)
- age: age in years
- bmi: body mass index
- bp: average blood pressure
- s1 tc: T-Cells (a type of white blood cells)
✅ This dataset includes the concept of 'sex' as a feature variable important to research around diabetes. Many medical datasets include this type of binary classification. Think a bit about how categorizations such as this might exclude certain parts of a population from treatments.

@ -121,10 +121,10 @@ Scikit-learnは、モデルを構築し、評価を行って実際に利用す
組み込みの [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) には、糖尿病に関する442サンプルのデータが含まれており、10個の変数が含まれています。
age: 年齢
bmi: ボディマス指数
bp: 平均血圧
s1 tc: T細胞白血球の一種
- age: 年齢
- bmi: ボディマス指数
- bp: 平均血圧
- s1 tc: T細胞白血球の一種
✅ このデータセットには、糖尿病に関する研究に重要な変数として「性別」の概念が含まれています。多くの医療データセットには、このようなバイナリ分類が含まれています。このような分類が、人口のある部分を治療から排除する可能性があることについて、少し考えてみましょう。

@ -115,10 +115,10 @@ Scikit-learn 사용하면 올바르게 모델을 만들고 사용하기 위해
빌트-인된 [diabetes dataset](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset)은 당뇨에 대한 442개의 데이터 샘플이 있고, 10개의 feature 변수가 있으며, 그 일부는 아래와 같습니다:
age: age in years
bmi: body mass index
bp: average blood pressure
s1 tc: T-Cells (a type of white blood cells)
- age: age in years
- bmi: body mass index
- bp: average blood pressure
- s1 tc: T-Cells (a type of white blood cells)
✅ 이 데이터셋에는 당뇨를 연구할 때 중요한 feature 변수인 '성' 컨셉이 포함되어 있습니다. 많은 의학 데이터셋에는 binary classification의 타입이 포함됩니다. 이처럼 categorizations이 치료에서 인구의 특정 파트를 제외할 수 있는 방법에 대하여 조금 고민해보세요.

@ -30,7 +30,7 @@
> 通过学习这一系列的 [学习模块](https://docs.microsoft.com/users/jenlooper-2911/collections/mp1pagggd5qrq7?WT.mc_id=academic-15963-cxa) 熟悉 Python
3. **按照 [这些说明] 安装 Scikit learn**(https://scikit-learn.org/stable/install.html)。由于你需要确保使用 Python3因此建议你使用虚拟环境。注意如果你是在 M1 Mac 上安装这个库,在上面链接的页面上有特别的说明。
3. **按照 [这些说明](https://scikit-learn.org/stable/install.html) 安装 Scikit learn**。由于你需要确保使用 Python3因此建议你使用虚拟环境。注意如果你是在 M1 Mac 上安装这个库,在上面链接的页面上有特别的说明。
4. **安装 Jupyter Notebook**。你需要 [安装 Jupyter 包](https://pypi.org/project/jupyter/)。
@ -112,10 +112,10 @@ Scikit-learn 使构建模型和评估它们的使用变得简单。它主要侧
内置的 [糖尿病数据集](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) 包含 442 个围绕糖尿病的数据样本,具有 10 个特征变量,其中包括:
age岁数
bmi体重指数
bp平均血压
s1 tcT 细胞(一种白细胞)
- age岁数
- bmi体重指数
- bp平均血压
- s1 tcT 细胞(一种白细胞)
✅ 该数据集包括“性别”的概念,作为对糖尿病研究很重要的特征变量。许多医学数据集包括这种类型的二元分类。想一想诸如此类的分类如何将人群的某些部分排除在治疗之外。
@ -204,4 +204,4 @@ s1 tcT 细胞(一种白细胞)
## 任务
[不同的数据集](../assignment.md)
[不同的数据集](./assignment.zh-cn.md)

@ -1,6 +1,6 @@
# 使用 Scikit-learn 构建回归模型:准备和可视化数据
> ![数据可视化信息图](../images/data-visualization.png)
![数据可视化信息图](../images/data-visualization.png)
> 作者 [Dasani Madipalli](https://twitter.com/dasani_decoded)
## [课前测](https://white-water-09ec41f0f.azurestaticapps.net/quiz/11/)
@ -38,7 +38,7 @@
## 练习 - 分析南瓜数据
让我们使用 [Pandas](https://pandas.pydata.org/)“Python 数据分析”的意思)一个非常有用的工具,用于分析和准备南瓜数据。
让我们使用 [Pandas](https://pandas.pydata.org/)“Python 数据分析” Python Data Analysis 的意思)一个非常有用的工具,用于分析和准备南瓜数据。
### 首先,检查遗漏的日期
@ -200,4 +200,4 @@
## 任务
[探索可视化](../assignment.md)
[探索可视化](./assignment.zh-cn.md)

@ -24,6 +24,7 @@
- 什么时候买南瓜最好?
- 一箱微型南瓜的价格是多少?
- 我应该买半蒲式耳还是 1 1/9 蒲式耳?
让我们继续深入研究这些数据。
在上一课中,你创建了一个 Pandas dataframe 并用原始数据集的一部分填充它,按蒲式耳标准化定价。但是,通过这样做,你只能收集大约 400 个数据点,而且只能收集秋季月份的数据。
@ -337,4 +338,4 @@ Scikit-learn 包含一个用于构建多项式回归模型的有用 API - `make_
## 任务
[构建模型](../assignment.md)
[构建模型](./assignment.zh-cn.md)

@ -297,4 +297,4 @@ print(auc)
## 任务
[重试此回归](../assignment.md)
[重试此回归](./assignment.zh-cn.md)

Loading…
Cancel
Save