|
|
@ -2,7 +2,9 @@
|
|
|
|
|
|
|
|
|
|
|
|

|
|
|
|

|
|
|
|
> 作者 [Dasani Madipalli](https://twitter.com/dasani_decoded)
|
|
|
|
> 作者 [Dasani Madipalli](https://twitter.com/dasani_decoded)
|
|
|
|
|
|
|
|
|
|
|
|
## [课前测](https://white-water-09ec41f0f.azurestaticapps.net/quiz/13/)
|
|
|
|
## [课前测](https://white-water-09ec41f0f.azurestaticapps.net/quiz/13/)
|
|
|
|
|
|
|
|
|
|
|
|
### 介绍
|
|
|
|
### 介绍
|
|
|
|
|
|
|
|
|
|
|
|
到目前为止,你已经通过从我们将在本课程中使用的南瓜定价数据集收集的样本数据探索了什么是回归。你还使用 Matplotlib 对其进行了可视化。
|
|
|
|
到目前为止,你已经通过从我们将在本课程中使用的南瓜定价数据集收集的样本数据探索了什么是回归。你还使用 Matplotlib 对其进行了可视化。
|
|
|
@ -145,6 +147,7 @@ lin_pumpkins
|
|
|
|
X = lin_pumpkins.values[:, :1]
|
|
|
|
X = lin_pumpkins.values[:, :1]
|
|
|
|
y = lin_pumpkins.values[:, 1:2]
|
|
|
|
y = lin_pumpkins.values[:, 1:2]
|
|
|
|
```
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
✅ 这里发生了什么?你正在使用 [Python slice notation](https://stackoverflow.com/questions/509211/understanding-slice-notation/509295#509295) 来创建数组来填充`X`和`y`。
|
|
|
|
✅ 这里发生了什么?你正在使用 [Python slice notation](https://stackoverflow.com/questions/509211/understanding-slice-notation/509295#509295) 来创建数组来填充`X`和`y`。
|
|
|
|
|
|
|
|
|
|
|
|
2. 接下来,开始回归模型构建例程:
|
|
|
|
2. 接下来,开始回归模型构建例程:
|
|
|
@ -181,6 +184,7 @@ lin_pumpkins
|
|
|
|
|
|
|
|
|
|
|
|
plt.show()
|
|
|
|
plt.show()
|
|
|
|
```
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|

|
|
|
|

|
|
|
|
|
|
|
|
|
|
|
|
4. 针对假设的品种测试模型:
|
|
|
|
4. 针对假设的品种测试模型:
|
|
|
@ -212,6 +216,7 @@ lin_pumpkins
|
|
|
|
多项式回归创建一条曲线以更好地拟合非线性数据。
|
|
|
|
多项式回归创建一条曲线以更好地拟合非线性数据。
|
|
|
|
|
|
|
|
|
|
|
|
1. 让我们重新创建一个填充了原始南瓜数据片段的dataframe:
|
|
|
|
1. 让我们重新创建一个填充了原始南瓜数据片段的dataframe:
|
|
|
|
|
|
|
|
|
|
|
|
```python
|
|
|
|
```python
|
|
|
|
new_columns = ['Variety', 'Package', 'City', 'Month', 'Price']
|
|
|
|
new_columns = ['Variety', 'Package', 'City', 'Month', 'Price']
|
|
|
|
poly_pumpkins = new_pumpkins.drop([c for c in new_pumpkins.columns if c not in new_columns], axis='columns')
|
|
|
|
poly_pumpkins = new_pumpkins.drop([c for c in new_pumpkins.columns if c not in new_columns], axis='columns')
|
|
|
@ -227,6 +232,7 @@ lin_pumpkins
|
|
|
|
corr = poly_pumpkins.corr()
|
|
|
|
corr = poly_pumpkins.corr()
|
|
|
|
corr.style.background_gradient(cmap='coolwarm')
|
|
|
|
corr.style.background_gradient(cmap='coolwarm')
|
|
|
|
```
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
这段代码创建了一个热图:
|
|
|
|
这段代码创建了一个热图:
|
|
|
|

|
|
|
|

|
|
|
|
|
|
|
|
|
|
|
@ -306,6 +312,7 @@ Scikit-learn包含一个用于构建多项式回归模型的有用API - `make_pi
|
|
|
|
```python
|
|
|
|
```python
|
|
|
|
pipeline.predict( np.array([ [2.75] ]) )
|
|
|
|
pipeline.predict( np.array([ [2.75] ]) )
|
|
|
|
```
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
你会得到这样的预测:
|
|
|
|
你会得到这样的预测:
|
|
|
|
|
|
|
|
|
|
|
|
```output
|
|
|
|
```output
|
|
|
@ -317,6 +324,7 @@ Scikit-learn包含一个用于构建多项式回归模型的有用API - `make_pi
|
|
|
|
🏆 干得不错!你在一节课中创建了两个回归模型。在回归的最后一节中,你将了解逻辑回归以确定类别。
|
|
|
|
🏆 干得不错!你在一节课中创建了两个回归模型。在回归的最后一节中,你将了解逻辑回归以确定类别。
|
|
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
## 🚀挑战
|
|
|
|
## 🚀挑战
|
|
|
|
|
|
|
|
|
|
|
|
在此 notebook 中测试几个不同的变量,以查看相关性与模型准确性的对应关系。
|
|
|
|
在此 notebook 中测试几个不同的变量,以查看相关性与模型准确性的对应关系。
|
|
|
|