Ddd. 几何函数间隔推导

pull/2/head
benjas 4 years ago
parent b02e556281
commit 3f8595aa35

@ -114,4 +114,57 @@ Summarization
2. 构造出来的超平面使得其与最近的点的距离最大。
3. SVM也可划分非线性数据集。
4. 它通过高维中的线性超平面再低维中的投影来完成非线性的划分。因此从直观上来讲,我们的模型必定有一个升维的操作。
5. 这是总体的概念。
5. 这是总体的概念。
### 支持向量机
Support vector machines
函数间隔:![1619585515305](assets/1619585515305.png)
几何间隔:![1619585510005](assets/1619585510005.png)
这里使用的是几何间隔,前面讲到这里就不重复了
**最大间隔分离超平面:**
目前讲的是线性超平面
![1619585608306](assets/1619585608306.png)
> 图中心,虚线到实线的距离我们称之为γ,我们要做的是最大化γ,使得这个超平面调整为γ的一个最大值,等价于找到了最优的超平面
![1619585628157](assets/1619585628157.png)
> γ:表示几何间隔
>
> s.t. 表示约束
>
> yi正负1。保证算出来的数始终是大于0的如上图中“圈”表示+1的样本“×”表示负一的样本那么某个“圈”是正数乘以上方的yi正数正正得正某个点“×”是负数乘以下方的yi负数负负得正。
**简化上方的式子:**
我们知道max的γ是几何间隔那么我们变换一下
$$
\frac{\hat{γ}}{||w||} 其中,\hat{γ}表示函数间隔除以w二范数就是几何间隔了。
$$
$$
既然我们最终是\frac{\hat{γ}}{||w||} ,那么式子我们可以简化成
$$
$$
y_i(wx_i+b)≥\hat{γ},其中\hat{γ}是函数间隔
$$
![1619585642761](assets/1619585642761.png)

Binary file not shown.

After

Width:  |  Height:  |  Size: 21 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 11 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 65 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 40 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 36 KiB

Loading…
Cancel
Save