Add. Learning policy

pull/2/head
benjas 5 years ago
parent 078bbae049
commit 4acc814fda

@ -38,3 +38,125 @@
> 如图中红色线的和的距离肯定比黑色或者黄色的线大。 > 如图中红色线的和的距离肯定比黑色或者黄色的线大。
### 总结
1. 一条直线不分错一个点,这就是好的直线。
2. 模型要尽可能找到好的直线。
3. 如果没有好的直线,在差的直线中找到好的直线。
4. 判断直线多差的方式:分错的点到直线的距离求和。
### 感知机模型
Perceptron
确定终究目标
f(x)
> 我们希望一个函数如f(x),进来一个豆,它告诉我们是红豆还是绿豆
f(x) = sign(w * x + b)
> sign如图![1618034843122](assets/1618034843122.png)
把w * x + b 比作x相当于给了一个“豆”进来就只得到两个结果也就是红豆+1或者绿豆-1。那么w * x + b 是什么?
w * x + b是超平面
![1618035195004](assets/1618035195004.png)
> 即那条黄色的分割线,且当豆在线的上面,就是红豆,在下面是绿豆。
>
> 超平面是n维欧氏空间中余维度等于一的线性子空间也就是必须是(n-1)维度。即如果是2维超平面就是1维如果是3维超平面就是2维。
w * x + b分别代表什么
> w是权重x是特征的实际值b是偏值
>
> 比如知道豆的直径如x1表示某个豆的直径 = w1 * x1 + b1大于1则是红豆小于则是绿豆
>
> 有时候一个特征不一定能区分开来,可能还需要质量,(x1,x2)计算 = (w1, w2) * (x1, x2)
>
> 亦或者还有豆的光滑度则有x1, x2, x3 这样就变成3维了。
**正式的说**
w * x + b 是一个n维空间中的超平面S其中w是超平面的法向量b是超平面的截距这个超平面将特征空间划分成两部分位于两部分的点分别被分为正负两类。所以超平面S称为分离超平面。
特征空间也就是整个n维空间样本的每个属性都叫一个特征特征空间的意思是在这个空间中可以找到样本所有的属性的组合。
### 感知觉的学习策略
Learning policy
> 求空间中任意一个点X0到超平面S的距离
**函数间隔与几何间隔**
函数间距:![1618232951329](assets/1618232951329.png)
> 缺点已知wx + b = 0当不等于0时比如1那如果等比例放大缩小w和b是不是就更小等同于1/2 (wx + b) = 1/2(wx) + 1/2(b) = 1/2超平面是没有动的但是结果却缩小了那么模型就觉得它知道等比例缩小就能得到更小的结果。
>
> 这时候就引入几何间距
几何间距:![1618232969849](assets/1618232969849.png)
![1618232989614](assets/1618232989614.png)
> 加入了二范式相当于有了一个度量的标准即等比例缩小w时外面的w也会等比例变化。
通俗来讲函数间距是将你去吃饭的那段路本来要1000m它改成1km1就小于1000了而几何间距就杜绝这种情况只能都是m或者km
对于误分类数据而已,![1618233535293](assets/1618233535293.png)
> yi表示真实是+1还是-1
>
> w*xi+b表示预测的结果
>
> 绿豆预测成绿豆预测结果w*xi+b < 0绿绿(-1)- * -1(wxi + b) < 0
>
> 绿豆预测成红豆w*xi+b > 0真实为绿豆-1则- * -1 (wxi + b) > 0。
>
> 也就是说只要分错那么数据一定是大于0
误分类点xi到超平面S的距离为![1618233578508](assets/1618233578508.png)
因此所有误分类点到超平面S的总距离为![1618233886281](assets/1618233886281.png)
> M误分类点的集合
### 感知觉的学习策略——原始形式
Learning policy
1. 任选一个超平面w0b0
> 随机初始化如w0 = 1可能有多个维度如x0x1x2那么w也会有w0w1w2的随机初始化
2. 采用梯度下降法极小化目标函数
![1618234010513](assets/1618234010513.png)
> Lloss
>
> 这时候用的还是函数间隔,因为感知机的超平面的目标是不分错任何一个点。所以不存在说要某个点到超平面的距离无限的小。
>
> 也可以用几何间隔,但是会增加计算量,没有必要,但后面基本都是用几何间隔。
>
> 侧面反映了感知机只能在线性可分的数据集上使用,也就是线性模型。
3. 更新wb
![1618234028471](assets/1618234028471.png)

Binary file not shown.

After

Width:  |  Height:  |  Size: 20 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 222 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 6.9 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 14 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 23 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 14 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 16 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 23 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 64 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 18 KiB

Loading…
Cancel
Save