|
|
|
@ -29,17 +29,65 @@
|
|
|
|
|
>
|
|
|
|
|
> 常规数学中,所有问题都有一个解。而机器学习当中,求解很难或者没有解,我们只能不断逼近这个最优解。
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
**问题一**:蚂蚁沿着什么方向跑路不被火烧,能活下来(二维平面)
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
函数:z = f(x,y)
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
|pp'| = p = \sqrt{(\Delta x) ^ 2 + (\Delta y) ^ 2}
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\Delta z = f(x + \Delta x, y + \Delta y)-f(x,y)
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
> 蚂蚁沿着任意方向都可以活,最优的是沿着对角方向L,z是函数变化,也就是图中的φ。
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
**三维平面的方向导数公式**:
|
|
|
|
|
$$
|
|
|
|
|
定理:如果函数z=f(x,y)在点P(x,y)是可微分的,那么在该点沿任意方向L的方向导数都存在。
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\frac {\delta f}{\delta l} = \frac {\delta f}{\delta x}cos\varphi + \frac {\delta f}{\delta y} sin \varphi
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\varphi 是X轴到L的角度
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
> 上面是三维平面的方向导数公式
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
> 求一个方向导数具体的值
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
**求一个方向导数具体的值**:
|
|
|
|
|
$$
|
|
|
|
|
求函数z=xe^{2y}在点P(1,0)处沿从点P(1,0)到点Q(2,-1)的方向的方向导数.
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
解\quad \quad 这里方向\vec l即为 \vec{PQ}={1,-1},故X轴到方向\vec l的转角\varphi = -\frac {\pi}{4}.
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\because \frac {\delta z}{\delta x}|_{(1,0)} = e^{2y}|_{(1,0)}=1;
|
|
|
|
|
\frac {\delta z}{\delta y}|_{(1,0)} = 2xe^{2y}|_{(1,0)}=2,
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
所求方向导数
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\frac {\delta z}{\delta l}=cos(-\frac{\pi}{4})+2sin(-\frac{\pi}{4})=-\frac{\sqrt 2}{2}.
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
@ -47,19 +95,66 @@
|
|
|
|
|
|
|
|
|
|
> 是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此*梯度*的方向)变化最快,变化率最大(为该*梯度*的模)。
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
$$
|
|
|
|
|
函数:z=f(x,y)在平面域内具有连续的一阶偏导数,对于其中每一个点P(x,y)都有向量\frac {\delta f}{\delta x}\vec i + \frac {\delta f}{\delta y}\vec j
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
则称其为函数在点P的梯度。
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
gradf(x,y)=\frac {\delta f}{\delta x}\vec i + \frac {\delta f}{\delta y}\vec j
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\vec e = cos\varphi\vec i + sin\varphi\vec j是方向L上的单位向量
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
> 根据上面的梯度导数,和方向导数的区别就在多了个cosθ,θ充当梯度和方向导数之间的关系
|
|
|
|
|
$$
|
|
|
|
|
\frac {\delta f}{\delta l}=\frac {\delta f}{\delta x}cos\varphi+\frac{\delta f}{\delta y}sin\varphi=\{\frac{\delta f}{\delta x}, \frac{\delta f}{\delta y}\}·\{cos\varphi, sin\varphi\}
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
$$
|
|
|
|
|
=gradf(x,y)·\vec e = |gradf(x,y)|cos\theta \quad \theta=(gradf(x,y),\vec e)
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
> 注意,只有θ=0,cos导数才能=1,梯度才能取得最大值,也就是那个方向。而沿着反方向就是最小值也就是梯度下降。
|
|
|
|
|
> 根据上面的梯度导数,和方向导数的区别就在多了个*cosθ*,*θ*充当梯度和方向导数之间的关系
|
|
|
|
|
|
|
|
|
|
求一个具体值,最大梯度方向和最小梯度方向
|
|
|
|
|
$$
|
|
|
|
|
只有当cos(gradf(x,y),\vec e)=1,\frac{\delta f}{\delta l}才有最大值。
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
函数在某点的梯度是一个向量,它的方向与方向导数最大值取得的方向一致。
|
|
|
|
|
|
|
|
|
|
> 注:得出的经过(-1,0,2),求解:((-1^2) + (0^2) + (-2^2)) = √5,前面都是x的平方,所以结果也需要开根号。
|
|
|
|
|
其大小正好是最大的方向导数
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
> 注意,只有*θ*=0,*cos*导数才能=1,梯度才能取得最大值,也就是那个方向。而沿着反方向就是最小值也就是梯度下降。
|
|
|
|
|
|
|
|
|
|
**求一个具体值,最大梯度方向和最小梯度方向**:
|
|
|
|
|
$$
|
|
|
|
|
设u=xyz+z^2+5,求gradu,并求在点M(0,1,-1)处方向导数的最大(小)值
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\because \frac{\delta u}{\delta x}=yz, \frac{\delta u}{\delta y}=xz,\frac{\delta u}{\delta z}=xy+2z,
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
\therefore gradu|_{(0,1,-1)}=(yz,xz,xy+2z)|_{(0,1,-1)}=(-1,0)
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
从而最大值\quad max\{\frac{\delta u}{\delta l}|_M\}=||gradu||=\sqrt 5
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
最小值\quad min\{\frac{\delta u}{\delta l}|_M\}=-||gradu||=-\sqrt 5
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
> 注:得出的结果(-1,0,2),求解:((-1^2) + (0^2) + (-2^2)) = √5,前面都是x的平方,所以结果也需要开根号。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
@ -71,13 +166,35 @@
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
以直代曲
|
|
|
|
|
**以直代曲**:
|
|
|
|
|
|
|
|
|
|
对于矩形,我们可以轻松求得其面积,能否用矩形代替曲线形状呢?
|
|
|
|
|
|
|
|
|
|
应该用多少个矩形来代替?
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
> 越小的矩形,越覆盖,然后求每个矩形的面积。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
在ab之间插入若干个点,得到n个小区间。
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
|
每个小矩形面积为:A_i=f(\xi
|
|
|
|
|
_i)\Delta x_i近似得到曲线面积:A\approx \sum^{n}_{i=1}f(\xi_i)\Delta x_i
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
$$
|
|
|
|
|
当分割无限加细,每个小区间的最大长度为\lambda,此时\lambda → 0
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|
> 越小的矩形,越覆盖,求出每个矩形的面积。
|
|
|
|
|
$$
|
|
|
|
|
曲边面积:A=lim_{\lambda→0}\sum^n_{i=1}f(\xi_i)\Delta x_i
|
|
|
|
|
$$
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
> 注意每个小区间的最大长度为λ,而λ无限接近于0时,那么曲边的面积我们就可以得出,当然这里的近似表达是极限,无限接近的极限。
|
|
|
|
|
|
|
|
|
|