diff --git a/必备数学基础.md b/必备数学基础.md index e1506fb..0637323 100644 --- a/必备数学基础.md +++ b/必备数学基础.md @@ -21,7 +21,9 @@ - 都有对应的结果,不用死记硬背,查就行了,如(C)' = 0 或者(sin x)' = cos x -**方向导数**:(引出梯度) + + +### 方向导数(引出梯度) > 在函数定义域的内点,对某一*方向*求导得到的*导数*。 > @@ -39,7 +41,9 @@ > 求一个方向导数具体的值 -**梯度**: + + +### 梯度 > 是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此*梯度*的方向)变化最快,变化率最大(为该*梯度*的模)。 @@ -57,7 +61,9 @@ > 注:得出的经过(-1,0,2),求解:((-1^2) + (0^2) + (-2^2)) = √5,前面都是x的平方,所以结果也需要开根号。 -**微积分**: + + +### 微积分 > 很多的微分积起来 @@ -83,4 +89,87 @@ **定积分**: -![1603590034899](assets/1603590034899.png) \ No newline at end of file +![1603590034899](assets/1603590034899.png) + + + +### 矩阵和特征 + +**矩阵**: + +> 拿到数据后,数据就长如下样子,有行有列 + +![1603615232363](assets/1603615232363.png) + +> 左图√表示A可以到B和C,如右上图,再把√号改成0/1以存储在数据里面,就如右下图 + +**几种特别的矩阵**: + +![1603616214041](assets/1603616214041.png) + +> 上三角部分有值,和下三角部分有值 + +![1603616244944](assets/1603616244944.png) + +> 对角阵:对角有值且可以是任意值,单位矩阵:对角有值且相同 + +![1603616315241](assets/1603616315241.png) + +> 同型矩阵:行列相同。矩阵相等:行列相同且里面的值一样 + +### SVD矩阵分解 + +数据行列可能很大,如电商行业100万客户(行),有1万的商品(特征),用一组数据表达就是 + +| 客户ID | 商品1 | 商品2 | ... | 商品1万 | +| -------- | ----------------- | ----- | ---- | ------- | +| xxx1 | 1(表示买过一次) | 0 | ... | 5 | +| xxx2 | 0 | 1 | ... | 0 | +| ... | 5 | 10 | ... | 0 | +| xxx100万 | ... | ... | ... | ... | + +那么来一个客户,就是直接多1万列表示,这样的数据是非常稀疏的,我们可以分解成A表100万客户,100个特征,而这100个特征对应这那B表的1万个商品,也就是一个表变成A表和B表,且两者关联。 + +这就需要用到SVD矩阵。 + + + +### 离散和连续型数据 + +![1603623698138](assets/1603623698138.png) + +> 离散型是有限多个的,比如10个台阶,只可能是其中的一个台阶,一个确定的结果。 +> +> 连续型则可能是任意的值,没办法确定是哪个台阶。 + +**离散型随机变量概率分布** + +![1603624212861](assets/1603624212861.png) + +**连续型随机变量概率分布** + +![1603624629046](assets/1603624629046.png) + +> 还有一种方法是把每个值划分在不同区间,变成离散型,但如果有新数据进来就要再划分区间导致区间越来越多。 + +### 简单随机抽样 + +抽取的样本满足两点 + +1. 样本X1,X2...Xn是相互独立的随机变量。 +2. 样本X1,X2...Xn与总体X同分布。 + +![1603624871257](assets/1603624871257.png) + +### 极大似然估计 + +> 找到最有可能的那个 + +![1603626327837](assets/1603626327837.png) + +> 第一步构造函数;第二步取对数,对数后的值容易取且极值点还是那个位置;第三步求偏导;得到θ + +![1603626465653](assets/1603626465653.png) + +![1603626480659](assets/1603626480659.png) +