diff --git a/机器学习算法理论及应用/李航——统计学习方法/3.K近邻——物以类聚.md b/机器学习算法理论及应用/李航——统计学习方法/3.K近邻——物以类聚.md index c202621..f9d43f7 100644 --- a/机器学习算法理论及应用/李航——统计学习方法/3.K近邻——物以类聚.md +++ b/机器学习算法理论及应用/李航——统计学习方法/3.K近邻——物以类聚.md @@ -18,3 +18,44 @@ How to distinguish red beans and green beans? 如果一个豆过来自然而然的到红豆堆,我们有理由认为它大概率是红豆。 +1. 同一标签的样本通常有很多相似的特征。 +2. 没进来一个样本,查看它周边的样本是什么类别,那么它就很有可能属于该类别。 + +那么某个点与其它点距离怎么计算。 + + + +### 距离度量 + +Distance measure + +首先令![1618325180835](assets/1618325180835.png) + + + +度量的方法有: + +欧式距离(也称二范数): + +![1618325070279](assets/1618325070279.png) + +> xi里的x减去对应位置的xj里的x,然后全部平方,再求和,然后开根号。 +> +> 如果两个点之间的距离很远,那么值就会很大 + +曼哈顿距离(也称一范数/也称城市街区距离): + +![1618325099972](assets/1618325099972.png) + +> 相对上面欧式距离,不需要平方-相加-开根号,只要拿它的绝对值-相加即可 + +P范数: + +![1618325113566](assets/1618325113566.png) + +> 引出P范数,p=1则是一范数,p=2则是二范数 + +还有3范数(也称切比雪夫距离/棋盘距离) + +最常用的是欧式距离>曼哈顿距离>切比雪夫距离 + diff --git a/机器学习算法理论及应用/李航——统计学习方法/assets/1618325070279.png b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325070279.png new file mode 100644 index 0000000..7ca3707 Binary files /dev/null and b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325070279.png differ diff --git a/机器学习算法理论及应用/李航——统计学习方法/assets/1618325099972.png b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325099972.png new file mode 100644 index 0000000..845964c Binary files /dev/null and b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325099972.png differ diff --git a/机器学习算法理论及应用/李航——统计学习方法/assets/1618325113566.png b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325113566.png new file mode 100644 index 0000000..e3f2ae7 Binary files /dev/null and b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325113566.png differ diff --git a/机器学习算法理论及应用/李航——统计学习方法/assets/1618325180835.png b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325180835.png new file mode 100644 index 0000000..b23f5b4 Binary files /dev/null and b/机器学习算法理论及应用/李航——统计学习方法/assets/1618325180835.png differ