Add KMEANS算法概述

pull/2/head
benjas 5 years ago
parent 400f00cd98
commit a6a0db9b3e

Binary file not shown.

After

Width:  |  Height:  |  Size: 59 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 7.2 KiB

@ -1236,3 +1236,25 @@ notebook已更新markdown待更新
![1606031463635](assets/1606031463635.png)
待更新notebook已更新
### KMEANS算法
#### KMEANS算法概述
聚类概念:
- 无监督问题:手上没有标签
- 聚类:相似的东西分到一组
- 难点:如何评估,如何调参
![1606221473495](assets/1606221473495.png)
基本概念:
- 想要得到簇的个数需要指定K值即聚成几个堆
- 质心:均值,即向量各维取平均,最中间的位置
- 距离度量:常用欧几里得距离和余弦相似度(先标准化)
- 优化目标:![1606221707427](assets/1606221707427.png),让每一个样本到中心点(质心)的距离越小越好,即每个点到中心点的和最小,越小越相似

Loading…
Cancel
Save