Add 聚类算法工作流程

pull/2/head
benjas 5 years ago
parent a6a0db9b3e
commit 94adc1bc4e

Binary file not shown.

After

Width:  |  Height:  |  Size: 51 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 127 KiB

@ -1258,3 +1258,21 @@ notebook已更新markdown待更新
- 距离度量:常用欧几里得距离和余弦相似度(先标准化)
- 优化目标:![1606221707427](assets/1606221707427.png),让每一个样本到中心点(质心)的距离越小越好,即每个点到中心点的和最小,越小越相似
#### KMEANS工作流程
![1606222061142](assets/1606222061142.png)
- a我们拿到这一堆数据
- bk=2初始化两个点
- c计算各个点到初始化的两个点的距离近的聚类
- d更新初始化点
- e接着更新所有点到该两点的距离
- f不断更新直到无法更新聚类完成
**优势:**简单、快速、适合常规数据集
**劣势:**
- K值难确定
- 复杂度与样本呈线性关系
- 很难发现任意形状的簇
Loading…
Cancel
Save