@ -1283,7 +1283,7 @@ notebook已更新, markdown待更新
![1606222961103 ](assets/1606222961103.png )
https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/ 可视化网站
< https: / / www . naftaliharris . com / blog / visualizing-k-means-clustering / > 可视化网站
#### DBSCAN聚类算法
@ -1357,3 +1357,37 @@ https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/可视化网站
![1606228016281 ](assets/1606228016281.png )![1606228049969 ](assets/1606228049969.png )
< https: / / www . naftaliharris . com / blog / visualizing-dbscan-clustering / > 可视化网站
**多种聚类算法比较**
![1606305694681 ](assets/1606305694681.png )
X轴上的特征表示归一化后, 是对某个特征增强10倍, 其它不变, 测试多个聚类算法的结果, 越大越好。
可以看到DBSCAN总体上都是偏好的, 所以一般情况下, 首选是DBSCAN
#### 聚类案例实例
### 贝叶斯分析
#### 贝叶斯分析概述
**一句话解释**
经典的概率论对小样本事件并不能进行准确的评估,若想的到相对准确的结论往往需要大量的现场实验;而贝叶斯理论能较好的解决这一问题,利用己有的先验信息,可以得到分析对象准确的后验分布,贝叶斯模型是用参数来描述的,并且用概率分布描述这些参数的不确定性
贝叶斯分析的思路由证据的积累来推测一个事物发生的概率,它告诉我们当我们要预测一个事物需要的是首先根据已有的经验和知识推断一个先验概率,然后在新证据不断积累的情况下调整这个概率。整个通过积累证据来得到一个事件发生概率的过程我们称为贝叶斯分析
**故事背景**
贝叶斯全名为托马斯·贝叶斯( Thomas Bayes,1701-1761),是一位与牛顿同时代的牧师,是一位业余数学家,平时就思考些有关上帝的事情,当然,统计学家都认为概率这个东西就是上帝在掷骰子。当时贝叶斯发现了古典统计学当中的一些缺点,从而提出了自己的“贝叶斯统计学”,但贝叶斯统计当中由于引入了一个主观因素(先验概率,下文会介绍), 一点都不被当时的人认可。直到20世纪中期, 也就是快200年后了, 统计学家在古典统计学中遇到了瓶颈, 伴随着计算机技术的发展,当统计学家使用贝叶斯统计理论时发现能解决很多之前不能解决的问题,从而贝叶斯统计学一下子火了起来,两个统计学派从此争论不休。
##### 基本概念: