|
|
|
@ -355,13 +355,14 @@ P(C) = 0.7+0.8-0.56 = 0.94
|
|
|
|
|
|
|
|
|
|
#### 期望
|
|
|
|
|
|
|
|
|
|
> **WHAT**:期望达到什么,估计一个大概的值
|
|
|
|
|
> **WHAT**:期望达到什么,反映了随机变量的取值水平
|
|
|
|
|
|
|
|
|
|
- 离散型随机变量X的分布律为:
|
|
|
|
|
|
|
|
|
|
若级数绝对收敛,则称其为随机变量X的数学期望,
|
|
|
|
|
|
|
|
|
|
> Xk是每种情况,Pk是每种情况对应的概率
|
|
|
|
|
|
|
|
|
|
- 投骰子的期望则是1 / (1/6) + 2 / (1/6) + ... + 6 / (1/6) = 21 / 6 = 3.5
|
|
|
|
|
|
|
|
|
|
- 连续型随机变量X的概率密度为f(x),若积分绝对收敛,则称积分的值为随机变量X的数学期望。
|
|
|
|
@ -372,3 +373,28 @@ P(C) = 0.7+0.8-0.56 = 0.94
|
|
|
|
|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
**方差**
|
|
|
|
|
|
|
|
|
|
> 衡量随机变量相对于数学期望的分散程度
|
|
|
|
|
|
|
|
|
|
####
|
|
|
|
|
|
|
|
|
|
#### 贝叶斯拼写纠错实例
|
|
|
|
|
|
|
|
|
|
问题:我们看到用户输入了一个不在字典中的单词,我们需要去猜测用户到底想输入的是什么
|
|
|
|
|
|
|
|
|
|
- P(猜测想输入的单词|用户实际输入的单词)
|
|
|
|
|
- 用户实际输入的单词记为D(D代表Data,即观测数据)
|
|
|
|
|
- 猜测1:P(h1|D),猜测2:P(h2|D),猜测3:P(h3|D) ...
|
|
|
|
|
- P(h|D) = P(h) * P(D|h) / P(D)
|
|
|
|
|
|
|
|
|
|
> p(h) 在字典里某个词出现的次数占总体的比(先验概率)
|
|
|
|
|
>
|
|
|
|
|
> P(D|h)指输入一个词,输错的概率多大;
|
|
|
|
|
>
|
|
|
|
|
> P(D)客户输入的值D,可以约掉
|
|
|
|
|
|
|
|
|
|
贝叶斯方法计算:P(h|D) = P(h) * P(D|h) ,P(h)是特定猜测的先验概率。
|
|
|
|
|
|
|
|
|
|
比如用户输入tlp,到底是top还是tip?当最大似然不能作出决定性判断时(可能两边都是一半可能性),这是先验概率就可以插手给出指示,告诉我们,一般来说top出现的程度要高许多,所以他更可能想打的是top。
|
|
|
|
|
|
|
|
|
|