From cec6046b5124c7bdeb5bd98891b665232a4efbd4 Mon Sep 17 00:00:00 2001 From: benjas <909336740@qq.com> Date: Tue, 3 Nov 2020 23:17:44 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E5=BF=85=E5=A4=87=E6=95=B0=E5=AD=A6?= =?UTF-8?q?=E5=9F=BA=E7=A1=80.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 必备数学基础.md | 28 +++++++++++++++++++++++++++- 1 file changed, 27 insertions(+), 1 deletion(-) diff --git a/必备数学基础.md b/必备数学基础.md index acfe70a..d116f09 100644 --- a/必备数学基础.md +++ b/必备数学基础.md @@ -355,13 +355,14 @@ P(C) = 0.7+0.8-0.56 = 0.94 #### 期望 -> **WHAT**:期望达到什么,估计一个大概的值 +> **WHAT**:期望达到什么,反映了随机变量的取值水平 - 离散型随机变量X的分布律为:![1604328684174](assets/1604328684174.png) 若级数![1604328741718](assets/1604328741718.png)绝对收敛,则称其为随机变量X的数学期望,![1604328798712](assets/1604328798712.png) > Xk是每种情况,Pk是每种情况对应的概率 + - 投骰子的期望则是1 / (1/6) + 2 / (1/6) + ... + 6 / (1/6) = 21 / 6 = 3.5 - 连续型随机变量X的概率密度为f(x),若积分![1604329061894](assets/1604329061894.png)绝对收敛,则称积分的值![1604329099005](assets/1604329099005.png)为随机变量X的数学期望。![1604329148959](assets/1604329148959.png) @@ -372,3 +373,28 @@ P(C) = 0.7+0.8-0.56 = 0.94 ![1604329379855](assets/1604329379855.png) +**方差** + +> 衡量随机变量相对于数学期望的分散程度 + +#### + +#### 贝叶斯拼写纠错实例 + +问题:我们看到用户输入了一个不在字典中的单词,我们需要去猜测用户到底想输入的是什么 + +- P(猜测想输入的单词|用户实际输入的单词) +- 用户实际输入的单词记为D(D代表Data,即观测数据) +- 猜测1:P(h1|D),猜测2:P(h2|D),猜测3:P(h3|D) ... +- P(h|D) = P(h) * P(D|h) / P(D) + +> p(h) 在字典里某个词出现的次数占总体的比(先验概率) +> +> P(D|h)指输入一个词,输错的概率多大; +> +> P(D)客户输入的值D,可以约掉 + +贝叶斯方法计算:P(h|D) = P(h) * P(D|h) ,P(h)是特定猜测的先验概率。 + +比如用户输入tlp,到底是top还是tip?当最大似然不能作出决定性判断时(可能两边都是一半可能性),这是先验概率就可以插手给出指示,告诉我们,一般来说top出现的程度要高许多,所以他更可能想打的是top。 +