Fix. 更新数值缩放的全英文词

master
ben.guo 6 months ago
parent ba5a0f6760
commit 2ebbad7d35

@ -98,7 +98,7 @@
### 数值缩放
> Addition and Normalization
> Addition and Layer Normalization
>
> WHY前面我们讲到矩阵里的数字越大表示跟其它词的语义关系越紧密如果两个大值相加很可能就造成大的值特别大小的值特别小。所以要统一到一个维度特别是深度学习场景里由于深度学习是矩阵乘法 所以大值或者小值都会被无限放大,导致模型不稳定。

Loading…
Cancel
Save