Add. 增加第一章结束语

master
ben.guo 1 year ago
parent 71376b76f2
commit 2ab6d7012e

BIN
.DS_Store vendored

Binary file not shown.

@ -182,3 +182,7 @@ Add & Norm的过程可以理解为相同位置元素相加再做层归一化
> WHY归一化到0-1区间便于比较和处理。将注意力分数转换为概率分布。
可以简单理解为前面输出的概率会被转化成0-1的区间进行输出。
至此你已经对整个Transformer有的整体了解我们已经是熟悉transformer的人了🎉🎉🎉

Loading…
Cancel
Save