ben.guo
|
ddf28b253b
|
Add. 总结
|
6 months ago |
ben.guo
|
1b8e025626
|
Add. 训练和推理阶段的不同
|
6 months ago |
ben.guo
|
eda2a9e4b4
|
Fix. 调整最后两层的解析内容
|
6 months ago |
ben.guo
|
a14a3e3b59
|
Create 第八章——最后的输出.md
|
6 months ago |
ben.guo
|
1950a79a29
|
Add. 增加相关图片
|
6 months ago |
ben.guo
|
0b4fb7403d
|
Docs.增加训练跟推理的说明
|
6 months ago |
ben.guo
|
1e8326ddfd
|
Add. 神经网络demo & 总结
|
6 months ago |
ben.guo
|
87cf7f340e
|
Add. GPT-2里的前馈神经网络
|
6 months ago |
ben.guo
|
39aacf2796
|
Create 第七章——前馈神经网络.md
|
6 months ago |
ben.guo
|
d23e7db9df
|
Update. 修改公式,对应上源码
|
6 months ago |
ben.guo
|
7f0d4c60fb
|
Fix. 增加描述的文字
|
6 months ago |
ben.guo
|
652873a266
|
Add. 层归一化 & 总结
|
6 months ago |
ben.guo
|
2038d0b2a6
|
Create 第六章——数值缩放.md
|
6 months ago |
ben.guo
|
2ebbad7d35
|
Fix. 更新数值缩放的全英文词
|
6 months ago |
ben.guo
|
ba5a0f6760
|
Add. 补充说明
|
6 months ago |
ben.guo
|
ed35b14d59
|
Add. 总结
|
6 months ago |
ben.guo
|
a3c7f56e73
|
Add. 上亿的参数量是怎么来的
|
6 months ago |
ben.guo
|
2fb6c2b669
|
Fix. 修正一些说法
|
6 months ago |
ben.guo
|
b0c99eaf2a
|
Add. QKV机制的数学逻辑
|
6 months ago |
ben.guo
|
2d701745d9
|
Update. 补充A与Z的说明
|
6 months ago |
ben.guo
|
3025191ab7
|
Update. 修改错误图内容
|
6 months ago |
ben.guo
|
cea684e532
|
Update. 增加解析内容
|
6 months ago |
ben.guo
|
de6d9c6f31
|
Add. Softmax归一化
|
6 months ago |
ben.guo
|
b3bdec33cb
|
Add. Mask遮挡
|
6 months ago |
ben.guo
|
27882eb585
|
Add. Scale缩放
|
6 months ago |
ben.guo
|
6118b1904e
|
Create. 第四章——多头注意力机制——QK矩阵相乘
|
6 months ago |
ben.guo
|
a29294c747
|
Add. 总结
|
6 months ago |
ben.guo
|
5ebf1c65e9
|
Fix. 修改章节名
|
6 months ago |
ben.guo
|
471440d224
|
Add. QK矩阵相乘
|
6 months ago |
ben.guo
|
1de03d01db
|
Fix. Attention——QKV权重运算
|
6 months ago |
ben.guo
|
d2c53c9d17
|
Add. 什么是矩阵相乘
|
6 months ago |
ben.guo
|
29a214add1
|
Add. 为什么是矩阵相乘-几何解释
|
6 months ago |
ben.guo
|
17304c9008
|
Add. 什么是矩阵相乘
|
6 months ago |
ben.guo
|
a6aef63f4b
|
Fix. 调整表达字眼
|
6 months ago |
ben.guo
|
da384435cc
|
Create 0*0KPEV8QidHkteKeY.png
|
6 months ago |
ben.guo
|
8af85f9d7e
|
Create 第四章——语义关系学习.md
|
6 months ago |
ben.guo
|
1f757d9254
|
Add. 为什么是简单相加
|
6 months ago |
ben.guo
|
a2268769b4
|
Add. 增加位置编码正弦余弦的可解释性
|
6 months ago |
ben.guo
|
e4778d373a
|
Add. 官方代码
|
6 months ago |
ben.guo
|
20e3dd4dea
|
fix. 修复图片展示
|
6 months ago |
ben.guo
|
8b1c09d398
|
fix. 修复图片展示
|
6 months ago |
ben.guo
|
8cf2a4076e
|
Add. 添加源码地址
|
6 months ago |
ben.guo
|
6cb42573bd
|
Add. 总结
|
6 months ago |
ben.guo
|
352824cd94
|
Add. 矩阵同位置相加
|
6 months ago |
ben.guo
|
91256041f9
|
Add. GPT-2的位置编码方法
|
6 months ago |
ben.guo
|
29136ec781
|
Update. Transformer里的位置编码方法(原文)
|
6 months ago |
ben.guo
|
719e43eb7b
|
Update. Transformer里的原始方法
|
6 months ago |
ben.guo
|
316a5636a9
|
Update. Transformer里的原始方法
|
6 months ago |
ben.guo
|
efcda2cc2e
|
Add. Transformer里的原始方法
|
6 months ago |
ben.guo
|
5bd2e4d436
|
Add. 第三章——位置编码
|
6 months ago |