624 Commits (87cf7f340eec9e4afb7d2b82dcc3eb0d31250d70)
 

Author SHA1 Message Date
ben.guo 87cf7f340e Add. GPT-2里的前馈神经网络
2 years ago
ben.guo 39aacf2796 Create 第七章——前馈神经网络.md
2 years ago
ben.guo d23e7db9df Update. 修改公式,对应上源码
2 years ago
ben.guo 7f0d4c60fb Fix. 增加描述的文字
2 years ago
ben.guo 652873a266 Add. 层归一化 & 总结
2 years ago
ben.guo 2038d0b2a6 Create 第六章——数值缩放.md
2 years ago
ben.guo 2ebbad7d35 Fix. 更新数值缩放的全英文词
2 years ago
ben.guo ba5a0f6760 Add. 补充说明
2 years ago
ben.guo ed35b14d59 Add. 总结
2 years ago
ben.guo a3c7f56e73 Add. 上亿的参数量是怎么来的
2 years ago
ben.guo 2fb6c2b669 Fix. 修正一些说法
2 years ago
ben.guo b0c99eaf2a Add. QKV机制的数学逻辑
2 years ago
ben.guo 2d701745d9 Update. 补充A与Z的说明
2 years ago
ben.guo 3025191ab7 Update. 修改错误图内容
2 years ago
ben.guo cea684e532 Update. 增加解析内容
2 years ago
ben.guo de6d9c6f31 Add. Softmax归一化
2 years ago
ben.guo b3bdec33cb Add. Mask遮挡
2 years ago
ben.guo 27882eb585 Add. Scale缩放
2 years ago
ben.guo 6118b1904e Create. 第四章——多头注意力机制——QK矩阵相乘
2 years ago
ben.guo a29294c747 Add. 总结
2 years ago
ben.guo 5ebf1c65e9 Fix. 修改章节名
2 years ago
ben.guo 471440d224 Add. QK矩阵相乘
2 years ago
ben.guo 1de03d01db Fix. Attention——QKV权重运算
2 years ago
ben.guo d2c53c9d17 Add. 什么是矩阵相乘
2 years ago
ben.guo 29a214add1 Add. 为什么是矩阵相乘-几何解释
2 years ago
ben.guo 17304c9008 Add. 什么是矩阵相乘
2 years ago
ben.guo a6aef63f4b Fix. 调整表达字眼
2 years ago
ben.guo da384435cc Create 0*0KPEV8QidHkteKeY.png
2 years ago
ben.guo 8af85f9d7e Create 第四章——语义关系学习.md
2 years ago
ben.guo 1f757d9254 Add. 为什么是简单相加
2 years ago
ben.guo a2268769b4 Add. 增加位置编码正弦余弦的可解释性
2 years ago
ben.guo e4778d373a Add. 官方代码
2 years ago
ben.guo 20e3dd4dea fix. 修复图片展示
2 years ago
ben.guo 8b1c09d398 fix. 修复图片展示
2 years ago
ben.guo 8cf2a4076e Add. 添加源码地址
2 years ago
ben.guo 6cb42573bd Add. 总结
2 years ago
ben.guo 352824cd94 Add. 矩阵同位置相加
2 years ago
ben.guo 91256041f9 Add. GPT-2的位置编码方法
2 years ago
ben.guo 29136ec781 Update. Transformer里的位置编码方法(原文)
2 years ago
ben.guo 719e43eb7b Update. Transformer里的原始方法
2 years ago
ben.guo 316a5636a9 Update. Transformer里的原始方法
2 years ago
ben.guo efcda2cc2e Add. Transformer里的原始方法
2 years ago
ben.guo 5bd2e4d436 Add. 第三章——位置编码
2 years ago
ben.guo 53183ddd4f Add. 为什么Transformer(GPT场景)使用这种文字向量化的方式? & 总结
2 years ago
ben.guo 95bff73b15 Add. 前言
2 years ago
ben.guo 2f70593fe0 Update. 添加结果解释
2 years ago
ben.guo 8dd57ae7d1 Add. 添加第二章可复现的完整代码
2 years ago
ben.guo 2d656002ab Add. 从0开始Tokenizer
2 years ago
ben.guo a9567ffaef Update. 索引向量化
2 years ago
ben.guo 037814ce21 Add. 索引向量化
2 years ago