ben.guo
|
1950a79a29
|
Add. 增加相关图片
|
1 year ago |
ben.guo
|
0b4fb7403d
|
Docs.增加训练跟推理的说明
|
1 year ago |
ben.guo
|
1e8326ddfd
|
Add. 神经网络demo & 总结
|
1 year ago |
ben.guo
|
87cf7f340e
|
Add. GPT-2里的前馈神经网络
|
1 year ago |
ben.guo
|
39aacf2796
|
Create 第七章——前馈神经网络.md
|
1 year ago |
ben.guo
|
d23e7db9df
|
Update. 修改公式,对应上源码
|
1 year ago |
ben.guo
|
7f0d4c60fb
|
Fix. 增加描述的文字
|
1 year ago |
ben.guo
|
652873a266
|
Add. 层归一化 & 总结
|
1 year ago |
ben.guo
|
2038d0b2a6
|
Create 第六章——数值缩放.md
|
1 year ago |
ben.guo
|
2ebbad7d35
|
Fix. 更新数值缩放的全英文词
|
1 year ago |
ben.guo
|
ba5a0f6760
|
Add. 补充说明
|
1 year ago |
ben.guo
|
ed35b14d59
|
Add. 总结
|
1 year ago |
ben.guo
|
a3c7f56e73
|
Add. 上亿的参数量是怎么来的
|
1 year ago |
ben.guo
|
2fb6c2b669
|
Fix. 修正一些说法
|
1 year ago |
ben.guo
|
b0c99eaf2a
|
Add. QKV机制的数学逻辑
|
1 year ago |
ben.guo
|
2d701745d9
|
Update. 补充A与Z的说明
|
1 year ago |
ben.guo
|
3025191ab7
|
Update. 修改错误图内容
|
1 year ago |
ben.guo
|
cea684e532
|
Update. 增加解析内容
|
1 year ago |
ben.guo
|
de6d9c6f31
|
Add. Softmax归一化
|
1 year ago |
ben.guo
|
b3bdec33cb
|
Add. Mask遮挡
|
1 year ago |
ben.guo
|
27882eb585
|
Add. Scale缩放
|
1 year ago |
ben.guo
|
6118b1904e
|
Create. 第四章——多头注意力机制——QK矩阵相乘
|
1 year ago |
ben.guo
|
a29294c747
|
Add. 总结
|
1 year ago |
ben.guo
|
5ebf1c65e9
|
Fix. 修改章节名
|
1 year ago |
ben.guo
|
471440d224
|
Add. QK矩阵相乘
|
1 year ago |
ben.guo
|
1de03d01db
|
Fix. Attention——QKV权重运算
|
1 year ago |
ben.guo
|
d2c53c9d17
|
Add. 什么是矩阵相乘
|
1 year ago |
ben.guo
|
a6aef63f4b
|
Fix. 调整表达字眼
|
1 year ago |
ben.guo
|
8af85f9d7e
|
Create 第四章——语义关系学习.md
|
1 year ago |
ben.guo
|
1f757d9254
|
Add. 为什么是简单相加
|
1 year ago |
ben.guo
|
a2268769b4
|
Add. 增加位置编码正弦余弦的可解释性
|
1 year ago |
ben.guo
|
e4778d373a
|
Add. 官方代码
|
1 year ago |
ben.guo
|
20e3dd4dea
|
fix. 修复图片展示
|
1 year ago |
ben.guo
|
8b1c09d398
|
fix. 修复图片展示
|
1 year ago |
ben.guo
|
8cf2a4076e
|
Add. 添加源码地址
|
1 year ago |
ben.guo
|
6cb42573bd
|
Add. 总结
|
1 year ago |
ben.guo
|
352824cd94
|
Add. 矩阵同位置相加
|
1 year ago |
ben.guo
|
91256041f9
|
Add. GPT-2的位置编码方法
|
1 year ago |
ben.guo
|
29136ec781
|
Update. Transformer里的位置编码方法(原文)
|
1 year ago |
ben.guo
|
719e43eb7b
|
Update. Transformer里的原始方法
|
1 year ago |
ben.guo
|
316a5636a9
|
Update. Transformer里的原始方法
|
1 year ago |
ben.guo
|
efcda2cc2e
|
Add. Transformer里的原始方法
|
1 year ago |
ben.guo
|
5bd2e4d436
|
Add. 第三章——位置编码
|
1 year ago |
ben.guo
|
53183ddd4f
|
Add. 为什么Transformer(GPT场景)使用这种文字向量化的方式? & 总结
|
1 year ago |
ben.guo
|
95bff73b15
|
Add. 前言
|
1 year ago |
ben.guo
|
2f70593fe0
|
Update. 添加结果解释
|
1 year ago |
ben.guo
|
8dd57ae7d1
|
Add. 添加第二章可复现的完整代码
|
1 year ago |
ben.guo
|
2d656002ab
|
Add. 从0开始Tokenizer
|
1 year ago |
ben.guo
|
a9567ffaef
|
Update. 索引向量化
|
1 year ago |
ben.guo
|
037814ce21
|
Add. 索引向量化
|
1 year ago |
ben.guo
|
8fa0706659
|
Update. 增加文字向量化 & 位置编码部分解释
|
1 year ago |
ben.guo
|
64bd461b02
|
Update. 增加实际代码
|
1 year ago |
ben.guo
|
5d5b429869
|
Update. 实际案例
|
1 year ago |
ben.guo
|
dbb06eed9e
|
Create. 第二章——文字向量化
|
1 year ago |
ben.guo
|
2ab6d7012e
|
Add. 增加第一章结束语
|
1 year ago |
ben.guo
|
71376b76f2
|
Add. 转换成百分比概率
|
1 year ago |
ben.guo
|
479d59d240
|
Update. 特征变换映射(全数字列表)
|
1 year ago |
ben.guo
|
aa7028e5ff
|
fix. 修改错别字
|
1 year ago |
ben.guo
|
c5f8939a4a
|
Add. 特征变换映射(全数字列表)
|
1 year ago |
ben.guo
|
402c314191
|
Add. 前馈神经网络
|
1 year ago |
ben.guo
|
dd4eae8820
|
Update. 更新展示图
|
1 year ago |
ben.guo
|
d89b6d1125
|
Update. 简化总体架构图的文字内容
|
1 year ago |
ben.guo
|
f8b5c104c8
|
Update. 更新语义关系的解释 & 数值缩放。
|
1 year ago |
ben.guo
|
699ea9cb52
|
Add. 增加WHY的内容,提高理解
|
1 year ago |
ben.guo
|
db57a5996c
|
ADD. 语义关系学习(多头注意力)
|
1 year ago |
ben.guo
|
4eb56b3f2b
|
docs. 文字向量化 & 位置编码
|
1 year ago |
ben.guo
|
1a2690e8a6
|
Add. 解码器(Decoder)概述 & 文字向量化
|
1 year ago |
ben.guo
|
5d3e0393da
|
Add. 第一章——Transformer网络架构
|
1 year ago |