118 Commits (master)

Author SHA1 Message Date
ben.guo 1950a79a29 Add. 增加相关图片
1 year ago
ben.guo 0b4fb7403d Docs.增加训练跟推理的说明
1 year ago
ben.guo 1e8326ddfd Add. 神经网络demo & 总结
1 year ago
ben.guo 87cf7f340e Add. GPT-2里的前馈神经网络
1 year ago
ben.guo 39aacf2796 Create 第七章——前馈神经网络.md
1 year ago
ben.guo d23e7db9df Update. 修改公式,对应上源码
1 year ago
ben.guo 7f0d4c60fb Fix. 增加描述的文字
1 year ago
ben.guo 652873a266 Add. 层归一化 & 总结
1 year ago
ben.guo 2038d0b2a6 Create 第六章——数值缩放.md
1 year ago
ben.guo 2ebbad7d35 Fix. 更新数值缩放的全英文词
1 year ago
ben.guo ba5a0f6760 Add. 补充说明
1 year ago
ben.guo ed35b14d59 Add. 总结
1 year ago
ben.guo a3c7f56e73 Add. 上亿的参数量是怎么来的
1 year ago
ben.guo 2fb6c2b669 Fix. 修正一些说法
1 year ago
ben.guo b0c99eaf2a Add. QKV机制的数学逻辑
1 year ago
ben.guo 2d701745d9 Update. 补充A与Z的说明
1 year ago
ben.guo 3025191ab7 Update. 修改错误图内容
1 year ago
ben.guo cea684e532 Update. 增加解析内容
1 year ago
ben.guo de6d9c6f31 Add. Softmax归一化
1 year ago
ben.guo b3bdec33cb Add. Mask遮挡
1 year ago
ben.guo 27882eb585 Add. Scale缩放
1 year ago
ben.guo 6118b1904e Create. 第四章——多头注意力机制——QK矩阵相乘
1 year ago
ben.guo a29294c747 Add. 总结
1 year ago
ben.guo 5ebf1c65e9 Fix. 修改章节名
1 year ago
ben.guo 471440d224 Add. QK矩阵相乘
1 year ago
ben.guo 1de03d01db Fix. Attention——QKV权重运算
1 year ago
ben.guo d2c53c9d17 Add. 什么是矩阵相乘
1 year ago
ben.guo a6aef63f4b Fix. 调整表达字眼
1 year ago
ben.guo 8af85f9d7e Create 第四章——语义关系学习.md
1 year ago
ben.guo 1f757d9254 Add. 为什么是简单相加
1 year ago
ben.guo a2268769b4 Add. 增加位置编码正弦余弦的可解释性
1 year ago
ben.guo e4778d373a Add. 官方代码
1 year ago
ben.guo 20e3dd4dea fix. 修复图片展示
1 year ago
ben.guo 8b1c09d398 fix. 修复图片展示
1 year ago
ben.guo 8cf2a4076e Add. 添加源码地址
1 year ago
ben.guo 6cb42573bd Add. 总结
1 year ago
ben.guo 352824cd94 Add. 矩阵同位置相加
1 year ago
ben.guo 91256041f9 Add. GPT-2的位置编码方法
1 year ago
ben.guo 29136ec781 Update. Transformer里的位置编码方法(原文)
1 year ago
ben.guo 719e43eb7b Update. Transformer里的原始方法
1 year ago
ben.guo 316a5636a9 Update. Transformer里的原始方法
1 year ago
ben.guo efcda2cc2e Add. Transformer里的原始方法
1 year ago
ben.guo 5bd2e4d436 Add. 第三章——位置编码
1 year ago
ben.guo 53183ddd4f Add. 为什么Transformer(GPT场景)使用这种文字向量化的方式? & 总结
1 year ago
ben.guo 95bff73b15 Add. 前言
1 year ago
ben.guo 2f70593fe0 Update. 添加结果解释
1 year ago
ben.guo 8dd57ae7d1 Add. 添加第二章可复现的完整代码
1 year ago
ben.guo 2d656002ab Add. 从0开始Tokenizer
1 year ago
ben.guo a9567ffaef Update. 索引向量化
1 year ago
ben.guo 037814ce21 Add. 索引向量化
1 year ago
ben.guo 8fa0706659 Update. 增加文字向量化 & 位置编码部分解释
1 year ago
ben.guo 64bd461b02 Update. 增加实际代码
1 year ago
ben.guo 5d5b429869 Update. 实际案例
1 year ago
ben.guo dbb06eed9e Create. 第二章——文字向量化
1 year ago
ben.guo 2ab6d7012e Add. 增加第一章结束语
1 year ago
ben.guo 71376b76f2 Add. 转换成百分比概率
1 year ago
ben.guo 479d59d240 Update. 特征变换映射(全数字列表)
1 year ago
ben.guo aa7028e5ff fix. 修改错别字
1 year ago
ben.guo c5f8939a4a Add. 特征变换映射(全数字列表)
1 year ago
ben.guo 402c314191 Add. 前馈神经网络
1 year ago
ben.guo dd4eae8820 Update. 更新展示图
1 year ago
ben.guo d89b6d1125 Update. 简化总体架构图的文字内容
1 year ago
ben.guo f8b5c104c8 Update. 更新语义关系的解释 & 数值缩放。
1 year ago
ben.guo 699ea9cb52 Add. 增加WHY的内容,提高理解
1 year ago
ben.guo db57a5996c ADD. 语义关系学习(多头注意力)
1 year ago
ben.guo 4eb56b3f2b docs. 文字向量化 & 位置编码
1 year ago
ben.guo 1a2690e8a6 Add. 解码器(Decoder)概述 & 文字向量化
1 year ago
ben.guo 5d3e0393da Add. 第一章——Transformer网络架构
1 year ago