From 29136ec78102eadab45408c98bd93c1e185a9503 Mon Sep 17 00:00:00 2001 From: "ben.guo" <909336740@qq.com> Date: Sat, 27 Apr 2024 18:12:24 +0800 Subject: [PATCH] =?UTF-8?q?Update.=20Transformer=E9=87=8C=E7=9A=84?= =?UTF-8?q?=E4=BD=8D=E7=BD=AE=E7=BC=96=E7=A0=81=E6=96=B9=E6=B3=95=EF=BC=88?= =?UTF-8?q?=E5=8E=9F=E6=96=87=EF=BC=89?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../第三章——位置编码.md | 6 +++++- 1 file changed, 5 insertions(+), 1 deletion(-) diff --git a/人人都能看懂的Transformer/第三章——位置编码.md b/人人都能看懂的Transformer/第三章——位置编码.md index e5f353f..65f4a9a 100644 --- a/人人都能看懂的Transformer/第三章——位置编码.md +++ b/人人都能看懂的Transformer/第三章——位置编码.md @@ -32,7 +32,7 @@ GPT-2的位置编码是可学习的参数。这意味着模型在训练过程中 -### Transformer里的原始方法 +### Transformer里的位置编码方法(原文) ~~~python import numpy as np @@ -109,6 +109,10 @@ We chose this function because we hypothesized it would allow the model to easil +### GPT-2的位置编码方法 + + + ### 向量加法 以GPT-2为例(Hugging Face开源的GPT), \ No newline at end of file