From 6cb42573bd841f426d7f39c68cda123525002cc7 Mon Sep 17 00:00:00 2001 From: "ben.guo" <909336740@qq.com> Date: Sat, 27 Apr 2024 18:42:15 +0800 Subject: [PATCH] =?UTF-8?q?Add.=20=E6=80=BB=E7=BB=93?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../第三章——位置编码.md | 7 +++++++ 1 file changed, 7 insertions(+) diff --git a/人人都能看懂的Transformer/第三章——位置编码.md b/人人都能看懂的Transformer/第三章——位置编码.md index 06cc697..2b35b94 100644 --- a/人人都能看懂的Transformer/第三章——位置编码.md +++ b/人人都能看懂的Transformer/第三章——位置编码.md @@ -229,3 +229,10 @@ tensor(-0.1923, grad_fn=) image-20240427183034655 + + +### 总结 + +位置编码使得模型能够理解单词在句子中的位置,从而更好地处理自然语言。无论是通过正弦和余弦函数的固定公式,还是通过可学习的参数,位置编码都为模型提供了理解文本所必需的结构信息。 + +且个人认为最重要的是在并行化的路上,走的更深了。那些鬼才们为了达到目的可以把每个部分进行拆解选择最优的同时,还能让各个模块联合到一起去达到他们想要的目的。 \ No newline at end of file