From a14a3e3b5941051ef6feed8a35a13f75e49312e4 Mon Sep 17 00:00:00 2001 From: "ben.guo" <909336740@qq.com> Date: Fri, 3 May 2024 17:31:31 +0800 Subject: [PATCH] =?UTF-8?q?Create=20=E7=AC=AC=E5=85=AB=E7=AB=A0=E2=80=94?= =?UTF-8?q?=E2=80=94=E6=9C=80=E5=90=8E=E7=9A=84=E8=BE=93=E5=87=BA.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../第八章——最后的输出.md | 12 ++++++++++++ 1 file changed, 12 insertions(+) create mode 100644 人人都能看懂的Transformer/第八章——最后的输出.md diff --git a/人人都能看懂的Transformer/第八章——最后的输出.md b/人人都能看懂的Transformer/第八章——最后的输出.md new file mode 100644 index 0000000..38123d1 --- /dev/null +++ b/人人都能看懂的Transformer/第八章——最后的输出.md @@ -0,0 +1,12 @@ +### 第八章——最后的输出 + +image-20240503172501503 + +### 前言 + +FFNN前馈神经网络输出结果后,经过数值缩放,来到了这里。终于来到模块的最后了!Linear跟Softmax要讲的内容不多,我们放在一起,一次性过完。数值缩放由于是一样的,所以我们之间跳过了。 + + + +### Linear层 +