diff --git a/人人都能看懂的Transformer/code/.DS_Store b/人人都能看懂的Transformer/code/.DS_Store new file mode 100644 index 0000000..f8ede27 Binary files /dev/null and b/人人都能看懂的Transformer/code/.DS_Store differ diff --git a/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md b/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md index 1e6d9ea..93f9734 100644 --- a/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md +++ b/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md @@ -1,6 +1,6 @@ # 第五章——多头注意力机制——全流程 -image-20240502141958851 +image-20240502141958851 ### 前言 diff --git a/人人都能看懂的Transformer/第八章——最后的输出.md b/人人都能看懂的Transformer/第八章——最后的输出.md index 97fa98c..949f89d 100644 --- a/人人都能看懂的Transformer/第八章——最后的输出.md +++ b/人人都能看懂的Transformer/第八章——最后的输出.md @@ -1,6 +1,6 @@ # 第八章——最后的输出 -image-20240503172501503 +image-20240503172501503 ### 前言 diff --git a/人人都能看懂的Transformer/第六章——数值缩放.md b/人人都能看懂的Transformer/第六章——数值缩放.md index 4dd62a7..1f802c8 100644 --- a/人人都能看懂的Transformer/第六章——数值缩放.md +++ b/人人都能看懂的Transformer/第六章——数值缩放.md @@ -1,6 +1,6 @@ # 第六章——数值缩放 -数值缩放 +数值缩放 ### 前言 diff --git a/人人都能看懂的Transformer/训练和推理的区别(选修).md b/人人都能看懂的Transformer/训练和推理的区别(选修).md index 311e471..7609d64 100644 --- a/人人都能看懂的Transformer/训练和推理的区别(选修).md +++ b/人人都能看懂的Transformer/训练和推理的区别(选修).md @@ -1,6 +1,6 @@ # 训练和推理的区别(选修) -image-20240509221555371 +image-20240509221555371 ### 前言