diff --git a/人人都能看懂的Transformer/code/.DS_Store b/人人都能看懂的Transformer/code/.DS_Store
new file mode 100644
index 0000000..f8ede27
Binary files /dev/null and b/人人都能看懂的Transformer/code/.DS_Store differ
diff --git a/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md b/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md
index 1e6d9ea..93f9734 100644
--- a/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md
+++ b/人人都能看懂的Transformer/第五章——多头注意力机制——全流程.md
@@ -1,6 +1,6 @@
# 第五章——多头注意力机制——全流程
-
+
### 前言
diff --git a/人人都能看懂的Transformer/第八章——最后的输出.md b/人人都能看懂的Transformer/第八章——最后的输出.md
index 97fa98c..949f89d 100644
--- a/人人都能看懂的Transformer/第八章——最后的输出.md
+++ b/人人都能看懂的Transformer/第八章——最后的输出.md
@@ -1,6 +1,6 @@
# 第八章——最后的输出
-
+
### 前言
diff --git a/人人都能看懂的Transformer/第六章——数值缩放.md b/人人都能看懂的Transformer/第六章——数值缩放.md
index 4dd62a7..1f802c8 100644
--- a/人人都能看懂的Transformer/第六章——数值缩放.md
+++ b/人人都能看懂的Transformer/第六章——数值缩放.md
@@ -1,6 +1,6 @@
# 第六章——数值缩放
-
+
### 前言
diff --git a/人人都能看懂的Transformer/训练和推理的区别(选修).md b/人人都能看懂的Transformer/训练和推理的区别(选修).md
index 311e471..7609d64 100644
--- a/人人都能看懂的Transformer/训练和推理的区别(选修).md
+++ b/人人都能看懂的Transformer/训练和推理的区别(选修).md
@@ -1,6 +1,6 @@
# 训练和推理的区别(选修)
-
+
### 前言