Update. 索引向量化

master
ben.guo 6 months ago
parent 037814ce21
commit a9567ffaef

@ -100,4 +100,11 @@ torch.Size([1, 4, 768])
<img src="../assets/image-20240426174122893.png" alt="image-20240426174122893" style="zoom:50%;" />
可以看到最终维度是转成了768列4行。也就对应着4个索引和GPT2的嵌入向量维度768
可以看到最终维度是转成了768列4行。也就对应着4个索引和GPT2的嵌入向量维度768。
注意上面的模型是已经预训练好了我们可以进行微调或从头开始训练那应该怎么做呢这里我们就涉及从0训练Tokenizer和从0训练Model下面我们来演示从0开始训练。
从0开始Tokenizer

Loading…
Cancel
Save