Add-Building the training dataset

pull/2/head
benjas 5 years ago
parent dcd0c198c4
commit 0dd1e82175

Binary file not shown.

After

Width:  |  Height:  |  Size: 62 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 96 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 54 KiB

@ -66,3 +66,19 @@ RNN的问题在于每一次的h只考虑前一个当h到最后的时候
> 如上图的男人和男孩有相当部分的区域颜色是相似的,只是有的浅了点,有的深了点。同样的地方,对比水,它们之间相差的就非常远,颜色基本没有关联。 > 如上图的男人和男孩有相当部分的区域颜色是相似的,只是有的浅了点,有的深了点。同样的地方,对比水,它们之间相差的就非常远,颜色基本没有关联。
#### 训练数据构建
输入数据从哪来首先我们得理解的是文字单词转换成数值它并不是仅仅针对该次任务或者该数据的Thou或者shalt在这里是有这些意思转成对应的数值在其它文本其它数据中也是同样的意思所以只要是符合逻辑的文本我们都可以拿来训练。目前有Google的预训练bert模型也是这个原理。
![1609548160973](assets/1609548160973.png)
如何训练
![1609548501773](assets/1609548501773.png)
> 我们选中三个单词以thou shalt 来预测not也可以不断的往后滑动如以shalt not来预测make
![1609548578713](assets/1609548578713.png)

Loading…
Cancel
Save