Create README.md

pull/2/head
benjas 5 years ago
parent 6553b88f3e
commit 39d9cd1a0d

@ -0,0 +1,131 @@
# README
[BERT开源框架地址](<https://github.com/google-research/bert>)最好读下README以下是预训练好的BERT模型这里用到两个
![1609825905750](C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1609825905750.png)
> 点击即可下载,里面内容如下
![1609826152438](assets/1609826152438.png)
![1609826160982](assets/1609826160982.png)
> json相关的参数
>
> vocab语料库
>
> 其它:使用时的是加载文件,如训练好的权重等
![1609826290795](assets/1609826290795.png)
> 下载一个数据集使用脚本命令下载可能需要翻墙可以访问我的百度云盘进行下载待补充。这里只用到MRPC
#### MRPC
内容如下:
![1609827571649](assets/1609827571649.png)
train.csv
![1609827493014](assets/1609827493014.png)
> 二分类任务:判断两句话是否说的是同一意思
>
> Quality是否相同相同为1
test.csv
![1609827666717](assets/1609827666717.png)
> 没有了Quality需要进行预测
#### download BERT
把bert的code全部下载下来并解压到指定目录
![1609827887131](assets/1609827887131.png)
#### 创建环境
~~~
# python3.7我的是window
pip install tensorflow==1.13.2 -i https://pypi.douban.com/simple
pip install numpy==1.16 -i https://pypi.douban.com/simple
~~~
#### 参数
![1609999902323](assets/1609999902323.png)
注意是run_classifier.py文件
![1609999954700](assets/1609999954700.png)
~~~
-task_name=MRPC
-do_train=true
-do_eval=true
-data_dir=../GLUE/glue_data/MRPC
-vocab_file=../GLUE/BERT_BASE_DIR/uncased_L-12_H-768_A-12/vocab.txt
-bert_config_file=../GLUE/BERT_BASE_DIR/uncased_L-12_H-768_A-12/bert_config.json
-init_checkpoint=../GLUE/BERT_BASE_DIR/uncased_L-12_H-768_A-12/bert_model.ckpt
-max_seq_length=128
-train_batch_size=8
-learning_rate=2e-5
--num_train_epochs=3.0
-output_dir=../GLUE/output/
~~~
> 配置完成后run该文件即可
![1610000183063](assets/1610000183063.png)
Google原版的
![1610000131364](assets/1610000131364.png)
#### 报错及解决办法
class AdamWeightDecayOptimizer(tf.optimizers.Optimizer): AttributeError: module 'tensorflow' has no attribute 'optimizers'
> 如下内容
~~~
tf.optimizers.Optimizer改为tf.keras.optimizers.Optimizer
~~~
super(AdamWeightDecayOptimizer, self).__init__(False, name) TypeError: __ini
~~~
super(AdamWeightDecayOptimizer, self).__init__(False, name)
改成
super(AdamWeightDecayOptimizer, self).__init__()
~~~
tensorflow/core/framework/op_kernel.cc:1401] OP_REQUIRES failed at save_restore_v2_ops.cc:109 : Not found: Failed to create a NewWriteableFile:
> 路径过长需要将整个项目移动到某盘下。要求满足1.段路径2.全英文
#### 备选方案
一直起不来的,可以直接使用我改好的代码文件(待补充)
Loading…
Cancel
Save