You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
45 lines
1.6 KiB
45 lines
1.6 KiB
3 years ago
|
###########################################################
|
||
|
# DATA SETTING #
|
||
|
###########################################################
|
||
|
dataset_type: Ernie
|
||
|
train_path: data/iwslt2012_zh/train.txt
|
||
|
dev_path: data/iwslt2012_zh/dev.txt
|
||
|
test_path: data/iwslt2012_zh/test.txt
|
||
|
batch_size: 64
|
||
|
num_workers: 2
|
||
|
data_params:
|
||
|
pretrained_token: ernie-1.0
|
||
|
punc_path: data/iwslt2012_zh/punc_vocab
|
||
|
seq_len: 100
|
||
|
|
||
|
|
||
|
###########################################################
|
||
|
# MODEL SETTING #
|
||
|
###########################################################
|
||
|
model_type: ErnieLinear
|
||
|
model:
|
||
|
pretrained_token: ernie-1.0
|
||
|
num_classes: 4
|
||
|
|
||
|
###########################################################
|
||
|
# OPTIMIZER SETTING #
|
||
|
###########################################################
|
||
|
optimizer_params:
|
||
|
weight_decay: 1.0e-6 # weight decay coefficient.
|
||
|
|
||
|
scheduler_params:
|
||
|
learning_rate: 1.0e-5 # learning rate.
|
||
|
gamma: 1.0 # scheduler gamma.
|
||
|
|
||
|
###########################################################
|
||
|
# TRAINING SETTING #
|
||
|
###########################################################
|
||
|
max_epoch: 20
|
||
|
num_snapshots: 5
|
||
|
|
||
|
###########################################################
|
||
|
# OTHER SETTING #
|
||
|
###########################################################
|
||
|
num_snapshots: 10 # max number of snapshots to keep while training
|
||
|
seed: 42 # random seed for paddle, random, and np.random
|