########################################################### # DATA SETTING # ########################################################### dataset_type: Ernie train_path: data/iwslt2012_zh/train.txt dev_path: data/iwslt2012_zh/dev.txt test_path: data/iwslt2012_zh/test.txt batch_size: 64 num_workers: 2 data_params: pretrained_token: ernie-tiny punc_path: data/iwslt2012_zh/punc_vocab seq_len: 100 ########################################################### # MODEL SETTING # ########################################################### model_type: ErnieLinear model: pretrained_token: ernie-tiny num_classes: 4 ########################################################### # OPTIMIZER SETTING # ########################################################### optimizer_params: weight_decay: 1.0e-6 # weight decay coefficient. scheduler_params: learning_rate: 1.0e-5 # learning rate. gamma: 0.9999 # scheduler gamma must between(0.0, 1.0) and closer to 1.0 is better. ########################################################### # TRAINING SETTING # ########################################################### max_epoch: 20 num_snapshots: 5 ########################################################### # OTHER SETTING # ########################################################### num_snapshots: 10 # max number of snapshots to keep while training seed: 42 # random seed for paddle, random, and np.random