You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
50 lines
2.0 KiB
50 lines
2.0 KiB
###########################################################
|
|
# FEATURE EXTRACTION SETTING #
|
|
###########################################################
|
|
fs: 24000 # Sampling rate.
|
|
n_fft: 2048 # FFT size.
|
|
n_shift: 300 # Hop size.
|
|
win_length: 1200 # Window length.
|
|
# If set to null, it will be the same as fft_size.
|
|
window: "hann" # Window function.
|
|
n_mels: 80 # Number of mel basis.
|
|
fmin: 80 # Minimum freq in mel basis calculation.
|
|
fmax: 7600 # Maximum frequency in mel basis calculation.
|
|
|
|
###########################################################
|
|
# DATA SETTING #
|
|
###########################################################
|
|
batch_size: 64
|
|
num_workers: 4
|
|
|
|
###########################################################
|
|
# MODEL SETTING #
|
|
###########################################################
|
|
model:
|
|
encoder_hidden_size: 128
|
|
encoder_kernel_size: 3
|
|
encoder_dilations: [1, 3, 9, 27, 1, 3, 9, 27, 1, 1]
|
|
duration_predictor_hidden_size: 128
|
|
decoder_hidden_size: 128
|
|
decoder_output_size: 80
|
|
decoder_kernel_size: 3
|
|
decoder_dilations: [1, 3, 9, 27, 1, 3, 9, 27, 1, 3, 9, 27, 1, 3, 9, 27, 1, 1]
|
|
|
|
###########################################################
|
|
# OPTIMIZER SETTING #
|
|
###########################################################
|
|
optimizer:
|
|
optim: adam # optimizer type
|
|
learning_rate: 0.002 # learning rate
|
|
max_grad_norm: 1
|
|
|
|
###########################################################
|
|
# TRAINING SETTING #
|
|
###########################################################
|
|
max_epoch: 200
|
|
num_snapshots: 5
|
|
|
|
###########################################################
|
|
# OTHER SETTING #
|
|
###########################################################
|
|
seed: 10086 |