PaddleSpeech/pcloud_train.sh

DATA_PATH=/pfs/dlnel/public/dataset/speech/libri
#setted by user
TRAIN_MANI=${DATA_PATH}/manifest_pcloud.train
#setted by user
DEV_MANI=${DATA_PATH}/manifest_pcloud.dev
#setted by user
TRAIN_TAR=${DATA_PATH}/data.train.tar
#setted by user
DEV_TAR=${DATA_PATH}/data.dev.tar
#setted by user
VOCAB_PATH=${DATA_PATH}/eng_vocab.txt
#setted by user
MEAN_STD_FILE=${DATA_PATH}/mean_std.npz

tar -xzvf deepspeech.tar.gz
rm -rf ./cloud/data/*

# split train data for each pcloud node
python ./cloud/pcloud_split_data.py \
--in_manifest_path=$TRAIN_MANI \
--data_tar_path=$TRAIN_TAR \
--out_manifest_path='./cloud/data/train.mani'

# split dev data for each pcloud node
python pcloud_split_data.py \
--in_manifest_path=$DEV_MANI \
--data_tar_path=$DEV_TAR \
--out_manifest_path='./cloud/data/dev.mani'

python train.py \
--use_gpu=1 \
--trainer_count=4 \
--batch_size=256 \
--mean_std_filepath=$MEAN_STD_FILE \
--train_manifest_path='./cloud/data/train.mani' \
--dev_manifest_path='./cloud/data/dev.mani' \
--vocab_filepath=$VOCAB_PATH \
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`DATA_PATH=/pfs/dlnel/public/dataset/speech/libri`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`#setted by user`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`TRAIN_MANI=${DATA_PATH}/manifest_pcloud.train`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`#setted by user`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`DEV_MANI=${DATA_PATH}/manifest_pcloud.dev`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`#setted by user`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`TRAIN_TAR=${DATA_PATH}/data.train.tar`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`#setted by user`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`DEV_TAR=${DATA_PATH}/data.dev.tar`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`#setted by user`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`VOCAB_PATH=${DATA_PATH}/eng_vocab.txt`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`#setted by user`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`MEAN_STD_FILE=${DATA_PATH}/mean_std.npz`

			`tar -xzvf deepspeech.tar.gz`
			`rm -rf ./cloud/data/*`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago
			`# split train data for each pcloud node`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`python ./cloud/pcloud_split_data.py \`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`--in_manifest_path=$TRAIN_MANI \`
			`--data_tar_path=$TRAIN_TAR \`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`--out_manifest_path='./cloud/data/train.mani'`

Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`# split dev data for each pcloud node`
			`python pcloud_split_data.py \`
			`--in_manifest_path=$DEV_MANI \`
			`--data_tar_path=$DEV_TAR \`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`--out_manifest_path='./cloud/data/dev.mani'`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago
			`python train.py \`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`--use_gpu=1 \`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`--trainer_count=4 \`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`--batch_size=256 \`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`--mean_std_filepath=$MEAN_STD_FILE \`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`--train_manifest_path='./cloud/data/train.mani' \`
			`--dev_manifest_path='./cloud/data/dev.mani' \`
Make ds2 run on paddle cloud 1. Refine data_utils/data.py to read bytes from tar file 2. Add scripts to submit paddle cloud job for ds2 trainning 7 years ago			`--vocab_filepath=$VOCAB_PATH \`