PaddleSpeech/cloud/pcloud_train.sh

DATA_PATH=$1
MODEL_PATH=$2
NUM_CPU=$3
NUM_GPU=$4
IS_LOCAL=$5

TRAIN_MANI=${DATA_PATH}/cloud.train.manifest
DEV_MANI=${DATA_PATH}/cloud.dev.manifest
TRAIN_TAR=${DATA_PATH}/cloud.train.tar
DEV_TAR=${DATA_PATH}/cloud.dev.tar
VOCAB_PATH=${DATA_PATH}/vocab.txt
MEAN_STD_FILE=${DATA_PATH}/mean_std.npz

# split train data for each pcloud node
python ./cloud/split_data.py \
--in_manifest_path=${TRAIN_MANI} \
--data_tar_path=${TRAIN_TAR} \
--out_manifest_path='/local.train.manifest'

# split dev data for each pcloud node
python ./cloud/split_data.py \
--in_manifest_path=${DEV_MANI} \
--data_tar_path=${DEV_TAR} \
--out_manifest_path='/local.dev.manifest'

# run train
python train.py \
--use_gpu=1 \
--trainer_count=${NUM_GPU} \
--num_threads_data=${NUM_CPU} \
--is_local=${IS_LOCAL} \
--mean_std_filepath=${MEAN_STD_FILE} \
--train_manifest_path='/local.train.manifest' \
--dev_manifest_path='/local.dev.manifest' \
--vocab_filepath=${VOCAB_PATH} \
--output_model_dir=${MODEL_PATH}
Implement uploading data in submit scripts and fix issues 7 years ago			`DATA_PATH=$1`
			`MODEL_PATH=$2`
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`NUM_CPU=$3`
			`NUM_GPU=$4`
			`IS_LOCAL=$5`

Implement uploading data in submit scripts and fix issues 7 years ago			`TRAIN_MANI=${DATA_PATH}/cloud.train.manifest`
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`DEV_MANI=${DATA_PATH}/cloud.dev.manifest`
Implement uploading data in submit scripts and fix issues 7 years ago			`TRAIN_TAR=${DATA_PATH}/cloud.train.tar`
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`DEV_TAR=${DATA_PATH}/cloud.dev.tar`
Implement uploading data to PaddleCloud 1. Refine data_utils/data.py, reuse process_utterance function. 2. Modified README. 3. Implement uploading data in cloud/upload_data.py 4. Merge branch 'develop' of https://github.com/PaddlePaddle/models into ds2_pcloud 7 years ago			`VOCAB_PATH=${DATA_PATH}/vocab.txt`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`MEAN_STD_FILE=${DATA_PATH}/mean_std.npz`

			`# split train data for each pcloud node`
Implement uploading data in submit scripts and fix issues 7 years ago			`python ./cloud/split_data.py \`
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`--in_manifest_path=${TRAIN_MANI} \`
			`--data_tar_path=${TRAIN_TAR} \`
			`--out_manifest_path='/local.train.manifest'`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago
			`# split dev data for each pcloud node`
Implement uploading data in submit scripts and fix issues 7 years ago			`python ./cloud/split_data.py \`
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`--in_manifest_path=${DEV_MANI} \`
			`--data_tar_path=${DEV_TAR} \`
			`--out_manifest_path='/local.dev.manifest'`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`# run train`
Refine submitting scripts for deepspeech2 on paddle cloud. 7 years ago			`python train.py \`
			`--use_gpu=1 \`
Bug fix and refine cloud training for DS2. Summary: 1. Add missing is_local argument (when set False, use pserver). 2. Add exception thrown if cp failed. 3. Add cloud mkdir if not cloud path for uploading does not exist. 4. Fix a bug using common path ./local_manifest for all nodes. (convert to /local_manifest) 5. Refine coding style. 7 years ago			`--trainer_count=${NUM_GPU} \`
			`--num_threads_data=${NUM_CPU} \`
			`--is_local=${IS_LOCAL} \`
			`--mean_std_filepath=${MEAN_STD_FILE} \`
			`--train_manifest_path='/local.train.manifest' \`
			`--dev_manifest_path='/local.dev.manifest' \`
			`--vocab_filepath=${VOCAB_PATH} \`
Implement uploading data to PaddleCloud 1. Refine data_utils/data.py, reuse process_utterance function. 2. Modified README. 3. Implement uploading data in cloud/upload_data.py 4. Merge branch 'develop' of https://github.com/PaddlePaddle/models into ds2_pcloud 7 years ago			`--output_model_dir=${MODEL_PATH}`