parent
e8f7a8fde1
commit
0bbb9c3ee2
@ -1,13 +0,0 @@
|
|||||||
cd librispeech
|
|
||||||
python librispeech.py
|
|
||||||
if [ $? -ne 0 ]; then
|
|
||||||
echo "Prepare LibriSpeech failed. Terminated."
|
|
||||||
exit 1
|
|
||||||
fi
|
|
||||||
cd -
|
|
||||||
|
|
||||||
cat librispeech/manifest.train* | shuf > manifest.train
|
|
||||||
cat librispeech/manifest.dev-clean > manifest.dev
|
|
||||||
cat librispeech/manifest.test-clean > manifest.test
|
|
||||||
|
|
||||||
echo "All done."
|
|
@ -1,10 +0,0 @@
|
|||||||
cd noise
|
|
||||||
python chime3_background.py
|
|
||||||
if [ $? -ne 0 ]; then
|
|
||||||
echo "Prepare CHiME3 background noise failed. Terminated."
|
|
||||||
exit 1
|
|
||||||
fi
|
|
||||||
cd -
|
|
||||||
|
|
||||||
cat noise/manifest.* > manifest.noise
|
|
||||||
echo "All done."
|
|
@ -0,0 +1,19 @@
|
|||||||
|
"""Set up paths for DS2"""
|
||||||
|
from __future__ import absolute_import
|
||||||
|
from __future__ import division
|
||||||
|
from __future__ import print_function
|
||||||
|
|
||||||
|
import os.path
|
||||||
|
import sys
|
||||||
|
|
||||||
|
|
||||||
|
def add_path(path):
|
||||||
|
if path not in sys.path:
|
||||||
|
sys.path.insert(0, path)
|
||||||
|
|
||||||
|
|
||||||
|
this_dir = os.path.dirname(__file__)
|
||||||
|
|
||||||
|
# Add project path to PYTHONPATH
|
||||||
|
proj_path = os.path.join(this_dir, '..')
|
||||||
|
add_path(proj_path)
|
@ -0,0 +1,28 @@
|
|||||||
|
#! /usr/bin/bash
|
||||||
|
|
||||||
|
pushd ../..
|
||||||
|
|
||||||
|
CUDA_VISIBLE_DEVICES=0 \
|
||||||
|
python -u infer.py \
|
||||||
|
--num_samples=10 \
|
||||||
|
--trainer_count=1 \
|
||||||
|
--beam_size=500 \
|
||||||
|
--num_proc_bsearch=12 \
|
||||||
|
--num_proc_data=12 \
|
||||||
|
--num_conv_layers=2 \
|
||||||
|
--num_rnn_layers=3 \
|
||||||
|
--rnn_layer_size=2048 \
|
||||||
|
--alpha=0.36 \
|
||||||
|
--beta=0.25 \
|
||||||
|
--cutoff_prob=0.99 \
|
||||||
|
--use_gru=False \
|
||||||
|
--use_gpu=True \
|
||||||
|
--share_rnn_weights=True \
|
||||||
|
--infer_manifest='data/librispeech/manifest.dev-clean' \
|
||||||
|
--mean_std_path='data/librispeech/mean_std.npz' \
|
||||||
|
--vocab_path='data/librispeech/eng_vocab.txt' \
|
||||||
|
--model_path='checkpoints/params.latest.tar.gz' \
|
||||||
|
--lang_model_path='lm/data/common_crawl_00.prune01111.trie.klm' \
|
||||||
|
--decoding_method='ctc_beam_search' \
|
||||||
|
--error_rate_type='wer' \
|
||||||
|
--specgram_type='linear'
|
@ -0,0 +1,32 @@
|
|||||||
|
#! /usr/bin/bash
|
||||||
|
|
||||||
|
pushd ../..
|
||||||
|
|
||||||
|
# download data, generate manifests
|
||||||
|
python data/librispeech/librispeech.py \
|
||||||
|
--manifest_prefix='data/librispeech/manifest' \
|
||||||
|
--full_download='True' \
|
||||||
|
--target_dir='~/.cache/paddle/dataset/speech/Libri'
|
||||||
|
|
||||||
|
if [ $? -ne 0 ]; then
|
||||||
|
echo "Prepare LibriSpeech failed. Terminated."
|
||||||
|
exit 1
|
||||||
|
fi
|
||||||
|
|
||||||
|
#cat data/librispeech/manifest.train* | shuf > data/librispeech/manifest.train
|
||||||
|
|
||||||
|
|
||||||
|
# compute mean and stddev for normalizer
|
||||||
|
python tools/compute_mean_std.py \
|
||||||
|
--manifest_path='data/librispeech/manifest.train' \
|
||||||
|
--num_samples=2000 \
|
||||||
|
--specgram_type='linear' \
|
||||||
|
--output_path='data/librispeech/mean_std.npz'
|
||||||
|
|
||||||
|
if [ $? -ne 0 ]; then
|
||||||
|
echo "Compute mean and stddev failed. Terminated."
|
||||||
|
exit 1
|
||||||
|
fi
|
||||||
|
|
||||||
|
|
||||||
|
echo "LibriSpeech Data preparation done."
|
@ -0,0 +1,28 @@
|
|||||||
|
#! /usr/bin/bash
|
||||||
|
|
||||||
|
pushd ../..
|
||||||
|
|
||||||
|
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \
|
||||||
|
python -u evaluate.py \
|
||||||
|
--batch_size=128 \
|
||||||
|
--trainer_count=8 \
|
||||||
|
--beam_size=500 \
|
||||||
|
--num_proc_bsearch=12 \
|
||||||
|
--num_proc_data=12 \
|
||||||
|
--num_conv_layers=2 \
|
||||||
|
--num_rnn_layers=3 \
|
||||||
|
--rnn_layer_size=2048 \
|
||||||
|
--alpha=0.36 \
|
||||||
|
--beta=0.25 \
|
||||||
|
--cutoff_prob=0.99 \
|
||||||
|
--use_gru=False \
|
||||||
|
--use_gpu=True \
|
||||||
|
--share_rnn_weights=True \
|
||||||
|
--test_manifest='data/librispeech/manifest.test-clean' \
|
||||||
|
--mean_std_path='data/librispeech/mean_std.npz' \
|
||||||
|
--vocab_path='data/librispeech/eng_vocab.txt' \
|
||||||
|
--model_path='checkpoints/params.latest.tar.gz' \
|
||||||
|
--lang_model_path='lm/data/common_crawl_00.prune01111.trie.klm' \
|
||||||
|
--decoding_method='ctc_beam_search' \
|
||||||
|
--error_rate_type='wer' \
|
||||||
|
--specgram_type='linear'
|
@ -0,0 +1,30 @@
|
|||||||
|
#! /usr/bin/bash
|
||||||
|
|
||||||
|
pushd ../..
|
||||||
|
|
||||||
|
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \
|
||||||
|
python -u train.py \
|
||||||
|
--batch_size=256 \
|
||||||
|
--trainer_count=8 \
|
||||||
|
--num_passes=200 \
|
||||||
|
--num_proc_data=12 \
|
||||||
|
--num_conv_layers=2 \
|
||||||
|
--num_rnn_layers=3 \
|
||||||
|
--rnn_layer_size=2048 \
|
||||||
|
--num_iter_print=100 \
|
||||||
|
--learning_rate=5e-4 \
|
||||||
|
--max_duration=27.0 \
|
||||||
|
--min_duration=0.0 \
|
||||||
|
--use_sortagrad=True \
|
||||||
|
--use_gru=False \
|
||||||
|
--use_gpu=True \
|
||||||
|
--is_local=True \
|
||||||
|
--share_rnn_weights=True \
|
||||||
|
--train_manifest='data/librispeech/manifest.train' \
|
||||||
|
--dev_manifest='data/librispeech/manifest.dev' \
|
||||||
|
--mean_std_path='data/librispeech/mean_std.npz' \
|
||||||
|
--vocab_path='data/librispeech/eng_vocab.txt' \
|
||||||
|
--output_model_dir='./checkpoints' \
|
||||||
|
--augment_conf_path='conf/augmentation.config' \
|
||||||
|
--specgram_type='linear' \
|
||||||
|
--shuffle_method='batch_shuffle_clipped'
|
@ -0,0 +1,30 @@
|
|||||||
|
#! /usr/bin/bash
|
||||||
|
|
||||||
|
pushd ../..
|
||||||
|
|
||||||
|
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \
|
||||||
|
python -u tools/tune.py \
|
||||||
|
--num_samples=100 \
|
||||||
|
--trainer_count=8 \
|
||||||
|
--beam_size=500 \
|
||||||
|
--num_proc_bsearch=12 \
|
||||||
|
--num_conv_layers=2 \
|
||||||
|
--num_rnn_layers=3 \
|
||||||
|
--rnn_layer_size=2048 \
|
||||||
|
--num_alphas=14 \
|
||||||
|
--num_betas=20 \
|
||||||
|
--alpha_from=0.1 \
|
||||||
|
--alpha_to=0.36 \
|
||||||
|
--beta_from=0.05 \
|
||||||
|
--beta_to=1.0 \
|
||||||
|
--cutoff_prob=0.99 \
|
||||||
|
--use_gru=False \
|
||||||
|
--use_gpu=True \
|
||||||
|
--share_rnn_weights=True \
|
||||||
|
--tune_manifest='data/librispeech/manifest.dev-clean' \
|
||||||
|
--mean_std_path='data/librispeech/mean_std.npz' \
|
||||||
|
--vocab_path='data/librispeech/eng_vocab.txt' \
|
||||||
|
--model_path='checkpoints/params.latest.tar.gz' \
|
||||||
|
--lang_model_path='lm/data/common_crawl_00.prune01111.trie.klm' \
|
||||||
|
--error_rate_type='wer' \
|
||||||
|
--specgram_type='linear'
|
Loading…
Reference in new issue