|
|
|
@ -1,12 +1,12 @@
|
|
|
|
|
# 使用 Aishell 数据集训练 DeepSpeech2 的离线/在线 ASR 模型
|
|
|
|
|
此示例包含用于使用[Aishell数据集](http://www.openslr.org/resources/33)训练DeepSpeech2离线或在线模型的代码。
|
|
|
|
|
此示例包含用于使用[Aishell数据集](http://www.openslr.org/resources/33)训练DeepSpeech2流式或非流式模型的代码。
|
|
|
|
|
## 概述
|
|
|
|
|
您需要的所有脚本都在`run.sh`中。`run.sh`中有几个阶段,每个阶段都有其功能。
|
|
|
|
|
| 阶段 | 功能 |
|
|
|
|
|
|:---- |:----------------------------------------------------------- |
|
|
|
|
|
| 0 | 数据处理。包括:<br> (1) 下载数据集 <br> (2) 计算训练数据集的CMVN <br> (3) 获取词汇文件 <br> (4) 获取训练、开发和测试数据集的manifest文件 |
|
|
|
|
|
| 1 | 训练模型 |
|
|
|
|
|
| 2 | 通过平均前k个最佳模型来获得最终模型,设置k=1表示选择最佳模型 |
|
|
|
|
|
| 2 | 通过平均最好k个最佳模型来获得最终模型,设置k=1表示选择最佳模型 |
|
|
|
|
|
| 3 | 测试最终模型性能 |
|
|
|
|
|
| 4 | 导出静态图模型 |
|
|
|
|
|
| 5 | 测试静态图模型 |
|
|
|
|
@ -39,7 +39,7 @@ source ${MAIN_ROOT}/utils/parse_options.sh
|
|
|
|
|
`stop_stage`表示您想在实验中结束于哪个阶段。
|
|
|
|
|
`conf_path`表示模型的配置路径。
|
|
|
|
|
`avg_num`表示要平均的最好的 k 个最佳模型的数量,以获得最终模型。
|
|
|
|
|
`model_type`表示模型类型:离线或在线
|
|
|
|
|
`model_type`表示模型类型:流式/非流式
|
|
|
|
|
`audio_file`表示在阶段6中您想进行推理的单个文件的路径。
|
|
|
|
|
`ckpt`表示模型的检查点前缀,例如"deepspeech2"
|
|
|
|
|
您可以在使用`run.sh`时设置局部变量(除了`ckpt`)。
|
|
|
|
|