diff --git a/README.md b/README.md index 83d10100..e90623f9 100644 --- a/README.md +++ b/README.md @@ -4,17 +4,6 @@ *DeepSpeech on PaddlePaddle* is an open-source implementation of end-to-end Automatic Speech Recognition (ASR) engine, with [PaddlePaddle](https://github.com/PaddlePaddle/Paddle) platform. Our vision is to empower both industrial application and academic research on speech recognition, via an easy-to-use, efficient and scalable implementation, including training, inference & testing module, and demo deployment. -For more information, please see below: -[Install](docs/install.md) -[Getting Started](docs/geting_stared.md) -[Data Prepration](docs/data_preparation.md) -[Data Augmentation](docs/augmentation.md) -[Ngram LM](docs/ngram_lm.md) -[Server Demo](docs/server.md) -[Benchmark](docs/benchmark.md) -[Relased Model](docs/released_model.md) -[FAQ](docs/faq.md) - ## Models * [Baidu's Deep Speech2](http://proceedings.mlr.press/v48/amodei16.pdf) @@ -43,6 +32,17 @@ source tools/venv/bin/activate Please see [Getting Started](docs/geting_started.md) and [tiny egs](examples/tiny/README.md). +## More Information +* [Install](docs/install.md) +* [Getting Started](docs/geting_stared.md) +* [Data Prepration](docs/data_preparation.md) +* [Data Augmentation](docs/augmentation.md) +* [Ngram LM](docs/ngram_lm.md) +* [Server Demo](docs/server.md) +* [Benchmark](docs/benchmark.md) +* [Relased Model](docs/released_model.md) +* [FAQ](docs/faq.md) + ## Questions and Help diff --git a/README_cn.md b/README_cn.md index ff9d3c07..23e486b2 100644 --- a/README_cn.md +++ b/README_cn.md @@ -5,22 +5,11 @@ *DeepSpeech on PaddlePaddle*是一个采用[PaddlePaddle](https://github.com/PaddlePaddle/Paddle)平台的端到端自动语音识别(ASR)引擎的开源项目, 我们的愿景是为语音识别在工业应用和学术研究上,提供易于使用、高效和可扩展的工具,包括训练,推理,测试模块,以及 demo 部署。同时,我们还将发布一些预训练好的英语和普通话模型。 -更多信息如下: -[安装](docs/install.md) -[开始](docs/geting_stared.md) -[数据处理](docs/data_preparation.md) -[数据增强](docs/augmentation.md) -[语言模型](docs/ngram_lm.md) -[服务部署](docs/server.md) -[Benchmark](docs/benchmark.md) -[Relased Model](docs/released_model.md) -[FAQ](docs/faq.md) - ## 模型 * [Baidu's Deep Speech2](http://proceedings.mlr.press/v48/amodei16.pdf) ## 安装 -* python3.7 +* python 3.7 * paddlepaddle 2.0.0 - 安装依赖 @@ -43,6 +32,18 @@ source tools/venv/bin/activate 请查看 [Getting Started](docs/geting_started.md) 和 [tiny egs](examples/tiny/README.md)。 +## 更多信息 + +* [安装](docs/install.md) +* [开始](docs/geting_stared.md) +* [数据处理](docs/data_preparation.md) +* [数据增强](docs/augmentation.md) +* [语言模型](docs/ngram_lm.md) +* [服务部署](docs/server.md) +* [Benchmark](docs/benchmark.md) +* [Relased Model](docs/released_model.md) +* [FAQ](docs/faq.md) + ## 问题和帮助 欢迎您在[Github问题](https://github.com/PaddlePaddle/models/issues)中提交问题和bug。也欢迎您为这个项目做出贡献。 diff --git a/docs/faq.md b/docs/faq.md index dc14058c..e2942817 100644 --- a/docs/faq.md +++ b/docs/faq.md @@ -2,36 +2,36 @@ 1. 音频变速快慢到达什么晨读会影响识别率? -变速会提升识别效果,一般用0.9, 1.0, 1.1 的变速。 + 变速会提升识别效果,一般用0.9, 1.0, 1.1 的变速。 2. 音量大小到什么程度会影响识别率? -一般训练会固定音量到一个范围内,波动过大会影响训练,估计在10dB ~ 20dB吧。 + 一般训练会固定音量到一个范围内,波动过大会影响训练,估计在10dB ~ 20dB吧。 3. 语音模型训练数据的最小时长要求时多少? -Aishell-1大约178h的数据,数据越多越好。 + Aishell-1大约178h的数据,数据越多越好。 -4. 那些噪声或背景生会影响识别率? +4. 那些噪声或背景生会影响识别率? -主要是人生干扰和低信噪比会影响识别率。 + 主要是人生干扰和低信噪比会影响识别率。 -5. 单条语音数据的长度限制是多少? +5. 单条语音数据的长度限制是多少? -一般训练的语音长度会限制在1s~6s之间,和训练配置有关。 + 一般训练的语音长度会限制在1s~6s之间,和训练配置有关。 -6. 背景声在识别前是否需要分离出来,或做降噪处理? +6. 背景声在识别前是否需要分离出来,或做降噪处理? -需要分离的,需要结合具体场景考虑。 + 需要分离的,需要结合具体场景考虑。 -7. 模型是否带有VAD人生激活识别能力? +7. 模型是否带有VAD人生激活识别能力? -VAD是单独的模型或模块,模型不包含此能力。 + VAD是单独的模型或模块,模型不包含此能力。 -8. 是否支持长语音识别? +8. 是否支持长语音识别? -一般过VAD后识别。 + 一般过VAD后识别。 -9. Mandarin LM Large语言模型需要的硬件配置时怎样的? +9. Mandarin LM Large语言模型需要的硬件配置时怎样的? -内存能放得下LM即可。 + 内存能放得下LM即可。 diff --git a/examples/aishell/README.md b/examples/aishell/README.md index 0413d4b2..6d67d19a 100644 --- a/examples/aishell/README.md +++ b/examples/aishell/README.md @@ -2,8 +2,6 @@ ## CTC | Model | Config | Test set | CER | -| --- | --- | --- | --- | +| --- | --- | --- | --- | | DeepSpeech2 | conf/deepspeech2.yaml | test | 0.078977 | | DeepSpeech2 | release 1.8.5 | test | 0.080447 | - - diff --git a/examples/librispeech/README.md b/examples/librispeech/README.md index cb1ab003..536a0cd9 100644 --- a/examples/librispeech/README.md +++ b/examples/librispeech/README.md @@ -2,8 +2,6 @@ ## CTC | Model | Config | Test set | CER | -| --- | --- | --- | --- | +| --- | --- | --- | --- | | DeepSpeech2 | conf/deepspeech2.yaml | test-clean | 0.073973 | | DeepSpeech2 | release 1.8.5 | test-clean | 0.074939 | - -