From fecde703712407ef07f495a759b55eda93313b65 Mon Sep 17 00:00:00 2001 From: WongLaw Date: Wed, 7 Sep 2022 07:07:34 +0000 Subject: [PATCH] Revised the Chinese doc, test=doc --- demos/metaverse/README_cn.md | 10 +++++----- demos/story_talker/README_cn.md | 2 +- demos/style_fs2/README_cn.md | 10 +++++----- 3 files changed, 11 insertions(+), 11 deletions(-) diff --git a/demos/metaverse/README_cn.md b/demos/metaverse/README_cn.md index f252789b..02e6ea9a 100644 --- a/demos/metaverse/README_cn.md +++ b/demos/metaverse/README_cn.md @@ -4,13 +4,13 @@ ## 简介 -Metaverse是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。 +Metaverse 是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。 -这个演示是一个让图片中的名人“说话”的实现。通过 `PaddleSpeech` 和 `PaddleGAN`的 `TTS` 模块的组合,我们集成了安装和特定模块到一个shell脚本中。 +这个演示是一个让图片中的名人“说话”的实现。通过 `PaddleSpeech` 和 `PaddleGAN` 的 `TTS` 模块的组合,我们集成了安装和特定模块到一个 shell 脚本中。 ## 使用 -您可以使用 `PaddleSpeech` 和`PaddleGAN`的 `TTS` 模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。 +您可以使用 `PaddleSpeech` 和 `PaddleGAN` 的 `TTS` 模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。 运行 `run.sh` 完成所有基本程序,包括安装。 @@ -20,8 +20,8 @@ Metaverse是一种新的互联网应用和社交形式,融合了多种新技 在 `run.sh`, 先会执行 `source path.sh` 来设置好环境变量。 -如果您想尝试您的句子,请替换`sentences.txt`中的句子。 +如果您想尝试您的句子,请替换 `sentences.txt` 中的句子。 -如果您想尝试图像,请将图像替换shell脚本中的`download/Lamarr.png`。 +如果您想尝试图像,请将图像替换 shell 脚本中的 `download/Lamarr.png` 。 结果已显示在我们的 [notebook](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/tts/tts_tutorial.ipynb)。 diff --git a/demos/story_talker/README_cn.md b/demos/story_talker/README_cn.md index 1f14c6e3..7c4789dd 100644 --- a/demos/story_talker/README_cn.md +++ b/demos/story_talker/README_cn.md @@ -7,7 +7,7 @@ 故事书是非常重要的儿童启蒙书,但家长通常没有足够的时间为孩子读故事书。对于非常小的孩子,他们可能不理解故事书中的汉字。或有时,孩子们只是想“听”,而不想“读”。 -您可以使用`PaddleOCR` 获取故事书的文本,并通过`PaddleSpeech`的 `TTS` 模块进行阅读。 +您可以使用 `PaddleOCR` 获取故事书的文本,并通过 `PaddleSpeech` 的 `TTS` 模块进行阅读。 ## 使用 diff --git a/demos/style_fs2/README_cn.md b/demos/style_fs2/README_cn.md index c2d36cdd..5c74f691 100644 --- a/demos/style_fs2/README_cn.md +++ b/demos/style_fs2/README_cn.md @@ -4,17 +4,17 @@ ## 简介 -[FastSpeech2](https://arxiv.org/abs/2006.04558) 是用于语音合成的经典声学模型,它引入了可控语音输入,包括 `phoneme duration`、 `energy` 和 `pitch`。 +[FastSpeech2](https://arxiv.org/abs/2006.04558) 是用于语音合成的经典声学模型,它引入了可控语音输入,包括 `phoneme duration` 、 `energy` 和 `pitch` 。 在预测阶段,您可以更改这些变量以获得一些有趣的结果。 例如: -1. `FastSpeech2` 中的`duration` 可以控制音频的速度 ,并保持`pitch`。(在某些语音工具中,增加速度将增加音调,反之亦然。) -2. 当我们将一个句子的`pitch` 设置为平均值并将音素的`tones`设置为 `1`时,我们将获得 `robot-style` 的音色。 -3. 当我们提高成年女性的`pitch` (比例固定)时,我们会得到 `child-style` 的音色。 +1. `FastSpeech2` 中的 `duration` 可以控制音频的速度 ,并保持 `pitch` 。(在某些语音工具中,增加速度将增加音调,反之亦然。) +2. 当我们将一个句子的 `pitch` 设置为平均值并将音素的 `tones` 设置为 `1` 时,我们将获得 `robot-style` 的音色。 +3. 当我们提高成年女性的 `pitch` (比例固定)时,我们会得到 `child-style` 的音色。 -句子中不同音素的 `duration` 和 `pitch`可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。 +句子中不同音素的 `duration` 和 `pitch` 可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。 ## 运行