diff --git a/demos/metaverse/README.md b/demos/metaverse/README.md index e458256a..2c6b0d3e 100644 --- a/demos/metaverse/README.md +++ b/demos/metaverse/README.md @@ -1,3 +1,5 @@ +([简体中文](./README_cn.md)|English) + # Metaverse ## Introduction Metaverse is a new Internet application and social form integrating virtual reality produced by integrating a variety of new technologies. diff --git a/demos/metaverse/README_cn.md b/demos/metaverse/README_cn.md new file mode 100644 index 00000000..f252789b --- /dev/null +++ b/demos/metaverse/README_cn.md @@ -0,0 +1,27 @@ +(简体中文|[English](./README.md)) + +# Metaverse + +## 简介 + +Metaverse是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。 + +这个演示是一个让图片中的名人“说话”的实现。通过 `PaddleSpeech` 和 `PaddleGAN`的 `TTS` 模块的组合,我们集成了安装和特定模块到一个shell脚本中。 + +## 使用 + +您可以使用 `PaddleSpeech` 和`PaddleGAN`的 `TTS` 模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。 + +运行 `run.sh` 完成所有基本程序,包括安装。 + +```bash +./run.sh +``` + +在 `run.sh`, 先会执行 `source path.sh` 来设置好环境变量。 + +如果您想尝试您的句子,请替换`sentences.txt`中的句子。 + +如果您想尝试图像,请将图像替换shell脚本中的`download/Lamarr.png`。 + +结果已显示在我们的 [notebook](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/tts/tts_tutorial.ipynb)。 diff --git a/demos/style_fs2/README.md b/demos/style_fs2/README.md index 123230b8..618c7478 100644 --- a/demos/style_fs2/README.md +++ b/demos/style_fs2/README.md @@ -1,3 +1,5 @@ +([简体中文](./README_cn.md)|English) + # Style FastSpeech2 ## Introduction [FastSpeech2](https://arxiv.org/abs/2006.04558) is a classical acoustic model for Text-to-Speech synthesis, which introduces controllable speech input, including `phoneme duration`、 `energy` and `pitch`. diff --git a/demos/style_fs2/README_cn.md b/demos/style_fs2/README_cn.md new file mode 100644 index 00000000..c2d36cdd --- /dev/null +++ b/demos/style_fs2/README_cn.md @@ -0,0 +1,33 @@ +(简体中文|[English](./README.md)) + +# Style FastSpeech2 + +## 简介 + +[FastSpeech2](https://arxiv.org/abs/2006.04558) 是用于语音合成的经典声学模型,它引入了可控语音输入,包括 `phoneme duration`、 `energy` 和 `pitch`。 + +在预测阶段,您可以更改这些变量以获得一些有趣的结果。 + +例如: + +1. `FastSpeech2` 中的`duration` 可以控制音频的速度 ,并保持`pitch`。(在某些语音工具中,增加速度将增加音调,反之亦然。) +2. 当我们将一个句子的`pitch` 设置为平均值并将音素的`tones`设置为 `1`时,我们将获得 `robot-style` 的音色。 +3. 当我们提高成年女性的`pitch` (比例固定)时,我们会得到 `child-style` 的音色。 + +句子中不同音素的 `duration` 和 `pitch`可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。 + +## 运行 + +运行以下命令行开始: + +``` +./run.sh +``` + +在 `run.sh`, 会首先执行 `source path.sh` 去设置好环境变量。 + +如果您想尝试您的句子,请替换 `sentences.txt`中的句子。 + +更多的细节,请查看 `style_syn.py`。 + +语音样例可以在 [style-control-in-fastspeech2](https://paddlespeech.readthedocs.io/en/latest/tts/demo.html#style-control-in-fastspeech2) 查看。