Merge pull request #2357 from WongLaw/develop
Add Chinese doc and language switcher for demos of metaverse, style_fs2 and story_talkerpull/2362/head
commit
7fbe483bc9
@ -0,0 +1,27 @@
|
|||||||
|
(简体中文|[English](./README.md))
|
||||||
|
|
||||||
|
# Metaverse
|
||||||
|
|
||||||
|
## 简介
|
||||||
|
|
||||||
|
Metaverse 是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。
|
||||||
|
|
||||||
|
这个演示是一个让图片中的名人“说话”的实现。通过 `PaddleSpeech` 和 `PaddleGAN` 的 `TTS` 模块的组合,我们集成了安装和特定模块到一个 shell 脚本中。
|
||||||
|
|
||||||
|
## 使用
|
||||||
|
|
||||||
|
您可以使用 `PaddleSpeech` 和 `PaddleGAN` 的 `TTS` 模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。
|
||||||
|
|
||||||
|
运行 `run.sh` 完成所有基本程序,包括安装。
|
||||||
|
|
||||||
|
```bash
|
||||||
|
./run.sh
|
||||||
|
```
|
||||||
|
|
||||||
|
在 `run.sh`, 先会执行 `source path.sh` 来设置好环境变量。
|
||||||
|
|
||||||
|
如果您想尝试您的句子,请替换 `sentences.txt` 中的句子。
|
||||||
|
|
||||||
|
如果您想尝试图像,请将图像替换 shell 脚本中的 `download/Lamarr.png` 。
|
||||||
|
|
||||||
|
结果已显示在我们的 [notebook](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/tts/tts_tutorial.ipynb)。
|
@ -0,0 +1,20 @@
|
|||||||
|
|
||||||
|
(简体中文|[English](./README.md))
|
||||||
|
|
||||||
|
# Story Talker
|
||||||
|
|
||||||
|
## 简介
|
||||||
|
|
||||||
|
故事书是非常重要的儿童启蒙书,但家长通常没有足够的时间为孩子读故事书。对于非常小的孩子,他们可能不理解故事书中的汉字。或有时,孩子们只是想“听”,而不想“读”。
|
||||||
|
|
||||||
|
您可以使用 `PaddleOCR` 获取故事书的文本,并通过 `PaddleSpeech` 的 `TTS` 模块进行阅读。
|
||||||
|
|
||||||
|
## 使用
|
||||||
|
|
||||||
|
运行以下命令行开始:
|
||||||
|
|
||||||
|
```
|
||||||
|
./run.sh
|
||||||
|
```
|
||||||
|
|
||||||
|
结果已显示在 [notebook](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/tts/tts_tutorial.ipynb)。
|
@ -0,0 +1,33 @@
|
|||||||
|
(简体中文|[English](./README.md))
|
||||||
|
|
||||||
|
# Style FastSpeech2
|
||||||
|
|
||||||
|
## 简介
|
||||||
|
|
||||||
|
[FastSpeech2](https://arxiv.org/abs/2006.04558) 是用于语音合成的经典声学模型,它引入了可控语音输入,包括 `phoneme duration` 、 `energy` 和 `pitch` 。
|
||||||
|
|
||||||
|
在预测阶段,您可以更改这些变量以获得一些有趣的结果。
|
||||||
|
|
||||||
|
例如:
|
||||||
|
|
||||||
|
1. `FastSpeech2` 中的 `duration` 可以控制音频的速度 ,并保持 `pitch` 。(在某些语音工具中,增加速度将增加音调,反之亦然。)
|
||||||
|
2. 当我们将一个句子的 `pitch` 设置为平均值并将音素的 `tones` 设置为 `1` 时,我们将获得 `robot-style` 的音色。
|
||||||
|
3. 当我们提高成年女性的 `pitch` (比例固定)时,我们会得到 `child-style` 的音色。
|
||||||
|
|
||||||
|
句子中不同音素的 `duration` 和 `pitch` 可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。
|
||||||
|
|
||||||
|
## 运行
|
||||||
|
|
||||||
|
运行以下命令行开始:
|
||||||
|
|
||||||
|
```
|
||||||
|
./run.sh
|
||||||
|
```
|
||||||
|
|
||||||
|
在 `run.sh`, 会首先执行 `source path.sh` 去设置好环境变量。
|
||||||
|
|
||||||
|
如果您想尝试您的句子,请替换 `sentences.txt`中的句子。
|
||||||
|
|
||||||
|
更多的细节,请查看 `style_syn.py`。
|
||||||
|
|
||||||
|
语音样例可以在 [style-control-in-fastspeech2](https://paddlespeech.readthedocs.io/en/latest/tts/demo.html#style-control-in-fastspeech2) 查看。
|
Loading…
Reference in new issue