You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
PaddleSpeech/demos/speech_translation/README_cn.md

78 lines
2.4 KiB

(简体中文|[English](./README.md))
# 语音翻译
## 介绍
语音翻译是将会话口语短语翻译成另一语言的过程。
该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。
## 使用方法
### 1. 安装
请看[安装文档](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/install_cn.md)。
你可以从 easymediumhard 三中方式中选择一种方式安装。
### 2. 准备输入
这个 Demo 的输入是 WAV(`.wav`) 语音文件
这里给出一些样例文件供 Demo 使用:
```bash
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
```
### 3. 使用方法 (暂不支持Windows)
- 命令行(推荐使用)
```bash
paddlespeech st --input ./en.wav
```
使用方法:
```bash
paddlespeech st --help
```
参数:
- `input`(必须输入):用于翻译的音频。
- `model` 语音翻译的模型类型. 默认:`fat_st_ted`。
- `src_lang` 源语言. 默认:`en`。
- `tgt_lang` 目标语言. 默认:`zh`。
- `sample_rate`:输入音频的采样率. 默认:`16000`。
- `config`:语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认:`None`。
- `ckpt_path`:模型文件. 如果没有默认使用预训练模型. 默认:`None`。
- `device`:选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备。
输出:
```bash
[2021-12-09 11:13:03,178] [ INFO] [utils.py] [L225] - ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。']
```
- Python API
```python
import paddle
from paddlespeech.cli.st import STExecutor
st_executor = STExecutor()
text = st_executor(
model='fat_st_ted',
src_lang='en',
tgt_lang='zh',
sample_rate=16000,
config=None, # Set `config` and `ckpt_path` to None to use pretrained model.
ckpt_path=None,
audio_file='./en.wav',
device=paddle.get_device())
print('ST Result: \n{}'.format(text))
```
输出:
```bash
ST Result:
['我 在 这栋 建筑 的 古老 门上 敲门 。']
```
### 4. 预训练模型
以下是 PaddleSpeech 提供的可以被命令行和 python API 使用的预训练模型列表:
| 模型 | 源语言 | 目标语言
| :--- | :---: | :---: |
| fat_st_ted| en| zh