You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
(简体中文|[English](./README.md))
# 语音翻译
## 介绍
语音翻译是将会话口语短语翻译成另一语言的过程。
该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。
## 使用方法
### 1. 安装
请看[安装文档](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/install_cn.md)。
你可以从 easy, medium, hard 三中方式中选择一种方式安装。
### 2. 准备输入
这个 Demo 的输入是 WAV(`.wav`) 语音文件
这里给出一些样例文件供 Demo 使用:
```bash
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
```
### 3. 使用方法 (暂不支持Windows)
- 命令行(推荐使用)
```bash
paddlespeech st --input ./en.wav
```
使用方法:
```bash
paddlespeech st --help
```
参数:
- `input` (必须输入):用于翻译的音频。
- `model` : 语音翻译的模型类型. 默认:`fat_st_ted`。
- `src_lang` : 源语言. 默认:`en`。
- `tgt_lang` : 目标语言. 默认:`zh`。
- `sample_rate` :输入音频的采样率. 默认:`16000`。
- `config` :语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认:`None`。
- `ckpt_path` :模型文件. 如果没有默认使用预训练模型. 默认:`None`。
- `device` :选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备。
输出:
```bash
[2021-12-09 11:13:03,178] [ INFO] [utils.py] [L225] - ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。']
```
- Python API
```python
import paddle
from paddlespeech.cli.st import STExecutor
st_executor = STExecutor()
text = st_executor(
model='fat_st_ted',
src_lang='en',
tgt_lang='zh',
sample_rate=16000,
config=None, # Set `config` and `ckpt_path` to None to use pretrained model.
ckpt_path=None,
audio_file='./en.wav',
device=paddle.get_device())
print('ST Result: \n{}'.format(text))
```
输出:
```bash
ST Result:
['我 在 这栋 建筑 的 古老 门上 敲门 。']
```
### 4. 预训练模型
以下是 PaddleSpeech 提供的可以被命令行和 python API 使用的预训练模型列表:
| 模型 | 源语言 | 目标语言
| :--- | :---: | :---: |
| fat_st_ted| en| zh