(简体中文|[English](./README.md)) # 语音翻译 ## 介绍 语音翻译是将会话口语短语翻译成另一语言的过程。 该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。 ## 使用方法 ### 1. 安装 请看[安装文档](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/install_cn.md)。 你可以从 easy,medium,hard 三中方式中选择一种方式安装。 ### 2. 准备输入 这个 Demo 的输入是 WAV(`.wav`) 语音文件 这里给出一些样例文件供 Demo 使用: ```bash wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav ``` ### 3. 使用方法 (暂不支持Windows) - 命令行(推荐使用) ```bash paddlespeech st --input ./en.wav ``` 使用方法: ```bash paddlespeech st --help ``` 参数: - `input`(必须输入):用于翻译的音频。 - `model`: 语音翻译的模型类型. 默认:`fat_st_ted`。 - `src_lang`: 源语言. 默认:`en`。 - `tgt_lang`: 目标语言. 默认:`zh`。 - `sample_rate`:输入音频的采样率. 默认:`16000`。 - `config`:语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认:`None`。 - `ckpt_path`:模型文件. 如果没有默认使用预训练模型. 默认:`None`。 - `device`:选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备。 输出: ```bash [2021-12-09 11:13:03,178] [ INFO] [utils.py] [L225] - ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。'] ``` - Python API ```python import paddle from paddlespeech.cli.st import STExecutor st_executor = STExecutor() text = st_executor( model='fat_st_ted', src_lang='en', tgt_lang='zh', sample_rate=16000, config=None, # Set `config` and `ckpt_path` to None to use pretrained model. ckpt_path=None, audio_file='./en.wav', device=paddle.get_device()) print('ST Result: \n{}'.format(text)) ``` 输出: ```bash ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。'] ``` ### 4. 预训练模型 以下是 PaddleSpeech 提供的可以被命令行和 python API 使用的预训练模型列表: | 模型 | 源语言 | 目标语言 | :--- | :---: | :---: | | fat_st_ted| en| zh