add readme_cn for audio_tagging automatic_video_subtitiles, punctuation_restoration and speech_recognition, test=doc_fix (#1162)
parent
758fd66695
commit
03c801d453
@ -0,0 +1,44 @@
|
|||||||
|
(简体中文|[English](./README.md))
|
||||||
|
# 视频字幕生成
|
||||||
|
## 介绍
|
||||||
|
视频字幕生成可以使用语音识别系统从特定视频生成字幕。
|
||||||
|
|
||||||
|
这个 demo 是一个为视频自动生成字幕的实现,它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。
|
||||||
|
## 使用方法
|
||||||
|
### 1. 安装
|
||||||
|
```bash
|
||||||
|
pip install paddlespeech
|
||||||
|
```
|
||||||
|
### 2. 准备输入
|
||||||
|
获取包含特定语言语音的视频文件:
|
||||||
|
```bash
|
||||||
|
wget -c https://paddlespeech.bj.bcebos.com/demos/asr_demos/subtitle_demo1.mp4
|
||||||
|
```
|
||||||
|
从视频文件中提取单通道的 16kHz 采样率的 `.wav` 文件:
|
||||||
|
```bash
|
||||||
|
ffmpeg -i subtitle_demo1.mp4 -ac 1 -ar 16000 -vn input.wav
|
||||||
|
```
|
||||||
|
### 3. 使用方法
|
||||||
|
- Python API
|
||||||
|
```python
|
||||||
|
import paddle
|
||||||
|
from paddlespeech.cli import ASRExecutor, TextExecutor
|
||||||
|
|
||||||
|
asr_executor = ASRExecutor()
|
||||||
|
text_executor = TextExecutor()
|
||||||
|
|
||||||
|
text = asr_executor(
|
||||||
|
audio_file='input.wav',
|
||||||
|
device=paddle.get_device())
|
||||||
|
result = text_executor(
|
||||||
|
text=text,
|
||||||
|
task='punc',
|
||||||
|
model='ernie_linear_p3_wudao',
|
||||||
|
device=paddle.get_device())
|
||||||
|
print('Text Result: \n{}'.format(result))
|
||||||
|
```
|
||||||
|
输出:
|
||||||
|
```bash
|
||||||
|
Text Result:
|
||||||
|
当我说我可以把三十年的经验变成一个准确的算法,他们说不可能。当我说我们十个人就能实现对十九个城市变电站七乘二十四小时的实时监管,他们说不可能。
|
||||||
|
```
|
@ -0,0 +1,73 @@
|
|||||||
|
(简体中文|[English](./README.md))
|
||||||
|
|
||||||
|
# 标点恢复
|
||||||
|
## 介绍
|
||||||
|
|
||||||
|
标点恢复是语音识别系统中常见的后处理步骤。提高转录文本的可读性对于人类阅读和后续的自然语言处理任务是非常重要的。
|
||||||
|
|
||||||
|
这个 demo 是一个为原始文本恢复标点的实现,它可以通过使用 `PaddleSpeech` 的单个命令或 python 中的几行代码来实现。
|
||||||
|
|
||||||
|
## 使用方法
|
||||||
|
### 1. 安装
|
||||||
|
```bash
|
||||||
|
pip install paddlespeech
|
||||||
|
```
|
||||||
|
### 2. 准备输入
|
||||||
|
这个 demo 的输入是通过参数传递的特定语言的文本。
|
||||||
|
|
||||||
|
### 3. 使用方法
|
||||||
|
- 命令行 (推荐使用)
|
||||||
|
```bash
|
||||||
|
paddlespeech text --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭
|
||||||
|
```
|
||||||
|
使用方法:
|
||||||
|
```bash
|
||||||
|
paddlespeech text --help
|
||||||
|
```
|
||||||
|
参数:
|
||||||
|
- `input`(必须输入):原始文本。
|
||||||
|
- `task`:子任务,默认值:`punc`。
|
||||||
|
- `model`:文本模型类型,默认值:`ernie_linear_p7_wudao`。
|
||||||
|
- `lang`:模型语言, 默认值:`zh`。
|
||||||
|
- `config`:文本任务的配置文件,若不设置则使用预训练模型中的默认配置,默认值:`None`。
|
||||||
|
- `ckpt_path`:模型参数文件, 若不设置则下载预训练模型使用,默认值:`None`。
|
||||||
|
- `punc_vocab`:标点恢复任务的标点词表文件,默认值:`None`。
|
||||||
|
- `device`:执行预测的设备,默认值:当前系统下 paddlepaddle 的默认 device。
|
||||||
|
|
||||||
|
输出:
|
||||||
|
```bash
|
||||||
|
[2021-12-14 19:50:22,200] [ INFO] [log.py] [L57] - Text Result:
|
||||||
|
今天的天气真不错啊!你下午有空吗?我想约你一起去吃饭。
|
||||||
|
```
|
||||||
|
|
||||||
|
- Python API
|
||||||
|
```python
|
||||||
|
import paddle
|
||||||
|
from paddlespeech.cli import TextExecutor
|
||||||
|
|
||||||
|
text_executor = TextExecutor()
|
||||||
|
result = text_executor(
|
||||||
|
text='今天的天气真不错啊你下午有空吗我想约你一起去吃饭',
|
||||||
|
task='punc',
|
||||||
|
model='ernie_linear_p7_wudao',
|
||||||
|
lang='zh',
|
||||||
|
config=None,
|
||||||
|
ckpt_path=None,
|
||||||
|
punc_vocab=None,
|
||||||
|
device=paddle.get_device())
|
||||||
|
print('Text Result: \n{}'.format(result))
|
||||||
|
```
|
||||||
|
输出:
|
||||||
|
```bash
|
||||||
|
Text Result:
|
||||||
|
今天的天气真不错啊!你下午有空吗?我想约你一起去吃饭。
|
||||||
|
```
|
||||||
|
|
||||||
|
### 预训练模型
|
||||||
|
以下是 PaddleSpeech 提供的可以被命令行和 python API 使用的预训练模型列表:
|
||||||
|
|
||||||
|
- 标点恢复
|
||||||
|
| 模型 | 语言 | 标点类型数
|
||||||
|
| :--- | :---: | :---:
|
||||||
|
| ernie_linear_p3_wudao| zh | 3(,。?)
|
||||||
|
| ernie_linear_p7_wudao| zh | 7(,。!?、:;)
|
Loading…
Reference in new issue