From 9ec2bc8e2ecd78a2396127d933b912de76c14d49 Mon Sep 17 00:00:00 2001 From: KP <109694228@qq.com> Date: Mon, 20 Dec 2021 21:04:17 +0800 Subject: [PATCH] Update README. test=doc_fix --- demos/README.md | 11 +++++++--- demos/README_cn.md | 15 ++++++++++++++ paddlespeech/cli/README.md | 8 +++++++ paddlespeech/cli/README_cn.md | 39 +++++++++++++++++++++++++++++++++++ 4 files changed, 70 insertions(+), 3 deletions(-) create mode 100644 demos/README_cn.md create mode 100644 paddlespeech/cli/README_cn.md diff --git a/demos/README.md b/demos/README.md index 28bab8bb..4482aa19 100644 --- a/demos/README.md +++ b/demos/README.md @@ -1,10 +1,15 @@ # Speech Application based on PaddleSpeech +([简体中文](./README_cn.md)|English) + The directory containes many speech applications in multi scenarios. -* audio tagging - tag audio label in vedio -* metaverse - 2D AR with TTS -* speech recogintion - vidio understanding +* audio tagging - multi-label tagging of an audio file +* automatic_video_subtitiles - generate subtitles from a video +* metaverse - 2D AR with TTS +* punctuation_restoration - restore punctuation from raw text +* speech recogintion - recognize text of an audio file * speech translation - end to end speech translation * story talker - book reader based on OCR and TTS * style_fs2 - multi style control for FastSpeech2 model +* text_to_speech - convert text into speech diff --git a/demos/README_cn.md b/demos/README_cn.md new file mode 100644 index 00000000..242b4f07 --- /dev/null +++ b/demos/README_cn.md @@ -0,0 +1,15 @@ +# PaddleSpeech 语音应用 Demo + +(简体中文|[English](./README.md)) + +该目录包含基于 PaddleSpeech 开发的不同场景的语音应用 Demo: + +* 声音分类 - 基于 AudioSet 的 527 类标签的音频多标签分类。 +* 视频字幕生成 - 识别视频中语音的文本,并进行文本后处理。 +* 元宇宙 - 基于语音合成的 2D 增强现实。 +* 标点恢复 - 通常作为语音识别的文本后处理任务,为一段无标点的纯文本添加相应的标点符号。 +* 语音识别 - 识别一段音频中包含的语音文字。 +* 语音翻译 - 实时识别音频中的语言,并同时翻译成目标语言。 +* 会说话的故事书 - 基于 OCR 和语音合成的会说话的故事书。 +* 个性化语音合成 - 基于 FastSpeech2 模型的个性化语音合成。 +* 语音合成 - 基于给定的文本生成语音音频。 diff --git a/paddlespeech/cli/README.md b/paddlespeech/cli/README.md index 34466ec2..5ac7a3bc 100644 --- a/paddlespeech/cli/README.md +++ b/paddlespeech/cli/README.md @@ -1,5 +1,7 @@ # PaddleSpeech Command Line +([简体中文](./README_cn.md)|English) + The simplest approach to use PaddleSpeech models. ## Help @@ -28,3 +30,9 @@ paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav ``` + ## Text Post-precessing + +- Punctuation Restoration + ```bash + paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭 + ``` diff --git a/paddlespeech/cli/README_cn.md b/paddlespeech/cli/README_cn.md new file mode 100644 index 00000000..75ab9e41 --- /dev/null +++ b/paddlespeech/cli/README_cn.md @@ -0,0 +1,39 @@ +# PaddleSpeech 命令行工具 + +(简体中文|[English](./README.md)) + +`paddlespeech.cli` 模块是 PaddleSpeech 的命令行工具,它提供了最简便的方式调用 PaddleSpeech 提供的不同语音应用场景的预训练模型,用一行命令就可以进行模型预测: + + ## 命令行使用帮助 + ```bash + paddlespeech help + ``` + + ## 声音分类 + ```bash + paddlespeech cls --input input.wav + ``` + + ## 语音识别 + ``` + paddlespeech asr --lang zh --input input_16k.wav + ``` + + ## 语音翻译(英-中) + + (暂不支持Windows系统) + ```bash + paddlespeech st --input input_16k.wav + ``` + + ## 语音合成 + ```bash + paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav + ``` + + ## 文本后处理 + +- 标点恢复 + ```bash + paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭 + ```