PaddleSpeech/paddlespeech/resource/model_alias.py

# Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

__all__ = [
    'model_alias',
]

# Records of model name to import class
model_alias = {
    # ---------------------------------
    # -------------- SSL --------------
    # ---------------------------------
    "wav2vec2ASR": ["paddlespeech.s2t.models.wav2vec2:Wav2vec2ASR"],
    "wav2vec2": ["paddlespeech.s2t.models.wav2vec2:Wav2vec2Base"],
    "hubertASR": ["paddlespeech.s2t.models.hubert:HubertASR"],
    "hubert": ["paddlespeech.s2t.models.hubert:HubertBase"],
    "wavlmASR": ["paddlespeech.s2t.models.wavlm:WavLMASR"],

    # ---------------------------------
    # -------------- ASR --------------
    # ---------------------------------
    "deepspeech2offline": ["paddlespeech.s2t.models.ds2:DeepSpeech2Model"],
    "deepspeech2online": ["paddlespeech.s2t.models.ds2:DeepSpeech2Model"],
    "conformer": ["paddlespeech.s2t.models.u2:U2Model"],
    "conformer_online": ["paddlespeech.s2t.models.u2:U2Model"],
    "conformer_u2pp_online": ["paddlespeech.s2t.models.u2:U2Model"],
    "transformer": ["paddlespeech.s2t.models.u2:U2Model"],
    "wenetspeech": ["paddlespeech.s2t.models.u2:U2Model"],

    # ---------------------------------
    # ------------ Whisper ------------
    # ---------------------------------
    "whisper": ["paddlespeech.s2t.models.whisper:Whisper"],

    # ---------------------------------
    # -------------- CLS --------------
    # ---------------------------------
    "panns_cnn6": ["paddlespeech.cls.models.panns:CNN6"],
    "panns_cnn10": ["paddlespeech.cls.models.panns:CNN10"],
    "panns_cnn14": ["paddlespeech.cls.models.panns:CNN14"],

    # ---------------------------------
    # -------------- ST ---------------
    # ---------------------------------
    "fat_st": ["paddlespeech.s2t.models.u2_st:U2STModel"],

    # ---------------------------------
    # -------------- TEXT -------------
    # ---------------------------------
    "ernie_linear_p7": [
        "paddlespeech.text.models:ErnieLinear",
        "paddlenlp.transformers:ErnieTokenizer"
    ],
    "ernie_linear_p3": [
        "paddlespeech.text.models:ErnieLinear",
        "paddlenlp.transformers:ErnieTokenizer"
    ],
    "ernie_linear_p3_wudao": [
        "paddlespeech.text.models:ErnieLinear",
        "paddlenlp.transformers:ErnieTokenizer"
    ],

    # ---------------------------------
    # -------------- TTS --------------
    # ---------------------------------
    # acoustic model
    "speedyspeech": ["paddlespeech.t2s.models.speedyspeech:SpeedySpeech"],
    "speedyspeech_inference":
    ["paddlespeech.t2s.models.speedyspeech:SpeedySpeechInference"],
    "fastspeech2": ["paddlespeech.t2s.models.fastspeech2:FastSpeech2"],
    "fastspeech2_inference":
    ["paddlespeech.t2s.models.fastspeech2:FastSpeech2Inference"],
    "tacotron2": ["paddlespeech.t2s.models.tacotron2:Tacotron2"],
    "tacotron2_inference":
    ["paddlespeech.t2s.models.tacotron2:Tacotron2Inference"],
    # voc
    "pwgan": ["paddlespeech.t2s.models.parallel_wavegan:PWGGenerator"],
    "pwgan_inference":
    ["paddlespeech.t2s.models.parallel_wavegan:PWGInference"],
    "mb_melgan": ["paddlespeech.t2s.models.melgan:MelGANGenerator"],
    "mb_melgan_inference": ["paddlespeech.t2s.models.melgan:MelGANInference"],
    "style_melgan": ["paddlespeech.t2s.models.melgan:StyleMelGANGenerator"],
    "style_melgan_inference":
    ["paddlespeech.t2s.models.melgan:StyleMelGANInference"],
    "hifigan": ["paddlespeech.t2s.models.hifigan:HiFiGANGenerator"],
    "hifigan_inference": ["paddlespeech.t2s.models.hifigan:HiFiGANInference"],
    "wavernn": ["paddlespeech.t2s.models.wavernn:WaveRNN"],
    "wavernn_inference": ["paddlespeech.t2s.models.wavernn:WaveRNNInference"],

    # ---------------------------------
    # ------------ Vector -------------
    # ---------------------------------
    "ecapatdnn": ["paddlespeech.vector.models.ecapa_tdnn:EcapaTdnn"],

    # ---------------------------------
    # -------------- kws --------------
    # ---------------------------------
    "mdtc": ["paddlespeech.kws.models.mdtc:MDTC"],
    "mdtc_for_kws": ["paddlespeech.kws.models.mdtc:KWSModel"],
}
Add paddlespeech.resource. 3 years ago			`# Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.`
			`#`
			`# Licensed under the Apache License, Version 2.0 (the "License");`
			`# you may not use this file except in compliance with the License.`
			`# You may obtain a copy of the License at`
			`#`
			`# http://www.apache.org/licenses/LICENSE-2.0`
			`#`
			`# Unless required by applicable law or agreed to in writing, software`
			`# distributed under the License is distributed on an "AS IS" BASIS,`
			`# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.`
			`# See the License for the specific language governing permissions and`
			`# limitations under the License.`

			`__all__ = [`
			`'model_alias',`
			`]`

			`# Records of model name to import class`
			`model_alias = {`
[ASR] support wav2vec2 command line and demo (#2658) * wav2vec2_cli * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * Update RESULTS.md * Update RESULTS.md * Update base_commands.py * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr 2 years ago			`# ---------------------------------`
			`# -------------- SSL --------------`
			`# ---------------------------------`
			`"wav2vec2ASR": ["paddlespeech.s2t.models.wav2vec2:Wav2vec2ASR"],`
			`"wav2vec2": ["paddlespeech.s2t.models.wav2vec2:Wav2vec2Base"],`
[ASR] Support Hubert, fintuned on the librispeech dataset (#3088) * librispeech hubert, test=asr * librispeech hubert, test=asr * hubert decode * review * copyright, notes, example related * hubert cli * pre-commit format * fix conflicts * fix conflicts * doc related * doc and train config * librispeech.py * support hubert cli 2 years ago			`"hubertASR": ["paddlespeech.s2t.models.hubert:HubertASR"],`
			`"hubert": ["paddlespeech.s2t.models.hubert:HubertBase"],`
Adapted wavlmASR model to pretrained weights and CLI 2 years ago			`"wavlmASR": ["paddlespeech.s2t.models.wavlm:WavLMASR"],`
[ASR] support wav2vec2 command line and demo (#2658) * wav2vec2_cli * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * Update RESULTS.md * Update RESULTS.md * Update base_commands.py * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr * wav2vec2 demo update: support different optimizer and lr_schedular, align mdoel, update input type, test=asr 2 years ago
Add paddlespeech.resource. 3 years ago			`# ---------------------------------`
			`# -------------- ASR --------------`
			`# ---------------------------------`
			`"deepspeech2offline": ["paddlespeech.s2t.models.ds2:DeepSpeech2Model"],`
fix #2013; and format 3 years ago			`"deepspeech2online": ["paddlespeech.s2t.models.ds2:DeepSpeech2Model"],`
Add paddlespeech.resource. 3 years ago			`"conformer": ["paddlespeech.s2t.models.u2:U2Model"],`
			`"conformer_online": ["paddlespeech.s2t.models.u2:U2Model"],`
support u2pp cli and server, optimiz code of u2pp decode, test=asr 2 years ago			`"conformer_u2pp_online": ["paddlespeech.s2t.models.u2:U2Model"],`
Add paddlespeech.resource. 3 years ago			`"transformer": ["paddlespeech.s2t.models.u2:U2Model"],`
			`"wenetspeech": ["paddlespeech.s2t.models.u2:U2Model"],`

[s2t] add whisper asr large model (#2640) * add whisper asr large model decoding, test=asr * fix code style. * fix json code style. * remove resource and fix code style. * fix yapf * add cli and demos, fix some code style. * fix some problem by comment. * fix yapf 2 years ago			`# ---------------------------------`
			`# ------------ Whisper ------------`
			`# ---------------------------------`
			`"whisper": ["paddlespeech.s2t.models.whisper:Whisper"],`

Add paddlespeech.resource. 3 years ago			`# ---------------------------------`
			`# -------------- CLS --------------`
			`# ---------------------------------`
			`"panns_cnn6": ["paddlespeech.cls.models.panns:CNN6"],`
			`"panns_cnn10": ["paddlespeech.cls.models.panns:CNN10"],`
			`"panns_cnn14": ["paddlespeech.cls.models.panns:CNN14"],`

			`# ---------------------------------`
			`# -------------- ST ---------------`
			`# ---------------------------------`
			`"fat_st": ["paddlespeech.s2t.models.u2_st:U2STModel"],`

			`# ---------------------------------`
			`# -------------- TEXT -------------`
			`# ---------------------------------`
			`"ernie_linear_p7": [`
			`"paddlespeech.text.models:ErnieLinear",`
			`"paddlenlp.transformers:ErnieTokenizer"`
			`],`
			`"ernie_linear_p3": [`
			`"paddlespeech.text.models:ErnieLinear",`
			`"paddlenlp.transformers:ErnieTokenizer"`
			`],`
Update model_alias.py Add a new model for faster text process in cli 2 years ago			`"ernie_linear_p3_wudao": [`
			`"paddlespeech.text.models:ErnieLinear",`
			`"paddlenlp.transformers:ErnieTokenizer"`
			`],`
Add paddlespeech.resource. 3 years ago
			`# ---------------------------------`
			`# -------------- TTS --------------`
			`# ---------------------------------`
			`# acoustic model`
			`"speedyspeech": ["paddlespeech.t2s.models.speedyspeech:SpeedySpeech"],`
			`"speedyspeech_inference":`
			`["paddlespeech.t2s.models.speedyspeech:SpeedySpeechInference"],`
			`"fastspeech2": ["paddlespeech.t2s.models.fastspeech2:FastSpeech2"],`
			`"fastspeech2_inference":`
			`["paddlespeech.t2s.models.fastspeech2:FastSpeech2Inference"],`
			`"tacotron2": ["paddlespeech.t2s.models.tacotron2:Tacotron2"],`
			`"tacotron2_inference":`
			`["paddlespeech.t2s.models.tacotron2:Tacotron2Inference"],`
			`# voc`
			`"pwgan": ["paddlespeech.t2s.models.parallel_wavegan:PWGGenerator"],`
			`"pwgan_inference":`
			`["paddlespeech.t2s.models.parallel_wavegan:PWGInference"],`
			`"mb_melgan": ["paddlespeech.t2s.models.melgan:MelGANGenerator"],`
			`"mb_melgan_inference": ["paddlespeech.t2s.models.melgan:MelGANInference"],`
			`"style_melgan": ["paddlespeech.t2s.models.melgan:StyleMelGANGenerator"],`
			`"style_melgan_inference":`
			`["paddlespeech.t2s.models.melgan:StyleMelGANInference"],`
			`"hifigan": ["paddlespeech.t2s.models.hifigan:HiFiGANGenerator"],`
			`"hifigan_inference": ["paddlespeech.t2s.models.hifigan:HiFiGANInference"],`
			`"wavernn": ["paddlespeech.t2s.models.wavernn:WaveRNN"],`
			`"wavernn_inference": ["paddlespeech.t2s.models.wavernn:WaveRNNInference"],`

			`# ---------------------------------`
			`# ------------ Vector -------------`
			`# ---------------------------------`
			`"ecapatdnn": ["paddlespeech.vector.models.ecapa_tdnn:EcapaTdnn"],`
Add kws cli and demo. 3 years ago
			`# ---------------------------------`
			`# -------------- kws --------------`
			`# ---------------------------------`
			`"mdtc": ["paddlespeech.kws.models.mdtc:MDTC"],`
			`"mdtc_for_kws": ["paddlespeech.kws.models.mdtc:KWSModel"],`
Add paddlespeech.resource. 3 years ago			`}`