From 075fcc529e953845f741d4e7e394782a9b346234 Mon Sep 17 00:00:00 2001
From: megemini <megemini@outlook.com>
Date: Thu, 28 Nov 2024 15:51:01 +0800
Subject: [PATCH] [Update] dim == 1

---
 paddlespeech/t2s/models/fastspeech2/fastspeech2.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/paddlespeech/t2s/models/fastspeech2/fastspeech2.py b/paddlespeech/t2s/models/fastspeech2/fastspeech2.py
index 3dd90b588..fcd54f0d2 100644
--- a/paddlespeech/t2s/models/fastspeech2/fastspeech2.py
+++ b/paddlespeech/t2s/models/fastspeech2/fastspeech2.py
@@ -841,9 +841,10 @@ class FastSpeech2(nn.Layer):
             spk_emb = self.spk_projection(F.normalize(spk_emb))
             hs = hs + spk_emb.unsqueeze(1)
         elif self.spk_embed_integration_type == "concat":
-            # concat hidden states with spk embeds and then apply projection
-            if spk_emb.dim() < 2:
+            # one wave `spk_emb` under synthesize, the dim is `1`
+            if spk_emb.dim() == 1:
                 spk_emb = spk_emb.unsqueeze(0)
+            # concat hidden states with spk embeds and then apply projection
             spk_emb = F.normalize(spk_emb).unsqueeze(1).expand(
                 shape=[-1, paddle.shape(hs)[1], -1])
             hs = self.spk_projection(paddle.concat([hs, spk_emb], axis=-1))