From eda7a35b4efa93360b12063b904d82b42bcaf358 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=BC=A0=E6=98=A5=E4=B9=94?=
 <83450930+Liyulingyue@users.noreply.github.com>
Date: Sun, 1 Dec 2024 05:22:59 +0800
Subject: [PATCH] Apply suggestions from code review

---
 paddlespeech/t2s/exps/ernie_sat/preprocess.py    | 6 +++---
 paddlespeech/t2s/exps/fastspeech2/gen_gta_mel.py | 6 +++---
 2 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/paddlespeech/t2s/exps/ernie_sat/preprocess.py b/paddlespeech/t2s/exps/ernie_sat/preprocess.py
index ab6a36f8e..04bbc0743 100644
--- a/paddlespeech/t2s/exps/ernie_sat/preprocess.py
+++ b/paddlespeech/t2s/exps/ernie_sat/preprocess.py
@@ -241,9 +241,9 @@ def main():
 
     if args.dataset == "baker":
         wav_files = sorted(list((rootdir / "Wave").rglob("*.wav")))
-        # split data into 3 sections, the max number of dev/test is 10% or 100
-        num_dev = min(int(len(wav_files) * 0.1), 100)
-        num_train = len(wav_files) - num_dev * 2
+        # split data into 3 sections
+        num_train = 9800
+        num_dev = 100
         train_wav_files = wav_files[:num_train]
         dev_wav_files = wav_files[num_train:num_train + num_dev]
         test_wav_files = wav_files[num_train + num_dev:]
diff --git a/paddlespeech/t2s/exps/fastspeech2/gen_gta_mel.py b/paddlespeech/t2s/exps/fastspeech2/gen_gta_mel.py
index e2348849b..4c92ad1cc 100644
--- a/paddlespeech/t2s/exps/fastspeech2/gen_gta_mel.py
+++ b/paddlespeech/t2s/exps/fastspeech2/gen_gta_mel.py
@@ -81,9 +81,9 @@ def evaluate(args, fastspeech2_config):
 
     if args.dataset == "baker":
         wav_files = sorted(list((rootdir / "Wave").rglob("*.wav")))
-        # split data into 3 sections, the max number of dev/test is 10% or 100
-        num_dev = min(int(len(wav_files) * 0.1), 100)
-        num_train = len(wav_files) - num_dev * 2
+        # split data into 3 sections
+        num_train = 9800
+        num_dev = 100
         train_wav_files = wav_files[:num_train]
         dev_wav_files = wav_files[num_train:num_train + num_dev]
         test_wav_files = wav_files[num_train + num_dev:]