Spaces:

united-link
/

taiwanese-hakka-tts

Running on Zero

txya900619 commited on May 15

Commit

f6c54a9

•

1 Parent(s): a523a5e

fix: zero gpu bug

Files changed (1) hide show

app.py CHANGED Viewed

@@ -46,7 +46,8 @@ OmegaConf.register_new_resolver("load_model", load_model)
 models_config = OmegaConf.to_object(OmegaConf.load("configs/models.yaml"))
 @spaces.GPU
-def _do_tts(model, ipa, language_name,speaker_name=None, speaker_wav=None):
     if speaker_wav is not None:
         return model.tts(
             ipa,
@@ -70,7 +71,6 @@ def text_to_speech(
     dialect,
     text: str,
 ):
-    model = models_config[model_id]["model"]
     if len(text) == 0:
         raise gr.Error("請勿輸入空字串。")
     words, ipa, pinyin, missing_words = get_ipa(text, dialect=dialect)
@@ -81,7 +81,7 @@ def text_to_speech(
     parsed_ipa = parse_ipa(ipa)
     if use_default_emb_or_custom == "default":
         wav = _do_tts(
-            model,
             parsed_ipa,
             speaker_name=speaker
             if len(models_config[model_id]["speaker_mapping"]) > 1
@@ -91,7 +91,7 @@ def text_to_speech(
         )
     else:
         wav = _do_tts(
-            model,
             parsed_ipa,
             speaker_wav=speaker_wav,
             language_name=dialect,
@@ -100,7 +100,7 @@ def text_to_speech(
     return (
         words,
         pinyin,
-        (model.tts_model.config.audio.sample_rate, np.array(wav)),
     )

 models_config = OmegaConf.to_object(OmegaConf.load("configs/models.yaml"))
 @spaces.GPU
+def _do_tts(model_id, ipa, language_name,speaker_name=None, speaker_wav=None):
+    model = models_config[model_id]["model"]
     if speaker_wav is not None:
         return model.tts(
             ipa,
     dialect,
     text: str,
 ):
     if len(text) == 0:
         raise gr.Error("請勿輸入空字串。")
     words, ipa, pinyin, missing_words = get_ipa(text, dialect=dialect)
     parsed_ipa = parse_ipa(ipa)
     if use_default_emb_or_custom == "default":
         wav = _do_tts(
+            model_id,
             parsed_ipa,
             speaker_name=speaker
             if len(models_config[model_id]["speaker_mapping"]) > 1
         )
     else:
         wav = _do_tts(
+            model_id,
             parsed_ipa,
             speaker_wav=speaker_wav,
             language_name=dialect,
     return (
         words,
         pinyin,
+        (models_config[model_id]["model"].tts_model.config.audio.sample_rate, np.array(wav)),
     )