Spaces:

fishaudio
/

fish-speech-1

Running on L4

App Files Files Community

PoTaTo721 commited on Dec 3, 2024

Commit

a4dbd99

1 Parent(s): c89e500

Fix API BUGS

Browse files

Files changed (2) hide show

app.py +23 -36
tools/api.py +21 -34

app.py CHANGED Viewed

@@ -120,8 +120,6 @@ def build_html_error_message(error):
 @torch.inference_mode()
 def inference(req: ServeTTSRequest):
-    global prompt_tokens, prompt_texts
     idstr: str | None = req.reference_id
     if idstr is not None:
         ref_folder = Path("references") / idstr
@@ -130,43 +128,32 @@ def inference(req: ServeTTSRequest):
             ref_folder, AUDIO_EXTENSIONS, recursive=True, sort=False
         )
-        if req.use_memory_cache == "never" or (
-            req.use_memory_cache == "on-demand" and len(prompt_tokens) == 0
-        ):
-            prompt_tokens = [
-                encode_reference(
-                    decoder_model=decoder_model,
-                    reference_audio=audio_to_bytes(str(ref_audio)),
-                    enable_reference_audio=True,
-                )
-                for ref_audio in ref_audios
-            ]
-            prompt_texts = [
-                read_ref_text(str(ref_audio.with_suffix(".lab")))
-                for ref_audio in ref_audios
-            ]
-        else:
-            logger.info("Use same references")
     else:
         # Parse reference audio aka prompt
         refs = req.references
-        if req.use_memory_cache == "never" or (
-            req.use_memory_cache == "on-demand" and len(prompt_tokens) == 0
-        ):
-            prompt_tokens = [
-                encode_reference(
-                    decoder_model=decoder_model,
-                    reference_audio=ref.audio,
-                    enable_reference_audio=True,
-                )
-                for ref in refs
-            ]
-            prompt_texts = [ref.text for ref in refs]
-        else:
-            logger.info("Use same references")
     if req.seed is not None:
         set_seed(req.seed)
         logger.warning(f"set seed: {req.seed}")
@@ -421,8 +408,8 @@ def build_app():
                             with gr.Row():
                                 use_memory_cache = gr.Radio(
                                     label=i18n("Use Memory Cache"),
-                                    choices=["never", "on-demand", "always"],
-                                    value="on-demand",
                                 )
                             with gr.Row():

 @torch.inference_mode()
 def inference(req: ServeTTSRequest):
     idstr: str | None = req.reference_id
     if idstr is not None:
         ref_folder = Path("references") / idstr
             ref_folder, AUDIO_EXTENSIONS, recursive=True, sort=False
         )
+        prompt_tokens = [
+            encode_reference(
+                decoder_model=decoder_model,
+                reference_audio=audio_to_bytes(str(ref_audio)),
+                enable_reference_audio=True,
+            )
+            for ref_audio in ref_audios
+        ]
+        prompt_texts = [
+            read_ref_text(str(ref_audio.with_suffix(".lab")))
+            for ref_audio in ref_audios
+        ]
     else:
         # Parse reference audio aka prompt
         refs = req.references
+        prompt_tokens = [
+            encode_reference(
+                decoder_model=decoder_model,
+                reference_audio=ref.audio,
+                enable_reference_audio=True,
+            )
+            for ref in refs
+        ]
+        prompt_texts = [ref.text for ref in refs]
     if req.seed is not None:
         set_seed(req.seed)
         logger.warning(f"set seed: {req.seed}")
                             with gr.Row():
                                 use_memory_cache = gr.Radio(
                                     label=i18n("Use Memory Cache"),
+                                    choices=["never"],
+                                    value="never",
                                 )
                             with gr.Row():

tools/api.py CHANGED Viewed

@@ -605,8 +605,6 @@ def api_invoke_chat(
 @torch.inference_mode()
 def inference(req: ServeTTSRequest):
-    global prompt_tokens, prompt_texts
     idstr: str | None = req.reference_id
     if idstr is not None:
         ref_folder = Path("references") / idstr
@@ -615,43 +613,32 @@ def inference(req: ServeTTSRequest):
             ref_folder, AUDIO_EXTENSIONS, recursive=True, sort=False
         )
-        if req.use_memory_cache == "never" or (
-            req.use_memory_cache == "on-demand" and len(prompt_tokens) == 0
-        ):
-            prompt_tokens = [
-                encode_reference(
-                    decoder_model=decoder_model,
-                    reference_audio=audio_to_bytes(str(ref_audio)),
-                    enable_reference_audio=True,
-                )
-                for ref_audio in ref_audios
-            ]
-            prompt_texts = [
-                read_ref_text(str(ref_audio.with_suffix(".lab")))
-                for ref_audio in ref_audios
-            ]
-        else:
-            logger.info("Use same references")
     else:
         # Parse reference audio aka prompt
         refs = req.references
-        if req.use_memory_cache == "never" or (
-            req.use_memory_cache == "on-demand" and len(prompt_tokens) == 0
-        ):
-            prompt_tokens = [
-                encode_reference(
-                    decoder_model=decoder_model,
-                    reference_audio=ref.audio,
-                    enable_reference_audio=True,
-                )
-                for ref in refs
-            ]
-            prompt_texts = [ref.text for ref in refs]
-        else:
-            logger.info("Use same references")
     if req.seed is not None:
         set_seed(req.seed)
         logger.warning(f"set seed: {req.seed}")

 @torch.inference_mode()
 def inference(req: ServeTTSRequest):
     idstr: str | None = req.reference_id
     if idstr is not None:
         ref_folder = Path("references") / idstr
             ref_folder, AUDIO_EXTENSIONS, recursive=True, sort=False
         )
+        prompt_tokens = [
+            encode_reference(
+                decoder_model=decoder_model,
+                reference_audio=audio_to_bytes(str(ref_audio)),
+                enable_reference_audio=True,
+            )
+            for ref_audio in ref_audios
+        ]
+        prompt_texts = [
+            read_ref_text(str(ref_audio.with_suffix(".lab")))
+            for ref_audio in ref_audios
+        ]
     else:
         # Parse reference audio aka prompt
         refs = req.references
+        prompt_tokens = [
+            encode_reference(
+                decoder_model=decoder_model,
+                reference_audio=ref.audio,
+                enable_reference_audio=True,
+            )
+            for ref in refs
+        ]
+        prompt_texts = [ref.text for ref in refs]
     if req.seed is not None:
         set_seed(req.seed)
         logger.warning(f"set seed: {req.seed}")