Spaces:

anyantudre
/

moore-language-translation-tts-stt

Runtime error

anyantudre commited on Aug 2, 2024

Commit

1ffb58d

verified ·

1 Parent(s): e41ca58

Update text_to_speech.py

Files changed (1) hide show

text_to_speech.py CHANGED Viewed

@@ -1,40 +1,37 @@
 import time
 import torch
-from transformers import set_seed
-from transformers import VitsTokenizer, VitsModel
-def synthesize_facebook(s:str, iso3:str) -> str:
-    '''
-    For given text, speak it.
-    Parameters
-    ----------
-    s: str
-        The written text.
-    is03:str
-        The ISO-3 code of the text's language.
-    Returns
-    ----------
-    synth:str
-        The synthesized audio.
-    '''
-    # Ensure replicability
-    set_seed(555)
-    start_time = time.time()
-    # Load synthesizer
-    tokenizer = VitsTokenizer.from_pretrained(f"facebook/mms-tts-{iso3}")
-    model = VitsModel.from_pretrained(f"facebook/mms-tts-{iso3}")
-    inputs = tokenizer(text=s, return_tensors="pt")
-    # Inference
-    with torch.no_grad():
-       outputs = model(**inputs)
-    synth = outputs.waveform[0]
-    print("Time elapsed: ", int(time.time() - start_time), " seconds")
-    return synth.numpy()

 import time
 import torch
+import scipy
+from transformers import set_seed, pipeline
+def goai_tts(texte, device):
+    """
+    Pour un texte donné, donner le speech en Mooré correspondant
+    Paramètres
+    ----------
+    texte: str
+        Le texte écrit.
+    device: str
+        GPU ou CPU
+    Return
+    ------
+        L'audio synthétisé.
+    """
+    ### assurer la reproductibilité
+    set_seed(2024)
+    start_time = time.time()
+    ### charger le modèle TTS
+    model_id = "anyantudre/mms-tts-mos-V1"
+    synthesiser = pipeline("text-to-speech", model_id, device=device)  # add device=0 if you want to use a GPU
+    ### inférence
+    speech = synthesiser(texte)
+    wavfile = scipy.io.wavfile.write("finetuned_output.wav", rate=speech["sampling_rate"], data=speech["audio"][0])
+    print("Temps écoulé: ", int(time.time() - start_time), " seconds")
+    return wavfile