indic_s2s

Sleeping

App Files Files Community

balaramas commited on Jul 13, 2023

Commit

68735d7

•

1 Parent(s): 8e74bf4

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -5

app.py CHANGED Viewed

@@ -18,10 +18,13 @@ def install_fairseq():
         subprocess.check_call(["pip", "install", "fairseq"])
         subprocess.check_call(["pip", "install", "sentencepiece"])
         subprocess.check_call(["pip", "install", "soundfile"])
         return "fairseq successfully installed!"
     except subprocess.CalledProcessError as e:
         return f"An error occurred while installing fairseq: {str(e)}"
 def convert_audio_to_16k_wav(audio_input):
     sound = AudioSegment.from_file(audio_input)
     sample_rate = sound.frame_rate
@@ -48,30 +51,37 @@ def run_my_code(input_text, language):
     data_root=""
     model_checkpoint=""
     d_r=""
     if(language=="Hindi"):
         model_checkpoint = "./models/hi_m.pt"
         data_root="./lang/hi/"
     if(language=="Gujrati"):
         model_checkpoint = "./models/gj_m.pt"
         data_root="./lang/gj/"
     if(language=="Bengali"):
         model_checkpoint = "./models/bn_m.pt"
-        data_root="./lang/bn/"
     if(language=="Nepali"):
         model_checkpoint = "./models/ne_m.pt"
         data_root="./lang/ne/"
     if(language=="Tamil"):
         model_checkpoint = "./models/tm_m.pt"
         data_root="./lang/tm/"
     if(language=="Marathi"):
         model_checkpoint = "./models/mt_m.pt"
-        data_root="./lang/mt/"
     #os.system(f"cp {hi_wav} {data_root}data/tst-COMMON/wav/test.wav")
     f = open('input.txt', 'w')
@@ -97,14 +107,20 @@ def run_my_code(input_text, language):
             output_text=i.split("\t")[2]
             break
-    #os.system(f"rm {data_root}data/tst-COMMON/wav/test.wav")
     f = open('input.txt', 'w')
     f.write("")
     f = open('input.txt', 'r')
     content = f. read()
     print(content)
-    return output_text
 install_fairseq()
@@ -123,7 +139,7 @@ output_textbox = gr.outputs.Textbox(label="Translated Text")
 iface = gr.Interface(
         fn=run_my_code,
         inputs=[gr.inputs.Audio(source="microphone", type="filepath", label="Record something (in American English accent)"), gr.inputs.Radio(["Hindi", "Gujrati", "Bengali", "Tamil", "Nepali", "Marathi"], label="Language")],
-        outputs=output_textbox,
         title="English to Indic Language Translator")
 # Launch the interface

         subprocess.check_call(["pip", "install", "fairseq"])
         subprocess.check_call(["pip", "install", "sentencepiece"])
         subprocess.check_call(["pip", "install", "soundfile"])
+        subprocess.check_call(["pip", "install", "gTTS"])
         return "fairseq successfully installed!"
     except subprocess.CalledProcessError as e:
         return f"An error occurred while installing fairseq: {str(e)}"
+from gtts import gTTS
 def convert_audio_to_16k_wav(audio_input):
     sound = AudioSegment.from_file(audio_input)
     sample_rate = sound.frame_rate
     data_root=""
     model_checkpoint=""
     d_r=""
+    lang=''
     if(language=="Hindi"):
         model_checkpoint = "./models/hi_m.pt"
         data_root="./lang/hi/"
+        lang='hi'
     if(language=="Gujrati"):
         model_checkpoint = "./models/gj_m.pt"
         data_root="./lang/gj/"
+        lang='gu'
     if(language=="Bengali"):
         model_checkpoint = "./models/bn_m.pt"
+        data_root="./lang/bn/"
+        lang='bn'
     if(language=="Nepali"):
         model_checkpoint = "./models/ne_m.pt"
         data_root="./lang/ne/"
+        lang='ne'
     if(language=="Tamil"):
         model_checkpoint = "./models/tm_m.pt"
         data_root="./lang/tm/"
+        lang='ta'
     if(language=="Marathi"):
         model_checkpoint = "./models/mt_m.pt"
+        data_root="./lang/mt/"
+        lang='mr'
     #os.system(f"cp {hi_wav} {data_root}data/tst-COMMON/wav/test.wav")
     f = open('input.txt', 'w')
             output_text=i.split("\t")[2]
             break
+    output_audio = "output_audio.mp3"
+    tts = gTTS(text=output_text, lang=lang)
+    tts.save(output_audio)
+    #os.system(f"rm test.wav")
     f = open('input.txt', 'w')
     f.write("")
     f = open('input.txt', 'r')
     content = f. read()
     print(content)
+    return output_text, output_audio
 install_fairseq()
 iface = gr.Interface(
         fn=run_my_code,
         inputs=[gr.inputs.Audio(source="microphone", type="filepath", label="Record something (in American English accent)"), gr.inputs.Radio(["Hindi", "Gujrati", "Bengali", "Tamil", "Nepali", "Marathi"], label="Language")],
+        outputs=[output_textbox, gr.outputs.Audio(label="Output speech", type="filepath", live=True)],
         title="English to Indic Language Translator")
 # Launch the interface