Spaces:

Sreekumar1608
/

audio_and_text_output

Build error

Sreekumar1608 commited on Jun 6, 2023

Commit

fc6fb92

1 Parent(s): e321dc1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,18 +1,17 @@
 import gradio as gr
 import openai
-import winsound
 from elevenlabslib import *
 from pydub import AudioSegment
 from pydub.playback import play
 import io
-import config
 openai.api_key = "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"
 api_key = "929b67c6e533e94018a438d70c960b60"
 from elevenlabslib import ElevenLabsUser
 user = ElevenLabsUser(api_key)
-messages = ["You are an advisor. Please respond to all input in 50 words or less."]
 def transcribe(audio):
     global messages
@@ -25,7 +24,7 @@ def transcribe(audio):
     response = openai.Completion.create(
         engine="text-davinci-003",
         prompt=messages[-1],
-        max_tokens=80,
         n=1,
         stop=None,
         temperature=0.5,
@@ -34,7 +33,7 @@ def transcribe(audio):
     system_message = response["choices"][0]["text"]
     messages.append(f"{system_message}")
-    voice = user.get_voices_by_name("Antoni")[0]
     audio = voice.generate_audio_bytes(system_message)
     audio = AudioSegment.from_file(io.BytesIO(audio), format="mp3")
@@ -47,10 +46,9 @@ def transcribe(audio):
 iface = gr.Interface(
     fn=transcribe,
-    inputs=gr.Audio(source="microphone", type="filepath", placeholder="Please start speaking..."),
     outputs="text",
-    title="🤖 My Desktop ChatGPT Assistant 🤖",
-    description="🌟 Please ask me your question and I will respond both verbally and in text to you...",
 )
 iface.launch()

 import gradio as gr
 import openai
 from elevenlabslib import *
 from pydub import AudioSegment
 from pydub.playback import play
 import io
+import winsound
 openai.api_key = "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"
 api_key = "929b67c6e533e94018a438d70c960b60"
 from elevenlabslib import ElevenLabsUser
 user = ElevenLabsUser(api_key)
+messages = ["Respond with voice"]
 def transcribe(audio):
     global messages
     response = openai.Completion.create(
         engine="text-davinci-003",
         prompt=messages[-1],
+        max_tokens=60,
         n=1,
         stop=None,
         temperature=0.5,
     system_message = response["choices"][0]["text"]
     messages.append(f"{system_message}")
+    voice = user.get_voices_by_name("Bella")[0]
     audio = voice.generate_audio_bytes(system_message)
     audio = AudioSegment.from_file(io.BytesIO(audio), format="mp3")
 iface = gr.Interface(
     fn=transcribe,
+    inputs=gr.Audio(source="microphone", type="filepath"),
     outputs="text",
+    title="Voice Assistant",
 )
 iface.launch()