Edge-TTS

Sleeping

File size: 2,482 Bytes

63f1d6d
 
 
 
 
 
 
 
 
 
 
 
bc76efd
63f1d6d
bc76efd
63f1d6d
 
 
 
 
 
 
 
 
 
8529fe9
 
 
 
 
d81bde6
63f1d6d
 
 
d81bde6
efb38d2
d81bde6
 
63f1d6d
 
 
efb38d2
 
 
 
63f1d6d
 
efb38d2
63f1d6d
 
efb38d2
d81bde6
efb38d2
63f1d6d
efb38d2
33bdd74
63f1d6d
 
 
8529fe9
 
 
b46ef8f
8529fe9
63f1d6d
8529fe9

import gradio as gr
import edge_tts
import asyncio
import tempfile
import os

async def get_voices():
    voices = await edge_tts.list_voices()
    return {f"{v['ShortName']} - {v['Locale']} ({v['Gender']})": v['ShortName'] for v in voices}

async def text_to_speech(text, voice, rate, pitch):
    if not text.strip():
        return None, "Bitte gib den zu konvertierenden Text ein."
    if not voice:
        return None, "Bitte wähle eine Stimme aus."
    
    voice_short_name = voice.split(" - ")[0]
    rate_str = f"{rate:+d}%"
    pitch_str = f"{pitch:+d}Hz"
    communicate = edge_tts.Communicate(text, voice_short_name, rate=rate_str, pitch=pitch_str)
    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_file:
        tmp_path = tmp_file.name
        await communicate.save(tmp_path)
    return tmp_path, None

async def tts_interface(text, voice, rate, pitch):
    audio, warning = await text_to_speech(text, voice, rate, pitch)
    if warning:
        return audio, gr.Warning(warning)
    return audio, None

async def create_demo():
    voices = await get_voices()
    
    description = """
    Wandle Text mit Microsoft Edge TTS in Sprache um. Passe die Sprechgeschwindigkeit und die Tonhöhe an: 0 ist die Standardeinstellung, positive Werte erhöhen, negative Werte verringern.
    """
    
    demo = gr.Interface(
        fn=tts_interface,
        inputs=[
            gr.Textbox(label="Texteingabe", lines=5),
            gr.Dropdown(choices=[""] + list(voices.keys()), label="Wähle eine Stimme aus", value=""),
            gr.Slider(minimum=-50, maximum=50, value=0, label="Anpassung der Sprechgeschwindigkeit (%)", step=1),
            gr.Slider(minimum=-20, maximum=20, value=0, label="Tonhöhenanpassung (Hz)", step=1)
        ],
        outputs=[
            gr.Audio(label="Audio generieren", type="filepath"),
            gr.Markdown(label="Warning", visible=False)
        ],
        title="Edge-TTS",
        description=description,
        article="Erlebe die Leistungsfähigkeit von Edge TTS für die Text-zu-Sprache-Umwandlung und entdecke unseren erweiterten Text-zu-Video-Konverter für noch mehr kreative Möglichkeiten!",
        analytics_enabled=False,
        flagging_mode="manual",
        api_name="api"
    )
    return demo

async def main():
    demo = await create_demo()
    demo.queue(default_concurrency_limit=5)
    demo.launch(show_api=True, share=False)

if __name__ == "__main__":
    asyncio.run(main())