Spaces:

fantaxy
/

Sound-AI-SFX

Running on Zero

App Files Files Community

fantaxy commited on Dec 8, 2024

Commit

330c880

verified ·

1 Parent(s): 168ad05

Update app.py

Browse files

Files changed (1) hide show

app.py +1 -14

app.py CHANGED Viewed

@@ -10,9 +10,7 @@ from audioldm.audio.stft import TacotronSTFT
 from audioldm.variational_autoencoder import AutoencoderKL
 from pydub import AudioSegment
 from gradio import Markdown
 import torch
-#from diffusers.models.autoencoder_kl import AutoencoderKL
 from diffusers.models.unet_2d_condition import UNet2DConditionModel
 from diffusers import DiffusionPipeline,AudioPipelineOutput
 from transformers import CLIPTextModel, T5EncoderModel, AutoModel, T5Tokenizer, T5TokenizerFast
@@ -20,13 +18,7 @@ from typing import Union
 from diffusers.utils.torch_utils import randn_tensor
 from tqdm import tqdm
 class Tango2Pipeline(DiffusionPipeline):
     def __init__(
         self,
         vae: AutoencoderKL,
@@ -44,7 +36,6 @@ class Tango2Pipeline(DiffusionPipeline):
         unet=unet,
         scheduler=scheduler
         )
     def _encode_prompt(self, prompt):
         device = self.text_encoder.device
@@ -266,11 +257,10 @@ def gradio_generate(prompt, output_format, steps, guidance):
     return output_filename
-# Gradio input and output components
 input_text = gr.Textbox(lines=2, label="Prompt")
 output_format = gr.Radio(label = "Output format", info = "The file you can dowload", choices = ["mp3", "wav"], value = "wav")
 output_audio = gr.Audio(label="Generated Audio", type="filepath")
-denoising_steps = gr.Slider(minimum=100, maximum=200, value=100, step=1, label="Steps", interactive=True)
 guidance_scale = gr.Slider(minimum=1, maximum=10, value=3, step=0.1, label="Guidance Scale", interactive=True)
 css = """
@@ -279,8 +269,6 @@ footer {
 }
 """
-# Gradio interface
 gr_interface = gr.Interface(
     fn=gradio_generate,
     inputs=[input_text, output_format, denoising_steps, guidance_scale],
@@ -317,5 +305,4 @@ gr_interface = gr.Interface(
     cache_examples="lazy", # Turn on to cache.
 )
-# Launch Gradio app
 gr_interface.queue(10).launch()

 from audioldm.variational_autoencoder import AutoencoderKL
 from pydub import AudioSegment
 from gradio import Markdown
 import torch
 from diffusers.models.unet_2d_condition import UNet2DConditionModel
 from diffusers import DiffusionPipeline,AudioPipelineOutput
 from transformers import CLIPTextModel, T5EncoderModel, AutoModel, T5Tokenizer, T5TokenizerFast
 from diffusers.utils.torch_utils import randn_tensor
 from tqdm import tqdm
 class Tango2Pipeline(DiffusionPipeline):
     def __init__(
         self,
         vae: AutoencoderKL,
         unet=unet,
         scheduler=scheduler
         )
     def _encode_prompt(self, prompt):
         device = self.text_encoder.device
     return output_filename
 input_text = gr.Textbox(lines=2, label="Prompt")
 output_format = gr.Radio(label = "Output format", info = "The file you can dowload", choices = ["mp3", "wav"], value = "wav")
 output_audio = gr.Audio(label="Generated Audio", type="filepath")
+denoising_steps = gr.Slider(minimum=100, maximum=200, value=200, step=1, label="Steps", interactive=True)
 guidance_scale = gr.Slider(minimum=1, maximum=10, value=3, step=0.1, label="Guidance Scale", interactive=True)
 css = """
 }
 """
 gr_interface = gr.Interface(
     fn=gradio_generate,
     inputs=[input_text, output_format, denoising_steps, guidance_scale],
     cache_examples="lazy", # Turn on to cache.
 )
 gr_interface.queue(10).launch()