Hev832
/

hex-rvc

@@ -8,6 +8,7 @@ import gradio as gr
 import yt_dlp
 import subprocess
 from pydub import AudioSegment
 from audio_separator.separator import Separator
 from lib.infer import infer_audio
 import edge_tts
@@ -85,6 +86,72 @@ async def text_to_speech_edge(text, language_code):
     return tmp_path
 if __name__ == '__main__':
     parser = ArgumentParser()
     parser.add_argument("--share", action="store_true", dest="share_enabled", default=False)
@@ -143,19 +210,6 @@ with gr.Blocks(title="Hex RVC", theme=gr.themes.Base(primary_hue="red", secondar
                 RMS_MIX_RATE = gr.Slider(label="RMS Mix Rate", minimum=0, maximum=1, value=0.25)
                 PROTECT = gr.Slider(label="Protect Factor", minimum=0, maximum=1, value=0.33)
-        gr.Markdown("### Advanced Settings")
-        with gr.Accordion("Advanced Settings", open=False):
-            SPLIT_INFER = gr.Checkbox(label="Enable Split Inference", value=False)
-            MIN_SILENCE = gr.Number(label="Min Silence (ms)", value=500)
-            SILENCE_THRESHOLD = gr.Number(label="Silence Threshold (dBFS)", value=-50)
-            SEEK_STEP = gr.Slider(label="Seek Step (ms)", minimum=1, maximum=10, value=1)
-            KEEP_SILENCE = gr.Number(label="Keep Silence (ms)", value=200)
-            FORMANT_SHIFT = gr.Checkbox(label="Enable Formant Shift", value=False)
-            QUEFRENCY = gr.Number(label="Quefrency", value=0)
-            TIMBRE = gr.Number(label="Timbre", value=1)
-            F0_AUTOTUNE = gr.Checkbox(label="Enable F0 Autotune", value=False)
-            OUTPUT_FORMAT = gr.Dropdown(choices=["wav", "flac", "mp3"], label="Output Format", value="wav")
         gr.Markdown("## Generate Audio")
         output_audio = gr.Audio(label="Generated Audio Output", type='filepath')
@@ -192,6 +246,15 @@ with gr.Blocks(title="Hex RVC", theme=gr.themes.Base(primary_hue="red", secondar
             outputs=download_output
         )
     with gr.Tab("Audio Separation"):
         gr.Markdown("## Audio Separation")
         input_audio = gr.Audio(type="filepath", label="Upload Audio for Separation")

 import yt_dlp
 import subprocess
 from pydub import AudioSegment
+from pydub.effects import reverb
 from audio_separator.separator import Separator
 from lib.infer import infer_audio
 import edge_tts
     return tmp_path
+# Function to add reverb effect using pydub
+def add_simple_reverb(input_audio):
+    # Load the uploaded audio file
+    sound = AudioSegment.from_file(input_audio)
+    # Apply reverb effect
+    reverbed_sound = reverb(sound)
+    # Export the reverbed sound to a new file-like object (in-memory)
+    output_path = "vocals_with_reverb.wav"
+    reverbed_sound.export(output_path, format='wav')
+    # Return the output path for Gradio to handle
+    return output_path
+# Ensure this function is defined before your Gradio Blocks UI
+def process_audio(MODEL_NAME, SOUND_PATH, F0_CHANGE, F0_METHOD, MIN_PITCH, MAX_PITCH, CREPE_HOP_LENGTH, INDEX_RATE,
+                  FILTER_RADIUS, RMS_MIX_RATE, PROTECT, SPLIT_INFER, MIN_SILENCE, SILENCE_THRESHOLD, SEEK_STEP,
+                  KEEP_SILENCE, FORMANT_SHIFT, QUEFRENCY, TIMBRE, F0_AUTOTUNE, OUTPUT_FORMAT, upload_audio=None):
+    # If no sound path is given, use the uploaded file
+    if not SOUND_PATH and upload_audio is not None:
+        SOUND_PATH = os.path.join("uploaded_audio", upload_audio.name)
+        with open(SOUND_PATH, "wb") as f:
+            f.write(upload_audio.read())
+    # Check if a model name is provided
+    if not MODEL_NAME:
+        return "Please provide a model name."
+    # Run the inference process
+    os.system("chmod +x stftpitchshift")
+    inferred_audio = infer_audio(
+        MODEL_NAME,
+        SOUND_PATH,
+        F0_CHANGE,
+        F0_METHOD,
+        MIN_PITCH,
+        MAX_PITCH,
+        CREPE_HOP_LENGTH,
+        INDEX_RATE,
+        FILTER_RADIUS,
+        RMS_MIX_RATE,
+        PROTECT,
+        SPLIT_INFER,
+        MIN_SILENCE,
+        SILENCE_THRESHOLD,
+        SEEK_STEP,
+        KEEP_SILENCE,
+        FORMANT_SHIFT,
+        QUEFRENCY,
+        TIMBRE,
+        F0_AUTOTUNE,
+        OUTPUT_FORMAT
+    )
+    return inferred_audio
 if __name__ == '__main__':
     parser = ArgumentParser()
     parser.add_argument("--share", action="store_true", dest="share_enabled", default=False)
                 RMS_MIX_RATE = gr.Slider(label="RMS Mix Rate", minimum=0, maximum=1, value=0.25)
                 PROTECT = gr.Slider(label="Protect Factor", minimum=0, maximum=1, value=0.33)
         gr.Markdown("## Generate Audio")
         output_audio = gr.Audio(label="Generated Audio Output", type='filepath')
             outputs=download_output
         )
+    with gr.Tab("Audio Effect (demo)"):
+        input_audio = gr.Textbox(label="Path Audio File")
+        output_audio = gr.Audio(type="filepath", label="Processed Audio with Reverb")
+        reverb_btn = gr.Button("Add Reverb")
+        reverb_btn.click(add_simple_reverb, inputs=input_audio, outputs=output_audio)
     with gr.Tab("Audio Separation"):
         gr.Markdown("## Audio Separation")
         input_audio = gr.Audio(type="filepath", label="Upload Audio for Separation")