Spaces:

atsushieee
/

sovits-test

Running

App Files Files Community

atsushieee commited on Jan 26

Commit

9b8eb79

1 Parent(s): cbdd616

Update main.py

Browse files

Files changed (1) hide show

main.py +16 -12

main.py CHANGED Viewed

@@ -1,13 +1,10 @@
 import gradio as gr
 import os
-import requests
-from tqdm import tqdm
-import plotly.express as px
 import pandas as pd
 from svc_inference import main
-from whisper.inference import check_and_download_model
 # データの作成
 data = {
@@ -30,7 +27,7 @@ df = pd.DataFrame(data)
 def create_plot():
     fig = px.scatter(df, x='x', y='y', text='id',
-                    title='Voice Timbre Feature Mapping')
     # マーカーのスタイルを設定（紫系の色に設定）
     fig.update_traces(
@@ -89,15 +86,22 @@ def run_main(audio_file, shift, speaker_id):
     args.whisper_index_path = None
     args.debug = False
     try:
         main(args)
-        return "svc_out.wav"  # 音声ファイルのパスを返す
     except Exception as e:
         return None
 # Gradio インターフェースの作成
 with gr.Blocks() as demo:
-    gr.Markdown("# SVC (Singing Voice Conversion) System")
     with gr.Row():
         with gr.Column(scale=1.15):
@@ -106,7 +110,7 @@ with gr.Blocks() as demo:
         with gr.Column(scale=1):
             # 入力音声のアップロード
             input_audio = gr.Audio(
-                label="Upload the audio you want to convert.",
                 type="filepath"  # ファイルパスとして取得
             )
             # Speaker ID の選択
@@ -123,13 +127,13 @@ with gr.Blocks() as demo:
                 maximum=12,
                 value=0,
                 step=1,
-                label="Pitch Shift (from -12 to +12) "
             )
             # ボタン
-            run_btn = gr.Button(value="Convert Singing Voice", variant="primary", size="lg")
     # 出力表示用
-    output_audio = gr.Audio(label="Audio After Conversion")
     run_btn.click(

 import gradio as gr
 import os
+from datetime import datetime
 import pandas as pd
+import plotly.express as px
 from svc_inference import main
 # データの作成
 data = {
 def create_plot():
     fig = px.scatter(df, x='x', y='y', text='id',
+                    title='Interactive Numeric Scatter Plot')
     # マーカーのスタイルを設定（紫系の色に設定）
     fig.update_traces(
     args.whisper_index_path = None
     args.debug = False
+    # 現在時刻を取得してファイル名を生成
+    now = datetime.now()
+    date_str = now.strftime("%y%m%d")
+    time_str = now.strftime("%H%M%S")
+    output_filename = f"svc_id{speaker_str}_pitch{shift}_speed0_{date_str}_{time_str}.wav"
     try:
         main(args)
+        os.rename("svc_out.wav", output_filename)  # ファイル名を変更
+        return output_filename  # 新しいファイル名を返す
     except Exception as e:
         return None
 # Gradio インターフェースの作成
 with gr.Blocks() as demo:
+    gr.Markdown("# SVC 音声変換システム")
     with gr.Row():
         with gr.Column(scale=1.15):
         with gr.Column(scale=1):
             # 入力音声のアップロード
             input_audio = gr.Audio(
+                label="変換したい音声をアップロード",
                 type="filepath"  # ファイルパスとして取得
             )
             # Speaker ID の選択
                 maximum=12,
                 value=0,
                 step=1,
+                label="Pitch Shift（-12から+12の半音）"
             )
             # ボタン
+            run_btn = gr.Button(value="音声変換を実行", variant="primary", size="lg")
     # 出力表示用
+    output_audio = gr.Audio(label="変換後の音声")
     run_btn.click(