Spaces:

Miuzarte
/

SUI-svc-3.0

Runtime error

App Files Files Community

Miuzarte commited on Jan 10, 2023

Commit

213a0d6

1 Parent(s): 4e9cd67

Upload app.py

Browse files

Files changed (1) hide show

app.py +12 -4

app.py CHANGED Viewed

@@ -18,7 +18,7 @@ sid_map = {
 }
 def vc_fn(sid, input_audio, vc_transform):
     if input_audio is None:
-        return "You need to upload an audio", None
     sampling_rate, audio = input_audio
     # print(audio.shape,sampling_rate)
     duration = audio.shape[0] / sampling_rate
@@ -34,14 +34,14 @@ def vc_fn(sid, input_audio, vc_transform):
     sid = sid_map[sid]
     out_audio, out_sr = svc_model.infer(sid, vc_transform, out_wav_path)
     _audio = out_audio.cpu().numpy()
-    return "Success", (48000, _audio)
 app = gr.Blocks()
 with app:
     with gr.Tabs():
-        with gr.TabItem("Basic"):
             gr.Markdown(value="""
-                #### 这是 sovits 3.0 48kHz AI岁己（本音）歌声（划重点）音色转换的在线demo
                 #### 目前模型训练状态：700000steps / 640epochs
@@ -52,6 +52,14 @@ with app:
                 #### 更建议参考仓库[README.md上的推理部分](https://github.com/innnky/so-vits-svc#%E6%8E%A8%E7%90%86)，在本地使用 inference_main.py 处理
                 #### 3060Ti 8G可推理一条20(建议) - 30s的音频，过长音频可分割后批量处理
             """)
             sid = gr.Dropdown(label="音色", choices=["岁己（本音）"], value="岁己（本音）")
             vc_input3 = gr.Audio(label="输入音频（长度请控制在25s左右，过长可能会爆内存）")

 }
 def vc_fn(sid, input_audio, vc_transform):
     if input_audio is None:
+        return "请选择或拖入一段音频", None
     sampling_rate, audio = input_audio
     # print(audio.shape,sampling_rate)
     duration = audio.shape[0] / sampling_rate
     sid = sid_map[sid]
     out_audio, out_sr = svc_model.infer(sid, vc_transform, out_wav_path)
     _audio = out_audio.cpu().numpy()
+    return "成功", (48000, _audio)
 app = gr.Blocks()
 with app:
     with gr.Tabs():
+        with gr.TabItem("岁己SUI"):
             gr.Markdown(value="""
+                ## 这是 sovits 3.0 48kHz AI岁己(本音)“歌声(划重点)”音色转换的在线demo
                 #### 目前模型训练状态：700000steps / 640epochs
                 #### 更建议参考仓库[README.md上的推理部分](https://github.com/innnky/so-vits-svc#%E6%8E%A8%E7%90%86)，在本地使用 inference_main.py 处理
                 #### 3060Ti 8G可推理一条20(建议) - 30s的音频，过长音频可分割后批量处理
+                ### 一点点注意事项：
+                #### 输入的音频一定要是纯净的干音，不要把歌曲直接扔进来
+                #### 对陈述语气没多大作用，你可以自己唱然后升十几个调慢慢试效果
+                #### 因为训练集来自于录播，所以音色偏本音，前期变调用于匹配音域，后期可以升一个调匹配一下岁己的歌音
             """)
             sid = gr.Dropdown(label="音色", choices=["岁己（本音）"], value="岁己（本音）")
             vc_input3 = gr.Audio(label="输入音频（长度请控制在25s左右，过长可能会爆内存）")