Spaces:

Mahiruoshi
/

BangDream-Bert-VITS2

Running

App Files Files Community

Mahiruoshi commited on Oct 27, 2023

Commit

c864f13

1 Parent(s): 0376c2e

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -9

app.py CHANGED Viewed

@@ -32,6 +32,7 @@ import gradio as gr
 import webbrowser
 import re
 from scipy.io.wavfile import write
 net_g = None
 BandList = {
@@ -150,6 +151,8 @@ def infer(text, sdp_ratio, noise_scale, noise_scale_w, length_scale, sid, langua
             .float()
             .numpy()
         )
         del x_tst, tones, lang_ids, bert, x_tst_lengths, speakers
         return audio
@@ -314,7 +317,7 @@ def extract_text_from_file(inputFile):
     elif file_extension == ".asset":
         with open(inputFile, 'r', encoding='utf-8') as f:
             content =  json.load(f)
-        return extract_text_from_game2(content) if extract_text_from_game(content) != '' else extract_text_from_game(content)
     else:
         raise ValueError(f"Unsupported file format: {file_extension}")
@@ -338,15 +341,21 @@ def audiobook(inputFile, groupsize, speaker, sdp_ratio, noise_scale, noise_scale
             return result
     return result
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()
     parser.add_argument(
-        "-m", "--model", default="./logs/Bangdream/G_28000.pth", help="path of your model"
     )
     parser.add_argument(
         "-c",
         "--config",
-        default="./logs/Bangdream/config.json",
         help="path of your config file",
     )
     parser.add_argument(
@@ -360,8 +369,6 @@ if __name__ == "__main__":
     if args.debug:
         logger.info("Enable DEBUG-LEVEL log")
         logging.basicConfig(level=logging.DEBUG)
-    hps = utils.get_hparams_from_file(args.config)
     device = (
         "cuda:0"
         if torch.cuda.is_available()
@@ -371,6 +378,7 @@ if __name__ == "__main__":
             else "cpu"
         )
     )
     net_g = SynthesizerTrn(
         len(symbols),
         hps.data.filter_length // 2 + 1,
@@ -378,16 +386,17 @@ if __name__ == "__main__":
         n_speakers=hps.data.n_speakers,
         **hps.model,
     ).to(device)
-    _ = net_g.eval()
-    _ = utils.load_checkpoint(args.model, net_g, None, skip_optimizer=True)
     speaker_ids = hps.data.spk2id
     speakers = list(speaker_ids.keys())
     languages = ["ZH", "JP"]
     examples = [
         ["filelist/Scenarioband6-018.asset", 500, "つくし", "ましろ|真白\n七深|七深\n透子|透子\nつくし|筑紫\n瑠唯|瑠唯\nそよ|素世\n祥子|祥子", "扩展功能"],
     ]
     with gr.Blocks() as app:
         gr.Markdown(
              f"少歌邦邦全员TTS,使用本模型请严格遵守法律法规!\n 发布二创作品请注明项目和本模型作者<a href='https://space.bilibili.com/19874615/'>B站@Mahiroshi</a>及项目链接\n从 <a href='https://nijigaku.top/2023/10/03/BangDreamTTS/'>我的博客站点</a> 查看使用说明</a>"
@@ -407,6 +416,11 @@ if __name__ == "__main__":
                                 length_scale = gr.Slider(
                                         minimum=0.1, maximum=2, value=1, step=0.01, label="语速调节"
                                     )
                             with gr.Column():
                                 text = gr.TextArea(
                                     label="输入纯日语或者中文",

 import webbrowser
 import re
 from scipy.io.wavfile import write
+from datetime import datetime
 net_g = None
 BandList = {
             .float()
             .numpy()
         )
+        current_time = datetime.now()
+        print(str(current_time)+':'+str(sid))
         del x_tst, tones, lang_ids, bert, x_tst_lengths, speakers
         return audio
     elif file_extension == ".asset":
         with open(inputFile, 'r', encoding='utf-8') as f:
             content =  json.load(f)
+        return extract_text_from_game2(content) if extract_text_from_game2(content) != '' else extract_text_from_game2(content)
     else:
         raise ValueError(f"Unsupported file format: {file_extension}")
             return result
     return result
+def loadmodel(model):
+    _ = net_g.eval()
+    _ = utils.load_checkpoint(model, net_g, None, skip_optimizer=True)
+    return "success"
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()
     parser.add_argument(
+        "-m", "--model", default="./logs/Bangdream/G_10000.pth", help="path of your model"
     )
     parser.add_argument(
         "-c",
         "--config",
+        default="configs/config.json",
         help="path of your config file",
     )
     parser.add_argument(
     if args.debug:
         logger.info("Enable DEBUG-LEVEL log")
         logging.basicConfig(level=logging.DEBUG)
     device = (
         "cuda:0"
         if torch.cuda.is_available()
             else "cpu"
         )
     )
+    hps = utils.get_hparams_from_file(args.config)
     net_g = SynthesizerTrn(
         len(symbols),
         hps.data.filter_length // 2 + 1,
         n_speakers=hps.data.n_speakers,
         **hps.model,
     ).to(device)
+    loadmodel(args.model)
     speaker_ids = hps.data.spk2id
     speakers = list(speaker_ids.keys())
     languages = ["ZH", "JP"]
     examples = [
         ["filelist/Scenarioband6-018.asset", 500, "つくし", "ましろ|真白\n七深|七深\n透子|透子\nつくし|筑紫\n瑠唯|瑠唯\nそよ|素世\n祥子|祥子", "扩展功能"],
     ]
+    modelPaths = []
+    for dirpath, dirnames, filenames in os.walk("./logs/Bangdream/"):
+        for filename in filenames:
+            modelPaths.append(os.path.join(dirpath, filename))
     with gr.Blocks() as app:
         gr.Markdown(
              f"少歌邦邦全员TTS,使用本模型请严格遵守法律法规!\n 发布二创作品请注明项目和本模型作者<a href='https://space.bilibili.com/19874615/'>B站@Mahiroshi</a>及项目链接\n从 <a href='https://nijigaku.top/2023/10/03/BangDreamTTS/'>我的博客站点</a> 查看使用说明</a>"
                                 length_scale = gr.Slider(
                                         minimum=0.1, maximum=2, value=1, step=0.01, label="语速调节"
                                     )
+                                with gr.Accordion(label="切换模型(合成中文建议切换为早期模型)", open=False):
+                                    modelstrs = gr.Dropdown(label = "模型", choices = modelPaths, value = modelPaths[0], type = "value")
+                                    btnMod = gr.Button("载入模型")
+                                    statusa = gr.TextArea()
+                                    btnMod.click(loadmodel, inputs=[modelstrs], outputs = [statusa])
                             with gr.Column():
                                 text = gr.TextArea(
                                     label="输入纯日语或者中文",