Spaces:

guetLzy
/

BERT-ISTFT-VITS

Running

App Files Files Community

guetLzy commited on 24 days ago

Commit

f97daf3

verified ·

1 Parent(s): f1ab553

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -13

app.py CHANGED Viewed

@@ -159,20 +159,75 @@ def generate_audio(text, noise_scale=1.0, noise_scale_w=0.8, length_scale=1.0):
     write(output_path, 22050, (audio * 32767.0).astype(np.int16))  # 保存为 WAV 文件
     return output_path
-# 创建 Gradio 界面
-interface = gr.Interface(
-    fn=generate_audio,
-    inputs=[
-        gr.Textbox(label="输入文本", placeholder="请输入中文文本..."),  # 文本输入框
-        gr.Slider(minimum=0.1, maximum=2.0, step=0.1, value=1.0, label="噪声比例"),  # 噪声比例滑块
-        gr.Slider(minimum=0.1, maximum=2.0, step=0.1, value=0.8, label="噪声比例 W"),  # 噪声比例 W 滑块
-        gr.Slider(minimum=0.5, maximum=2.0, step=0.1, value=1.0, label="语速比例")  # 语速比例滑块
-    ],
-    outputs=gr.Audio(label="生成的音频"),  # 音频输出
     title="中文文本转语音",
-    description="输入中文文本并调整参数以生成语音。支持调整噪声和语速参数。",
-    theme="default"
-)
 # 启动界面
 interface.launch()

     write(output_path, 22050, (audio * 32767.0).astype(np.int16))  # 保存为 WAV 文件
     return output_path
+with gr.Blocks(
     title="中文文本转语音",
+    theme=gr.themes.Default(),  # 使用默认主题，可根据需要调整
+    css="""
+        .container {max-width: 800px; margin: auto;}  /* 限制最大宽度并居中 */
+        .input-text {margin-bottom: 20px;}  /* 输入框底部间距 */
+        .sliders {display: flex; flex-direction: column; gap: 15px;}  /* 滑块垂直排列并增加间距 */
+    """
+) as interface:
+    # 标题
+    gr.Markdown("# 中文文本转语音", _js="document.querySelector('h1').style.textAlign = 'center';")
+    gr.Markdown("输入中文文本并调整参数以生成语音。支持调整噪声和语速参数。", _js="document.querySelector('p').style.textAlign = 'center';")
+    # 主布局：两列设计
+    with gr.Row():
+        # 左侧：输入区域
+        with gr.Column(scale=2):
+            # 文本输入框
+            text_input = gr.Textbox(
+                label="输入文本",
+                placeholder="请输入中文文本...",
+                lines=5,  # 增加行数，便于输入长文本
+                elem_classes="input-text"
+            )
+            # 参数调整滑块组
+            with gr.Group(label="参数调整"):
+                noise_scale = gr.Slider(
+                    minimum=0.1,
+                    maximum=2.0,
+                    step=0.1,
+                    value=1.0,
+                    label="噪声比例",
+                    info="控制生成音频的噪声水平"
+                )
+                noise_scale_w = gr.Slider(
+                    minimum=0.1,
+                    maximum=2.0,
+                    step=0.1,
+                    value=0.8,
+                    label="噪声比例 W",
+                    info="控制音调的噪声影响"
+                )
+                length_scale = gr.Slider(
+                    minimum=0.5,
+                    maximum=2.0,
+                    step=0.1,
+                    value=1.0,
+                    label="语速比例",
+                    info="调整语音的播放速度"
+                )
+        # 右侧：输出区域
+        with gr.Column(scale=1):
+            audio_output = gr.Audio(
+                label="生成的音频",
+                type="filepath",  # 返回文件路径
+                interactive=False  # 禁止用户编辑音频
+            )
+            # 生成按钮
+            generate_btn = gr.Button("生成语音", variant="primary")
+    # 绑定生成函数
+    generate_btn.click(
+        fn=generate_audio,
+        inputs=[text_input, noise_scale, noise_scale_w, length_scale],
+        outputs=audio_output
+    )
 # 启动界面
 interface.launch()