Spaces:

Miuzarte
/

SUI-svc-3.0

Runtime error

App Files Files Community

Miuzarte commited on Jan 11, 2023

Commit

b73fc0e

1 Parent(s): dd47f6b

Upload app.py

Browse files

Files changed (1) hide show

app.py +29 -13

app.py CHANGED Viewed

@@ -49,9 +49,9 @@ with app:
                 #### 如果要训练自己的数据请访问：[项目Github仓库](https://github.com/innnky/so-vits-svc/tree/main)、[教程《svc相关》](https://www.yuque.com/jiuwei-nui3d/qng6eg)
-                #### 建议参考上方“使用说明”下的教程，在本地使用 inference_main.py 处理，我都写成这样了再小白应该都能搞定
-                #### 本地推理可调用GPU(cuda)，3060Ti 8G可推理一条20(建议) - 30s的音频，过长音频可分割后批量处理
             """)
             sid = gr.Dropdown(label="音色", choices=["岁己（本音）"], value="岁己（本音）")
             vc_input3 = gr.Audio(label="输入音频（长度请控制在30s左右，过长可能会爆内存）")
@@ -74,8 +74,6 @@ with app:
                 # 在本地部署并使用 inference_main.py 处理的保姆级教程：
-                # 未完工，还在解决装依赖的问题
                 ### 0. 创建一个存放文件的目录，例如 D:\\SUI\\
                 ### 1. 安装所需的软件
@@ -84,6 +82,12 @@ with app:
                 2. [git](https://git-scm.com/download/win)（建议使用便携版）[点这里可以直接下载(便携版v2.39.0.2)](https://github.com/git-for-windows/git/releases/download/v2.39.0.windows.2/PortableGit-2.39.0.2-64-bit.7z.exe)，路径填 D:\\SUI\\git\\
                 ### 2. 在开始菜单中运行 Anaconda Powershell Prompt 并配置环境（除了工作目录，复制粘贴回车即可）
                 ```
@@ -108,13 +112,18 @@ with app:
                 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
                 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
                 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
-                # 下面这一条给 NVIDIA 用户
-                conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -y
-                # 安装其余依赖（如果pip报SSL相关错误请关闭科学上网）
-                pip install -r requirements_local.txt
                 ```
                 至此环境配置完成，关闭该终端窗口（方便我写下一步）
                 ### 3. 歌声音色转换
@@ -126,11 +135,18 @@ with app:
                 conda activate sovits
                 ```
-                2. 在 SUI-svc-3.0\\raw\\ 文件夹中放入需要转换的音频（wav格式），8G显存的情况下不建议每条音频超过30s（不包括无声部分），过长会爆显存导致处理时间超级加倍甚至直接报错
-                3. 编辑 SUI-svc-3.0\\inference_main.py 的第23行（可参考第24行注释的格式），以及26行的变调，修改完保存时注意编码应为 UTF-8
-                4. 在终端中运行 inference_main.py 开始推理，音频将输出至 SUI-svc-3.0\\results\\ 文件夹
                 ```
                 python inference_main.py

                 #### 如果要训练自己的数据请访问：[项目Github仓库](https://github.com/innnky/so-vits-svc/tree/main)、[教程《svc相关》](https://www.yuque.com/jiuwei-nui3d/qng6eg)
+                #### 建议参考上方“使用说明”下的教程，在本地使用 inference_main.py 处理，我都写成这样了再小白应该都能搞定（不怕麻烦的话）
+                #### 本地推理可调用GPU(NVIDIA)，3060Ti 8G可推理一条20(建议) - 30s的音频，过长音频可分割后批量处理，就算用CPU推理也比 Hugging Face 快不少
             """)
             sid = gr.Dropdown(label="音色", choices=["岁己（本音）"], value="岁己（本音）")
             vc_input3 = gr.Audio(label="输入音频（长度请控制在30s左右，过长可能会爆内存）")
                 # 在本地部署并使用 inference_main.py 处理的保姆级教程：
                 ### 0. 创建一个存放文件的目录，例如 D:\\SUI\\
                 ### 1. 安装所需的软件
                 2. [git](https://git-scm.com/download/win)（建议使用便携版）[点这里可以直接下载(便携版v2.39.0.2)](https://github.com/git-for-windows/git/releases/download/v2.39.0.windows.2/PortableGit-2.39.0.2-64-bit.7z.exe)，路径填 D:\\SUI\\git\\
+                3. [torch-1.12.1+cu113-cp38](https://download.pytorch.org/whl/cu113/torch/)（N卡运算选装）[点这里可以直接下载](https://download.pytorch.org/whl/cu113/torch-1.12.1%2Bcu113-cp38-cp38-win_amd64.whl) 下载后请放至 D:\\SUI\\envs\\
+                4. [torchaudio-0.12.1+cu113-cp38](https://download.pytorch.org/whl/cu113/torchaudio/)（N卡运算选装）[点这里可以直接下载](https://download.pytorch.org/whl/cu113/torchaudio-0.12.1%2Bcu113-cp38-cp38-win_amd64.whl) 下载后请放至 D:\\SUI\\envs\\
+                5. [torchvision-0.13.1+cu113-cp38](https://download.pytorch.org/whl/cu113/torchvision/)（N卡运算选装）[点这里可以直接下载](https://download.pytorch.org/whl/cu113/torchvision-0.13.1%2Bcu113-cp38-cp38-win_amd64.whl) 下载后请放至 D:\\SUI\\envs\\
                 ### 2. 在开始菜单中运行 Anaconda Powershell Prompt 并配置环境（除了工作目录，复制粘贴回车即可）
                 ```
                 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
                 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
                 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
                 ```
+                ```
+                # CPU（x86）推理要安装的依赖：（如果pip报SSL相关错误请关闭科学上网）
+                pip install -r requirements_cpu.txt
+                ```
+                ```
+                # GPU（NVIDIA）推理要安装的依赖：（如果pip报SSL相关错误请关闭科学上网）
+                pip install -r requirements_gpu.txt
+                pip install ..\\envs\\torch-1.12.1+cu113-cp38-cp38-win_amd64.whl
+                pip install ..\\envs\\torchaudio-0.12.1+cu113-cp38-cp38-win_amd64.whl
+                pip install ..\\envs\\torchvision-0.13.1+cu113-cp38-cp38-win_amd64.whl
+                ```
                 至此环境配置完成，关闭该终端窗口（方便我写下一步）
                 ### 3. 歌声音色转换
                 conda activate sovits
                 ```
+                2. 如果想要像本demo一样用网页的GUI处理，这条之后的可以跳过了
+                ```
+                python app.py
+                # 运行完成后日志会输出应用所在的端口，默认7860（不排除该端口被占用后程序选择了其他端口），则浏览器访问 127.0.0.1:7860
+                ```
+                3. 在 SUI-svc-3.0\\raw\\ 文件夹中放入需要转换的音频（wav格��），8G显存的情况下建议每条音频的长度控制在20(建议) - 30s（不包括无声部分），过长会爆显存导致处理时间超级加倍甚至直接报错
+                4. 编辑 SUI-svc-3.0\\inference_main.py 的第23行（可参考第24行注释的格式），以及26行的变调，修改完保存时注意编码应为 UTF-8
+                5. 在终端中运行 inference_main.py 开始推理，音频将输出至 SUI-svc-3.0\\results\\ 文件夹
                 ```
                 python inference_main.py