tools/denoise-model/speech_frcrn_ans_cirm_16k/faq.md · xhlm123/gpt-sovits at a10e030fd9985551b0d265e3fed55f510d6053fe

Q: 模型处理后的音频听起来有问题？

A: 建议先确认一下音频格式是否16KHz采样率单通道wav音频，音频内容是否带噪音的语音。

A: FRCRN语音降噪这一版模型的运算量是比较大的，特别是在CPU上处理耗时相对比较长，在模型不变的情况下没有什么很好的优化方案。建议使用GPU来提升速度，通常能够比CPU提升几倍到几十倍，不过GPU第一次使用需要初始化CUDA所以会比第二次调用耗时长一些。

A: 不支持导出。

A: 这种情况不正常，目前训练流程默认使用单卡，通常V100单卡跑一个epoch约40分钟。您训练的时候可以观察一下cpu和gpu的占用情况。