xhlm123
Add application file
804e0a1
|
raw
history blame
903 Bytes

Q: 模型处理后的音频听起来有问题?

A: 建议先确认一下音频格式是否16KHz采样率单通道wav音频,音频内容是否带噪音的语音。

Q: 这个模型 cpu 推理较慢怎么办?

A: FRCRN语音降噪这一版模型的运算量是比较大的,特别是在CPU上处理耗时相对比较长,在模型不变的情况下没有什么很好的优化方案。建议使用GPU来提升速度,通常能够比CPU提升几倍到几十倍,不过GPU第一次使用需要初始化CUDA所以会比第二次调用耗时长一些。

Q: 模型是否支持导出为ONNX格式?

A: 不支持导出。

Q: 模型训练速度很慢,一个epoch要跑10个小时左右,请问这是正常的吗?

A: 这种情况不正常,目前训练流程默认使用单卡,通常V100单卡跑一个epoch约40分钟。您训练的时候可以观察一下cpu和gpu的占用情况。