GPT-SoVITS-JP-ProsodyControl

简介

GPT-SoVITS-JP-ProsodyControl是一个基于GPT-SoVITS预训练模型的扩展,专门为实现更精细的日语音高控制而设计。通过在预训练模型中引入两个新的符号[],在200小时的日语数据上进一步微调了8个epoch,使其能够在一定程度上通过调整[]符号来修正音高。

注意事项

由于模型主要针对日语数据进行微调,其对英语和中文的处理能力相对较弱。

使用示例

以下是一个音高修复的示例:

  • 原始文本: サトノダイヤモンド
  • 原始发音(无音高标注模型): s a t o n o d a i y a m o N d o
  • OpenJTalk默认标注: s a ] t o UNK n o UNK d a [ i y a m o ] N d o
  • 手动调整后的发音: s a [ t o UNK n o UNK d a [ i y a m o ] N d o
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.