Seikaijyu
/

RWKV-5.2-7B-NSFW-Role-16k

Not-For-All-Audiences

Model card Files Files and versions Community

RWKV-5.2-7B-NSFW-Role-16k / README.md

Seikaijyu's picture

Update README.md

44a19f4 verified 7 months ago

|

841 Bytes

metadata

license: mit

基于xiaol的7B role模型进行的nsfw和roleplay特训微调

微调使用了1GB NSFW小说数据集，以及300M的小说续写数据集，并混入了450M的User Assistant标准问答指令数据集以保证降低微调带来的影响

最后混入了大约5M的roleplay和TRPG数据集进行Lora

使用以下参数进行Lora得到的模型

Lora_R=256

Lora_Alpha=512

Steps=50

Epoch=84

StartLoss=1.9

EndLoss=1.84

或许你应该试试这个最新的模型，使用更新更优质的数据集进行Lora的RWKV v5.2 3B roleplay模型（依然带有一定的NSFW能力）