YYYYYYibo
/

nash_dpo_rank4_on_vanilla_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_rank4_on_vanilla_iter_3 / tokenizer.json

YYYYYYibo's picture

Training in progress, epoch 0

eee5cb5 verified 6 months ago

1.8 MB

File too large to display, you can check the raw version instead.