YYYYYYibo
/

nash_dpo_rank4_iter_real_plus_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_rank4_iter_real_plus_3 / README.md

Commit History

DPO-7b-beta0.01

3a415ab
verified

YYYYYYibo commited on May 3

Model save

d8c02b1
verified

YYYYYYibo commited on May 3