YYYYYYibo
/

nash_dpo_rank4_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_rank4_iter_2 / README.md

Commit History

DPO-7b-beta0.01

55f6c81
verified

YYYYYYibo commited on May 1

Model save

fe74021
verified

YYYYYYibo commited on May 1