YYYYYYibo
/

nash_dpo_merge_iter_4

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_merge_iter_4 / README.md

Commit History

DPO-7b-beta0.01

e889e01
verified

YYYYYYibo commited on May 3

Model save

aff606b
verified

YYYYYYibo commited on May 3