YYYYYYibo
/

nash_real_rank4_all_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_real_rank4_all_iter_3 / README.md

Commit History

DPO-7b-beta0.01

62889cb
verified

YYYYYYibo commited on May 5

Model save

516302e
verified

YYYYYYibo commited on May 5