YYYYYYibo
/

nash_dpo_rank4_iter_plus_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_rank4_iter_plus_3

Commit History

DPO-7b-beta0.01

74f943c
verified

YYYYYYibo commited on May 3

Model save

d6acae0
verified

YYYYYYibo commited on May 3

initial commit

88bd20e
verified

YYYYYYibo commited on May 3