YYYYYYibo
/

nash_dpo_doff_no_golden_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_doff_no_golden_iter_3

Commit History

DPO-7b-beta0.01

9c011a2
verified

YYYYYYibo commited on May 8

Model save

8d6f77f
verified

YYYYYYibo commited on May 8

Training in progress, epoch 1

922e896
verified

YYYYYYibo commited on May 8

initial commit

d1cc973
verified

YYYYYYibo commited on May 8