YYYYYYibo
/

nash_dpo_iter_3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

nash_dpo_iter_3

Commit History

DPO-7b-beta0.01

e8f3ec7
verified

YYYYYYibo commited on May 1

Model save

7915532
verified

YYYYYYibo commited on May 1

Training in progress, epoch 0

508074e
verified

YYYYYYibo commited on May 1

initial commit

215601f
verified

YYYYYYibo commited on May 1