YYYYYYibo
/

nash_dpo_merge_iter_6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

nash_dpo_merge_iter_6

Commit History

DPO-7b-beta0.01

15dcfb0
verified

YYYYYYibo commited on May 4

Model save

11ee063
verified

YYYYYYibo commited on May 4

Training in progress, epoch 0

6c3891c
verified

YYYYYYibo commited on May 4

initial commit

89b005a
verified

YYYYYYibo commited on May 4