YYYYYYibo
/

selm_ours_1_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

selm_ours_1_iter_2

Commit History

RDPO-7b-beta0.01-eta0.001

ee933dc
verified

YYYYYYibo commited on Aug 23

Model save

6dec937
verified

YYYYYYibo commited on Aug 23

Training in progress, epoch 0

63dd612
verified

YYYYYYibo commited on Aug 23

initial commit

f02d496
verified

YYYYYYibo commited on Aug 23