YYYYYYibo
/

gshf_ours_1_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

gshf_ours_1_iter_2

Commit History

DPO-7b-beta0.01

7384181
verified

YYYYYYibo commited on Sep 9

Model save

79f4519
verified

YYYYYYibo commited on Sep 9

Training in progress, epoch 0

2a9a5bc
verified

YYYYYYibo commited on Sep 9

initial commit

70e9133
verified

YYYYYYibo commited on Sep 9