YYYYYYibo
/

gshf_ours_1_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

gshf_ours_1_iter_2 / README.md

Commit History

DPO-7b-beta0.01

7384181
verified

YYYYYYibo commited on Sep 9

Model save

79f4519
verified

YYYYYYibo commited on Sep 9