DUAL-GPO
/

phi-2-gpo-test-longest-iter-random1-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-test-longest-iter-random1-0

Commit History

End of training

596a66b
verified

BraylonDash commited on Mar 27

Model save

c2e0269
verified

BraylonDash commited on Mar 27

initial commit

e5a7466
verified

BraylonDash commited on Mar 27