DUAL-GPO
/

phi-2-gpo-test-longest-iter-random1-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-test-longest-iter-random1-0 / eval_results.json

Commit History

Model save

c2e0269
verified

BraylonDash commited on Mar 27