lole25
/

phi-2-gpo-lora-ultrafeedback-test

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-lora-ultrafeedback-test / runs

1 contributor

History: 1 commit

lole25's picture

Model save

b146449 verified 11 months ago

Mar18_23-31-23_gpu4-119-4
Model save 11 months ago