lole25
/

phi-2-gpo-ultrachat-lora-2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-ultrachat-lora-2

Commit History

End of training

61e7afa
verified

lole25 commited on Feb 29

Model save

51b1f39
verified

lole25 commited on Feb 29

Training in progress, step 100

fc85ef9
verified

lole25 commited on Feb 29

initial commit

d1b267b
verified

lole25 commited on Feb 29