lole25
/

phi-2-gpo-ultrachat-lora-2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-ultrachat-lora-2 / adapter_model.safetensors

Commit History

Training in progress, step 900

a46f0e7
verified

lole25 commited on Feb 29

Training in progress, step 800

317626f
verified

lole25 commited on Feb 29

Training in progress, step 700

751ea1c
verified

lole25 commited on Feb 29

Training in progress, step 600

7501fc5
verified

lole25 commited on Feb 29

Training in progress, step 500

8ce961f
verified

lole25 commited on Feb 29

Training in progress, step 400

0e621bb
verified

lole25 commited on Feb 29

Training in progress, step 300

d24235c
verified

lole25 commited on Feb 29

Training in progress, step 200

e52efb2
verified

lole25 commited on Feb 29

Model save

51b1f39
verified

lole25 commited on Feb 29

Training in progress, step 100

fc85ef9
verified

lole25 commited on Feb 29