lole25
/

phi-2-dpo-ultrachat-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-ultrachat-lora / adapter_model.safetensors

Commit History

Model save

c5be93f
verified

lole25 commited on Mar 1

Training in progress, step 900

5cce308
verified

lole25 commited on Mar 1

Training in progress, step 800

04fbb1c
verified

lole25 commited on Mar 1

Training in progress, step 700

1625e58
verified

lole25 commited on Mar 1

Training in progress, step 600

79f9899
verified

lole25 commited on Mar 1

Model save

b80f3e8
verified

lole25 commited on Feb 29

Training in progress, step 400

8314883
verified

lole25 commited on Feb 29

Training in progress, step 300

99d41a3
verified

lole25 commited on Feb 29

Training in progress, step 100

de8af52
verified

lole25 commited on Feb 29

Model save

1e1c504
verified

lole25 commited on Feb 29