XueyingJia
/

pythia-1b-online-dpo-SG-merge-llama-judge-test-resume

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-1b-online-dpo-SG-merge-llama-judge-test-resume

Commit History

End of training

48c78b5
verified

XueyingJia commited on 17 days ago

Model save

0a41fd7
verified

XueyingJia commited on 17 days ago

Training in progress, step 4167

4dd6ee0
verified

XueyingJia commited on 17 days ago

Training in progress, step 4000

3fe35d2
verified

XueyingJia commited on 17 days ago

Training in progress, step 3500

4d4d881
verified

XueyingJia commited on 17 days ago

Training in progress, step 3000

1d5a73d
verified

XueyingJia commited on 17 days ago

Training in progress, step 2500

8330159
verified

XueyingJia commited on 17 days ago

Training in progress, step 2000

76d6ca7
verified

XueyingJia commited on 17 days ago

Training in progress, step 1500

f3a9388
verified

XueyingJia commited on 17 days ago

initial commit

777e27e
verified

XueyingJia commited on 18 days ago