sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO

Commit History

Training in progress, step 10

657c73e
verified

sergiopaniego commited on 25 days ago

End of training

6acb439
verified

sergiopaniego commited on 26 days ago

Model save

1662395
verified

sergiopaniego commited on 26 days ago

Training in progress, step 56

cd5bdf6
verified

sergiopaniego commited on 26 days ago

Training in progress, step 50

51b4b7a
verified

sergiopaniego commited on 26 days ago

Training in progress, step 40

6a584db
verified

sergiopaniego commited on 26 days ago

Training in progress, step 30

ac51d02
verified

sergiopaniego commited on 26 days ago

Training in progress, step 20

51bb1fc
verified

sergiopaniego commited on 26 days ago

Training in progress, step 10

a7bd6e4
verified

sergiopaniego commited on 26 days ago

initial commit

1306475
verified

sergiopaniego commited on 26 days ago