sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO / adapter_model.safetensors

Commit History

Training in progress, step 10

657c73e
verified

sergiopaniego commited on 25 days ago

Training in progress, step 56

cd5bdf6
verified

sergiopaniego commited on 27 days ago

Training in progress, step 50

51b4b7a
verified

sergiopaniego commited on 27 days ago

Training in progress, step 40

6a584db
verified

sergiopaniego commited on 27 days ago

Training in progress, step 30

ac51d02
verified

sergiopaniego commited on 27 days ago

Training in progress, step 20

51bb1fc
verified

sergiopaniego commited on 27 days ago

Training in progress, step 10

a7bd6e4
verified

sergiopaniego commited on 27 days ago