nghind
/

grpo-llama-3-1-8b-math-ep3-2102

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

grpo-llama-3-1-8b-math-ep3-2102 / README.md

Commit History

Model save

6dcc196
verified

nghind commited on 21 days ago