qgallouedec
/

Qwen2-0.5B-OnlineDPO-GRM-Gemma

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2-0.5B-OnlineDPO-GRM-Gemma

Commit History

End of training

e98892e
verified

qgallouedec HF staff commited on Oct 25, 2024

Model save

d4733e7
verified

qgallouedec HF staff commited on Oct 25, 2024

Training in progress, step 885

e87c44f
verified

qgallouedec HF staff commited on Oct 25, 2024

Training in progress, step 500

3fe0077
verified

qgallouedec HF staff commited on Oct 25, 2024

initial commit

669c067
verified

qgallouedec HF staff commited on Oct 25, 2024