qgallouedec
/

Qwen2-0.5B-OnlineDPO-AutoRM

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2-0.5B-OnlineDPO-AutoRM

Commit History

End of training

0dc76f4
verified

qgallouedec HF staff commited on 10 days ago

Model save

2c4387c
verified

qgallouedec HF staff commited on 10 days ago

Training in progress, step 885

25b75e8
verified

qgallouedec HF staff commited on 10 days ago

Training in progress, step 500

41e068d
verified

qgallouedec HF staff commited on 10 days ago

initial commit

601511f
verified

qgallouedec HF staff commited on 11 days ago