thatupiso
/

SmolLM2-FT-DPO2

Text Generation

Generated from Trainer

dpo-smolK12-100

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

SmolLM2-FT-DPO2 / training_args.bin

Commit History

End of training

c11a138
verified

thatupiso commited on 15 days ago

End of training

14710a8
verified

thatupiso commited on 15 days ago

End of training

82a3989
verified

thatupiso commited on 15 days ago

End of training

64ac2f5
verified

thatupiso commited on 16 days ago