tsavage68
/

DPO_DSLlama_200steps_01beta_1e6lr

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DPO_DSLlama_200steps_01beta_1e6lr / model.safetensors.index.json

Commit History

End of training

9d5975e
verified

tsavage68 commited on 2 days ago