hZzy
/

qwen2.5-0.5b-expo-DPO-ES-0.1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-ES-0.1 / all_results.json

Commit History

End of training

ee26d68
verified

hZzy commited on 9 days ago

Model save

17e9f1f
verified

hZzy commited on 9 days ago

End of training

1390069
verified

hZzy commited on 25 days ago

Model save

88a4513
verified

hZzy commited on 25 days ago