hZzy
/

qwen2.5-0.5b-expo-DPO-ES-0.1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-ES-0.1 / README.md

Commit History

End of training

ee26d68
verified

hZzy commited on 24 days ago

Model save

17e9f1f
verified

hZzy commited on 24 days ago

End of training

1390069
verified

hZzy commited on Dec 14, 2024

Model save

88a4513
verified

hZzy commited on Dec 14, 2024