hZzy
/

qwen2.5-0.5b-expo-DPO-ES-0.1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-ES-0.1 / trainer_state.json

Commit History

Model save

17e9f1f
verified

hZzy commited on 24 days ago

Model save

88a4513
verified

hZzy commited on Dec 14, 2024