hZzy
/

qwen2.5-0.5b-expo-DPO-EXPERIMENT

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-EXPERIMENT

Commit History

End of training

cde5f78
verified

hZzy commited on Nov 25, 2024

Model save

f2b2deb
verified

hZzy commited on Nov 25, 2024

initial commit

e2ed39f
verified

hZzy commited on Nov 25, 2024