hZzy
/

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1W-5e6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1W-5e6

Commit History

End of training

81de86d
verified

hZzy commited on Nov 26, 2024

Model save

93e6ca2
verified

hZzy commited on Nov 26, 2024

initial commit

0d6f856
verified

hZzy commited on Nov 25, 2024