hZzy
/

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1K-5e6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1K-5e6 / all_results.json

Commit History

End of training

69aaa48
verified

hZzy commited on Nov 26, 2024

Model save

71326cf
verified

hZzy commited on Nov 26, 2024