hZzy
/

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1K-5e6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1K-5e6

Commit History

End of training

69aaa48
verified

hZzy commited on Nov 26, 2024

Model save

71326cf
verified

hZzy commited on Nov 26, 2024

initial commit

224b4a0
verified

hZzy commited on Nov 26, 2024